通过机器学习的大数据分析

由MBA Skool团队发vwin德赢安全吗布 ,于2017年2月1日发布

在过去的几年里,大数据分析在确保企业的增长方面取得了优先作用,了解客户和探索新机遇。随着世界的数据每两年加倍,而储存其率大致相同的费用每两年加倍;每个公司现在都转变为数据公司,能够分析大型复杂数据,并在合理的成本内提供更快更准确的见解。此外,机器学习一直是企业的关键方面。但是公司的最新机会是通过机器学习进行大数据分析。



图片:Pixabay.

例如,特斯拉已经收集了7.8亿英里的驾驶数据,每10小时就会增加100万英里。最终,这些数据将成为他们计划于20181年发布的自动驾驶汽车的基础。


为什么机器学习是大数据分析的首选?

机器学习是让计算机的科学在不明确编程的情况下采取行动。它是大数据分析的首选因为:

古典统计模型依赖于人类专家来制定和测试一组输入和输出变量之间的关系,这个过程基于许多潜在的假设,并且当数据量太大时,模型变得非常适合,因为配制的任务太大关系变得非常麻烦。

然而,在机器学习中,它翻转整个过程,从输出变量本身开始;随后发现驱动这一结果的因素。因此,机器学习不受人类尺度思维的限制,它能够发现隐藏在数据中的模式,而这些模式很难从经典模型中提取出来

除此之外,机器学习模型具有随时间自动调整和改进的能力,这是经典统计模型所不具备的。

数据科学利用各个部门的机器学习

1.农业部门

利用农业机器学习

1.精准农业:精准农业允许农民,一种方法来处理每个领域和领域的变化。使用各种传感器,可以提取关于土壤湿度、土壤密度、空气质量、大农场一段时间内的温度等信息,机器学习可以用于:

•确定不同季节的最适合作物,这将提供最大收益率

•确定要使用的肥料水平,种子待种植的种子,以获得最大收率。


2.准确的季风预测:多年来,印度开发的各种统计模型一直无法准确预测季风。对10年的预测数据进行分析后发现,IMD在6月至7月的“降雨范围”预测中有60%是错误的。因此,迫切需要利用机器学习技术建立更好的季风预测模型,能够处理大量的数据变量,如海面和陆地表面气温的历史数据、厄尔尼诺/厄尔尼娜的存在、云形成模式和预测结果,以更高的精度。


银行业

在银行业的利用机器学习

1.提高银行的盈利能力:通过机器学习,对客户的年龄、职业、工资、消费方式、储蓄方式、信用卡和借记卡使用方式等基本信息进行分析,可以得出:

•确定银行最有利可图的客户的公共池,并以特别关注获取这些客户的客户收购策略。

•根据客户过去的记录,预测客户拖欠贷款的可能性,并采取适当措施将违约风险降至最低,将减少银行的不良资产。

•识别单个用户的购买模式,并在偏离该模式时发出警报,从而在单个级别定制欺诈检测,这将减少虚假警报的实例,并提高现有欺诈检测模型的效率。


2.提高客户体验:通过机器学习的数据分析可用于提高客户体验:

•用人脸/语音识别取代传统的密码登录,让银行体验更高效。

•将最新的银行产品/金融产品与最有可能使用该产品的客户细分进行映射,不仅会提高银行的命中率,而且其客户将不再得到无关的产品/建议。


3.产品开发:通过机器学习的帮助分析来自呼叫中心的大量客户反馈数据和语音数据可以在识别新的金融产品/服务的基础上,根据客户的不断变化的方式发挥重要作用。


国防部门

利用机器学习防御

1.从社交媒体应用中提取智能信息:机器学习技术可用于从像Twitter,Facebook,Instagram等社交网络中提取相关的智能信息,这可以作为现有智能信息的补充,提供有关概率的实时信息在任何地方发生不必要的事件,为政府制定对敌方国家的战略提供有用的数据。

2.使用无人机:先进的机器学习算法可以帮助无人机/无人面的地面车辆在通过模式分析中通过模式分析和过滤通过附加到无人机的传感器来通过周围环境收集的相关信息来浏览未知区域。


医疗行业

利用机器学习医疗保健

1.患者的风险剖析和更好的疾病诊断:使用患者的基本信息以及他/家庭病史机器学习可用于:

•预测一个人未来最可能患哪种疾病,并建议在生活方式上做出必要的改变,以将这些风险降至最低。

•同时分析患者数据的组合,提出更好的诊断准确性,并在减少冗余测试的数量,药物可能的副作用和降低的护理成本降低的过程中提出更好的诊断准确性和建议的诊断量。


2.药物测试过程的探索:机器学习技术可以用于加快药物测试过程,通过绘制药物在所有可能的生物条件下对人体细胞的影响,以更低的成本和更好的效率。


机器学习的局限性

机器学习的一些局限性是:

1.不能保证机器学习算法在任何可能的情况下都能工作。它需要仔细理解手头的问题,以便应用正确的机器算法。

2.某些机器算法需要大量的培训数据,在某些情况下,使用或收集如此大量数据可能很麻烦。

3.深度学习算法(机器学习的分支)可以完全改变它们对输入数据的反应,即使是很小的变化,换句话说,深度神经网络可以很容易地愚弄自己,错误地把狮子标记为公共汽车。


本文已由XIMB Ankit Thakur撰写撰写


参考

1.qz.com/694520/tesla - - 7.8亿英里的驾驶-数据-和-添加另一个百万——每- 10小时

2. beaonstac.com/2016/03/iot-ecosystemut-iot-business-opportunities-and-forecasts-for-theut-market/

3.印度教

4. IDC,麦肯锡全球研究所分析

5.pewinternet.org/2013/08/07/51-of-u-s-adults-bank-online

6. http://www.businessinsider.com/iot-ecosystem-internet-of-things-forecasts-and-business-opportunities-2016-2?Ir=t.

7.http://www.livescience.com/47071-drone-industry-spending-report.html

本节的文www.vwin.cn章是由我们的作者。它们已经被MBA Skool团队审核和上传。vwin德赢安全吗MBA课程的内容仅为教育和学术vwin德赢安全吗目的而创建。

如果您有兴趣为我们写作文章,www.vwin.cn提交这里


在以下内容分享本页:
Facebook分享 推特 分享在Linkedin