新闻资讯

大数据失利实例提示:8个不能犯的毛病

公布日期:2016-12-15 10:36:25      作者:华腾信息
(作者:佚名  滥觞:网络大数据)

近年来,大数据旋风以“迅雷不及掩耳之势”囊括全球,不仅是信息范畴,经济、政治、社会等诸多范畴都“磨刀霍霍”向大数据,筹办在此中逐得一席之地。但是,许多公司在迈入大数据范畴后遭受“滑铁卢”。在此,本文盘货了一系列大数据失利项目,穷究其缘故原由,具有警示意义。

对数据过于信赖

2008年,Google第一次开端猜测流感就取得了很好的结果,比美国疾病防备控制中心提早两星期猜测到了流感的发作。可是,几年以后,Google的猜测比实际情况(由防控中心按照全美救治数据推算得出)高出了50%。媒体过于衬着了Google的胜利,出于猎奇目标而搜索相干关键词的人愈来愈多,从而招致了数据的扭曲。

低估大数据庞大水平

在美国有几个互联网金融公司专做中小企业贷款。可是中小企业贷款触及的数据更庞大,并且中小企业涉及到全部行业十分特别的一些数据,好比非标准的财务报表和差别行业、差别范式的条约,他们没有很专业的常识,是很难了解大概很难有工夫把它精确发掘出来。

其时大数据团队想用一个很完善的模子把所有的成绩都处理掉,好比把市场和信贷的解决方案局部用一个模子来处理,但由于数据的庞大水平,最初证实这种方法是失利的,并且90%的工夫都在做数据清算。这就阐明,想经由过程大数据手艺一会儿处理所有的问题是很难胜利的,而是要用抽丝剥茧、按部就班的方法。

管理层的惰性

某家旅游公司体系经由过程web日记数据的发掘来提拔客户洞察。成果证实,用户在阅读网站以后,随后的消费行为模式与管理层所以为的不一致。当团队报告请示此事时,管理层以为何足道哉。可是,该团队并没有抛却,并经由过程紧密的A/B测试,回手了管理层的不放在眼里。

这个实例的终极成果,不是每一个CIO都能期盼的。可是,有一点是能够肯定的:做好和管理层打交道的筹办,让他们充实了解大数据是什么以及响应的代价。

使用场景挑选毛病

一家保险公司想理解一样平常风俗和购置生命保险志愿之间的关联性。因为随后以为风俗太过于广泛,该公司将查询拜访范围限制到能否抽烟上。可是,事情仍旧没有本质停顿。不到半年,他们就停止了全部项目,由于不断未能发明任何有价值的信息。

这个项目的失利是因为成绩的复杂性。在吸烟与否之间,该公司没有注意到还有大片灰色地带:许多人是先吸烟然后又戒烟了。在将成绩简单化念头的驱动下,这个部门被忽略了。

成绩梳理不敷片面

一家全球性公司的大数据团队发明了许多深入的洞察,而且方案经由过程云让全公司同享。成果这个团队低估了服从方面的消耗,因为网络堵塞的成绩,无法满意全球各个分支顺畅提交数据运转阐发的需求。
该公司该当认真考虑下如何支持大数据项目,梳理所需的妙技并和谐各IT分支的力气停止撑持。因为网络、安全或基础设施的成绩,曾经有太多的大数据项目栽了跟头。

缺少大数据阐发妙技

一家零售公司的首席执行官不认同亚马逊规模化、扁平化的服务模式,因而让CIO构建一个客户推荐引擎。项目最后的计划是半年为期,可是团队很快认识到诸如协同过滤(collaborative filtering)之类的观点无法实现。为此,一个团队成员提出做一个“假的推荐引擎”,把床单作为唯一的推荐产物。这个假引擎的事情逻辑是:买搅拌机的人会买床单,买野营册本的人会买床单,买书的人会买床单。就是云云,床单是唯一的、默许的推荐品。

虽然好笑,这个主张实在其实不坏,默许的推荐也能给企业带来贩卖上的提拔。可是,因为大数据相干妙技的缺失,真正意义上的引擎未能实现。

提出了毛病的成绩

一家全球抢先的汽车制造商决议展开一个感情阐发项目,为期6个月,耗资1万万美圆。项目完毕以后,该厂商将成果分享给经销商并试图改动贩卖模式。然后,所得出的成果终极被证实是毛病的。项目团队没有花充足的工夫去理解经销商所面对的成绩或业务倡议,从而招致相干的阐发毫无代价。

使用了毛病的模子。某银行为判定电信行业的客户流失状况,从电信业延聘了一名专家,后者也很快构建了评价用户能否行将流失的模子。其时已进入评测考证的最初阶段,模子很快就将上线,而银行也开端筹办给那些被以为行将流失的客户收回函件加以挽留。

可是,为了保险起见,一名内部专家被要求对模子停止评价。这位银行业专家很快发明了使人诧异的工作:不错,那些客户确实行将流失,但其实不是由于对银行的服务不满意。他们之所以转移财富(偶然是悄无声息的),是由于豪情成绩——正在为仳离做筹办。

可见,理解模子的适用性、数据笼统的级别以及模子中隐含的纤细不同,这些都是十分具有挑战性的。

管理层阻力

虽然数据傍边包罗大量主要信息,但Fortune Knowledge公司发现有62%的企业领导者仍旧倾向于信赖本人的直觉,更有61%的受访者以为领导者的实践洞察力在决议计划历程中具有高于数据阐发结论的优先参考代价。
挑选毛病的使用方法

企业常常会犯下两种毛病,要末构建起一套过火激进、本人底子无法操作把持的大数据项目,要末测验考试操纵传统数据手艺处置大数据成绩。无论是哪种状况,都很有可能招致项目堕入窘境。

提出毛病的成绩

数据科学十分庞大,此中包罗专业知识门类(需求深化理解银行、零售大概其它行业的实践业务情况);数学与统计学经历以及编程妙技等等。许多企业所招聘的数据科学家只理解数学与编程方面的常识,却完善最重要的妙技组成部分——对相干行业的理解,因而最好能从企业内部动身寻觅数据科学家。

缺少须要的妙技组合

这项来由与“提出毛病的成绩”严密相干。许多大数据项目之所以堕入窘境以至终极失利,恰是由于不具有须要的相干妙技。凡是卖力此类项目的都是IT技术人员——而他们常常无法向数据提出足以指点决议计划的准确成绩。

与企业战略存在抵触

要让大数据项目获得成功,各人必需挣脱将其作为单一“项目”的思绪、真正把它当做企业利用数据的焦点方法。成绩在于,其它部分的代价大概战略目标有可能在优先级方面高于大数据,这类抵触常常会令我们有力无处使。

大数据孤岛

大数据供应商总爱议论“数据湖”大概“数据中枢”,但事实上许多企业建立起来的只能算是“数据水坑儿”,各个水坑儿之间存在着较着的鸿沟——比方市场营销数据水坑儿与制造数据水坑儿等等。需求夸大的是,只要只管和缓差别部分之间的隔膜并将各方的数据流汇总起来,大数据才气真正阐扬本身代价。

在大数据手艺之外遇到了其它不测情况。数据阐发仅仅是大数据项目傍边的组成部分之一,会见并处置数据的才能一样主要。除此之外,经常被疏忽的身分还有网络传输才能限定与人员培训等等。

躲避成绩

有时候我们能够必定大概疑心数据会迫使本身做出一些本来期望只管制止的运营办法,比方制药行业之所以云云排挤感情阐发机制、是由于他们不期望将不良副作用陈述给美国食品药品管理局并负担随之而来的法律责任。

在这份来由清单中,各人能够曾经发明了一个配合的主题:不管我们如何高度存眷数据自己,城市有人为因素参与出去。即便我们勤奋期望获得对数据的片面控制权,大数据处理流程终极仍是由人来打理的,此中包罗浩瀚初始决议计划——比方挑选哪些数据停止搜集与阐发、向阐发结论提出哪些成绩等等。

为避免大数据项目遭受失利,引入迭代机制长短常须要的。利用灵敏而开放的数据基础设施,包管其许可企业员工不竭调解实践计划、直到他们的勤奋得到幻想的回馈,终极以迭代为兵器顺遂迈向大数据有用利用的成功此岸。

www66136com

联系地址:国外福建省泉州市丰泽区东海大街雅园3号楼24层  |  联系电话:0595-22501050  |     |    |