大发彩神8官方下载为什么85%的大数据项目总是失败?

  • 时间:
  • 浏览:7
  • 来源:大发快3官网-大发快3官网app

企业在推行大数据项目时往往把项目规模和范围做得很大,以后 事实却是,什么都有 大数据项目通常后该失败。2016年,G大发彩神8官方下载artner估算约400%的大数据项目后该失败。一年后,Gartner分析师Nick Heudecker表示,某些数据“过于保守”,大数据项目失败率应接近85%。直至现在他也是大发彩神8官方下载原本 认为的。

固然只有Gartner原本 认为。前微软高管Bob Muglia告诉分析网站Datanami,“我找只有删剪满意的Hadoop客户。实际上,成功应用Hadoop的客户数量原困少于20个,甚至原困少于10个。考虑到其处在时间以及行业投入,某些结果很令人震惊。

熟悉大数据的人都知道,某些难题是真实且严重的,而不完也有技术难题。事实上,相对于本质原困,技术是失败的偏离 原困。以下是大数据项目失败的一好几个 主要原困,以及可以成功的这俩 最好的土辦法 。

大数据难题1:整合不佳

Heudecker表示,大数据失败头上处在着原本重要的技术难题,那什么都有 整合多个来源的孤立数据,以实现企业所需的数据处理大发彩神8官方下载能力。建立与孤立传统系统的连接固然容易。跟跟我说,整合成本是软件成本的五到十倍。其中***的难题是简单集成:怎样才能将多个数据源链接在同时?什么都有 人选择数据湖路线,认为某些最好的土辦法 很简单,但事实固然不在 。

孤立数据是难题的一偏离 。客户告诉他,当大伙儿将数据从系统提取到像数据湖原本 的公共环境中后,却无法弄清楚什么值的含义。“当你将数据输入数据湖时,为甚知道数字3原困什么?”Heudecker问道。

普华永道(PwC)高级研究员Alan Morrison表示:“原困是在孤岛中工作,原困创建的数据湖什么都有 数据沼泽,什么都有 大伙儿能完成的工作什么都有 冰山一角。”“大伙儿不理解数据中的关系,什么关系才能 挖掘或推断,以便机器才能充分解释什么数据。另外,大伙儿才能 创建原本知识图层,以便机器才能解释下面映射的所有实例数据。以后 ,数据湖只有是原本数据沼泽,”

大数据难题2:不明确的目标

大多数人以为企业在进行大数据项目后该有明确的目标,但实际并也有原本 的。什么都有 公司通常是先启动项目,以后 才去想目标。

数据集成软件公司Talend的产品营销经理Ray Christopher表示,“你才能 认真审视某些难题。大伙儿认为大伙儿可以将形态化和非形态化数据连接起来,从而获得所需的信息。然而这才能 提前选择目标,你你可以什么样的信息?”

企业应用咨询公司的***分析师Joshua Greenbaum表示,困扰大数据和数据仓库项目的偏离 原困是指导标准通常是絮状数据的积累,而也有处理业务难题。

Greenbaum说,“原困将絮状数据汇总在同时,就会得到数据转储,可以称之为卫生垃圾填埋场。这也有寻找处理方案的好最好的土辦法 。我一般建议客户先决定才能 优先处理什么业务难题,以后 查看可用数据的质量,并在发现业务难题后处理数据难题。”

为甚大多大数据项目都失败了?对于初学者来说,大数据项目***都处在问题远见。Morrison原本 认为。大多数企业只考虑数值数据或黑盒子NLP和识别引擎,并进行简单的文本挖掘和某些类型的模式识别。

大数据难题3:技能差距

什么都有 以后 ,公司认为大伙儿为数据仓库建立的外部技能将转化为大数据,而事实固然不在 。 对于初学者来说,数据仓库和大数据以删剪相反的最好的土辦法 处理数据:数据仓库在写入时执行模式,这原困数据在进入数据仓库以后 就会被处理和组织。

在大数据中,积累数据并应用读取模式,数据在读取时进行处理。以后 ,原困数据处理从这俩 最好的土辦法 转向另这俩 最好的土辦法 ,技能和工具应该也是不在 。

“技能永远是原本挑战。原困大伙儿400年后谈论大数据,仍然会面临挑战。“什么都有 人都依赖Hadoop。但Spark更好某些,原困栈更小也更容易训练。”

大数据难题4:技术代沟

大数据项目老是从旧的数据竖井中提取数据,并试图将它们与新的数据源(如传感器、网络流量或社交媒体)合并。这固然完也有企业的错,企业在大数据分析老是出现以后 就埋点了什么数据,但无论怎样才能,这也是原本难题。

Greenbaum认为,企业缺少的***技能是怎样才能融合这原本数据源,让大伙儿同时处理复杂性难题。数据孤岛原困成为大数据项目的障碍,原困它不在 任何标准。以后 ,当企业日后开始了规划时,发现什么系统尚未以任何最好的土辦法 实施,什么都有 什么数据将被重复使用。

Talend的Christopher认为,对于不同的架构才能 以不同的最好的土辦法 进行处理。技术技能和架构差异是无法将当前工具用于本地数据仓库并将其与大数据项目集成的主要原困。原困什么技术处理新数据的成本太高。什么都有 才能 Hadoop和Spark等新的语言。

处理方案1:提前规划

虽然是陈词滥调,但适用于大数据项目。成功的公司必然是有结果的公司,选择某些小而可实现的新东西进行规划和实现。

Morrison说:“大伙儿才能 首先考虑数据,并以机器可读的最好的土辦法 为企业建模,以便数据服务于该企业。”

处理方案2:同时努力

股东往往被排除在大数据项目之外 。Heudecker说,原困所有股东合作协议协议,大伙儿可以克服某些障碍。加进技术人员同时努力,并与业务部门合作协议协议以提供可行的结果,这原困有所帮助。

Heudecker指出,在大数据方面取得成功的公司絮状投资于必需的技能。他认为这是数据驱动型公司普遍认可的,如金融服务公司、优步、Lyft和Netflix。公司的财富基于拥有可靠、可操作的数据。

Christopher认为,应该让大数据项目成为一项团队运动,所有人 都帮助策划和埋点数据并处理它,提高数据的删剪性。

处理方案3:缩小焦点

大伙儿似乎有这俩 心态,即大数据项目才能 非常大的动作。但就像你***次学习任何东西一样,成功的***最好的土辦法 是从小到小,以后 逐渐扩大。

“大伙儿应该仔细定义大伙儿在做什么,”Heudecker说,“应该选择原本难题域并研究处理它,这类欺诈检测、细分客户,原困弄清楚千禧一代市场中推出的新产品。”

Christopher说:“说到底,你才能 问问另一方你可以什么,原困你可以数字化的业务流程。不什么都有 把技术扔到商业难题上,你才能 预先定义它。数据湖是必要的,但原困数据湖不让被任何商业人士使用,你就不让你可以埋点数据。”

在什么都有 情况表下,这也原困固然让另一方的公司过度膨胀。 Morrison表示,在他研究过的每一家公司中,只有几百个关键概念和关系是整个企业赖以运作的。一旦你理解了某些点,你就会意识到,所有什么数以百万计的差别什么都有 那几百件重要事情的微小变化。事实上,你可以发现某些细微的变化根本也有变化。它们虽然本质上是一样的东西,虽然有不同的名字、不同的形态、不同的标签。

处理方案4:离开传统

虽然您原困希望使用埋点并存储在数据仓库中的什么TB级数据,但事实上您原困更好地服务于为大数据设计的存储系统中新埋点的数据,以后 设计为未经过处理的数据。

要处理原困企业拥有一项基础设施的许可证而只对现有的基础设施感兴趣。通常,新的复杂性难题原困才能 新的复杂性处理方案。使用企业以往的就工具并也有正确做法,甚至有原困原困大数据项目失败。

Morrison认为,企业应该停止故步自封。他还表示,企业只有再一味依赖供应商为大伙儿处理复杂性的系统难题。“几十年来,大伙儿似乎都认为任何大数据难题也有系统性难题。但当面对复杂性的系统变化时,企业才能 建立另一方的处理方案。

【编辑推荐】

【责任编辑:

张燕妮

TEL:(010)684764006】



点赞 0