成本和数据质量依然困扰CIO的BI战略

日期: 2012-02-26 作者:Linda Tucci翻译:木易 来源:TechTarget中国 英文

有些痛苦从来都与我们如影随行,比如数据的质量和成本问题。当SearchCIO.com就当前在大数据和云计算的时代背景下BI(商业智能)面临的新挑战访问两位专家时,发现这两个问题依然是业界关注的焦点。   “无论数据的规模大小和新旧程度如何,BI面临的最大挑战可能还是数据本身的质量。”Gartner的著名分析师Bill Hostmann表示。

  BI专家Boris Evelson是Forrester Research Inc.的高级分析师,他基于其在该领域数十年的经验来阐述观点:“现在的数据质量和30年前一样糟糕。而提升数据质量主要是个经济问题,相应的成本还是太高了。”   如今的CIO们可能……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

有些痛苦从来都与我们如影随行,比如数据的质量和成本问题。当SearchCIO.com就当前在大数据云计算的时代背景下BI(商业智能)面临的新挑战访问两位专家时,发现这两个问题依然是业界关注的焦点。

  “无论数据的规模大小和新旧程度如何,BI面临的最大挑战可能还是数据本身的质量。”Gartner的著名分析师Bill Hostmann表示。

  BI专家Boris Evelson是Forrester Research Inc.的高级分析师,他基于其在该领域数十年的经验来阐述观点:“现在的数据质量和30年前一样糟糕。而提升数据质量主要是个经济问题,相应的成本还是太高了。”

  如今的CIO们可能对数据质量的理解更为深刻,而且手头也有更多的工具来提升数据质量。有人认为基于云的BI产品有助于成本的降低,但是我们的专家却对云计算和数据质量之间的相关性提出了质疑。数据质量方面的问题核心在于数据总是处在变化之中:新系统的上线以及新数据源的涌现。而数据的规模也在急剧膨胀,比如事务日志、来自于传感器的数据、点击流量以及Hostmann特别指出的“社交媒体导致的信息爆炸”。

  与此同时,除了数据之外其他事情也在发生变化。BI已经从由IT部门单独掌控变为整个企业全员参与。而且,数字质量本身的定义也不是一成不变的。因此,对于CIO来说,真正要面对的问题应该是:就当前的工作来说,什么样质量的数据是合格的?

  “对信息提供者谈数据质量并没有太大意义。”Hostmann说:“真正重要的是信息的使用者在基于数据进行分析或决策时的满意度,他们的期望才是问题的核心所在。”
 
  数据的质量取决于提问人的身份、问题的急迫性以及愿意为之付出的成本。人们越来越意识到建议单一的评判体系是不现实的。Evelson表示:“质量是相对的,和具体语境有关。”

  数据质量满意度的季度调查

  既然数据质量是相对的,并且让用户可接受是BI的一个重要方面,那么对此CIO们该如何应对呢?

  Hostmann对其客户的建议是,通过对企业内关心数据质量的决策人进行例行调查,以此建立数据质量的评判体系。Gartner使用一套简单的工具来评估用户对BI数据的满意度,以及客户基于数据进行商业决策的能力。调查结果应该每个季度进行一次更新,因为数据质量的定义也在变化中。

  找到合适的主导人

  在企业不同业务单元之间,这类调查的结果会大相径庭,从而导致关注的热点游离不定。这样就带来了一个问题:哪方面数据的质量对于企业战略目标有着最大的影响?Hostmann认为这个问题主要取决于经济方面的考虑,但是确定各个问题的优先级却不是技术人员的责任:“应该由业务负责人来下结论,但是这其中存在极大挑战。”

  “IT对数据并没有控制权。”Evelson认为。和其他的企业应用不同,BI从本意上来说就需要由业务端来主导。IT团队有能力为企业构建系统来定义如IBM一样的庞然大物,但是值得与否需要由其他人来决定。“这肯定不是IT的职责。”Evelson认为:“因为这是整体战略级别的决策。”

  不同用户需要不同的工具

  基本上,CIO们在调查数据质量满意度时会发现用户大致可以分为高级和低级两类,其中后者可能对自己的无知都一无所知。数据发掘工具(Data discovery tools)对低级用户来说非常适用,可供挖掘隐藏的数据之间的关系,而且也比较便宜。“无需多维数据库(multidimensional databases)你也可以对外提供海量数据,用户自己通过工具能进行分析。”Hostmann说。

  高级用户一般来自于财务部门或者那些受到严格监管的行业。他们清楚地知道自己想要什么,而且可以发现数据质量的问题。但是,是否修正问题就得看情况了。比如,要修正对于“客户”一词的定义就需要对系统大动干戈 – 从而又一次导致成本的问题。“虽然看到了问题,但是他们到底愿意花多少钱来解决问题呢?”Hostmann质疑到。

  Evelson认为,即使成本问题得到解决,也不能期望质量问题就不复存在了。CIO们几乎肯定会遇到这种问题:首席财务官、首席营销官和销售副总裁对于客户利润率的定义各执一词。“这会导致IT无所适从。”Evelson表示。最后,再重申这一点:有些痛苦永远不会散去。

作者

Linda Tucci
Linda Tucci

Executive Editor Linda Tucci oversees news and e-zine projects for SearchCIO.com and SearchCIO-Midmarket.com. She has covered CIO strategy since joining TechTarget in 2005, focusing most recently on big data, mobile computing and social media. She also writes frequently about the CIO role and CIO careers for SearchCIO.com's weekly CIO Matters column. Prior to joining TechTarget she was a business columnist for the St. Louis Post-Dispatch. Her freelance work has appeared in The Boston Globe and T

相关推荐