对于AI技术,不要陷入数据量误区

日期: 2018-11-05 作者:Nicole Laskowski翻译:邹铮 来源:TechTarget中国 英文

机器学习算法通常被认为是需要海量数据的技术,但Gartner公司的Erick Brethenoux最近指出,对于某些AI用例,在开始时,CIO应该考虑数据质量,而不是数量。

在最近宣传其新研究的网络研讨会中,Brethenoux断言称:“企业规模,甚至数据量,并不是你是否应该使用这些AI技术的考虑因素。”

这是他为刚涉足AI领域的企业提供的实用但略显不正统的建议。下面让我们看看Brethenoux强调在某些用例中质量比数量重要的原因,以及为什么他认为从业务问题开始很重要的原因。此外,他还分享了5个问题来检验企业是否已经为AI做好准备。

干净数据好过更多数据

在网络研讨会旗舰,Brethenoux最令人惊讶的说法是:在决定是否使用AI技术时,数据数量不是好的经验法则。他举了一家小型地区银行客户为例,该客户不仅使用AI来个性化贷款,还开始向小额贷款客户提供新服务。

他表示:“他们拥有的数据量并不大,然而,数据质量必须是无可挑剔的。”

在随后的电话采访中,Brethenoux重申了这一点。“你拥有的数据越多,通常就越能让你找到有趣的相关性,但并不一定要有大量的数据才能找到有趣的东西。”如果需要的话,企业AI团队可以通过提供商的外部数据抵消内部数据匮乏问题。

另一方面,低质量数据可能会触发疯狂的徒劳无功的计算。当加拿大一家保险公司想要根据投保人的上班距离来衡量其风险时,该分析产生了垃圾结果。根据Brethenoux的说法,事实证明,由于距离数据同时以英里和公里为标记,导致结果出现偏差。

虽然质量很重要,但他表示,CIO不应该感到必须清理每块数据而延迟使用AI技术。

他指出:“你最终要做的就是不断清理数据,而且从机器学习或预测分析的角度来看,大量数据可能对你尝试做的事情没有帮助。这就是我坚持企业先从一个用例开始的原因。”

专注业务问题

为了引入AI技术,CIO应该从业务问题入手,并努力寻求解决方案。这里的重点是业务问题。Brethnoux称:“前面说的一个用例,最好应该是业务用例。”

他建议CIO与业务部门沟通以确定痛点问题,然后将问题“范围缩小”到可在几周内完成的事情。通过这种方式,CIO可弄清楚他们不知道什么以及他们需要关注什么。

这一建议部分来自于他的观察, “以资产为中心的公司”( 制造业或能源公司)在AI技术方面取得的成功超过“以服务为中心的公司”(营销公司)。

他指出:“大多数以资产为中心的企业拥有以工程为中心的文化,他们会从一个用例开始,并寻找解决问题所需的数据和技术。”在以服务为中心的公司,这个过程经常是相反:数据专业人员在数据中找到趋势或相关性,然后寻找问题。

Brethenoux在电话采访中详细阐述了这一点,并补充说,以服务为中心的公司有时会缺乏关注,这在将AI技术引入企业时可能会成为问题。

他表示:“当你开始处理更多数据和问题时,这就变成狭隘的锤子找钉子。这里,解决问题的方法不那么严谨。”

5个问题

当客户告诉Brethenoux他们想要使用AI来解决问题时,他列出五个问题以确定AI是否是适当他们的解决方案以及客户是否准备好拥抱AI。问题如下:

  1. 什么是业务用例?Brethenoux表示,这个过程应该包括制定预期和期望的结果,以及确定如果引入AI技术如何衡量业务价值。
  2. 是否拥有技能?首席信息官可能不需要雇佣大批数据科学家。Brethenoux建议他们先评估内部技能,并考虑培养合格的数据工程师或主题专家—需要精通Excel。他还建议举办黑客马拉松来帮助发现人才。“或者你也可以借用技能:聘请顾问,简而言之,来帮助你以及指导工作。”
  3. 是否拥有数据?企业可能不需要他们想象的那么多数据,但他们需要数据,这些数据应该是合理的规模。 Brethenoux看到有家大型保险公司想要通过事故现场照片来预测索赔的类型和费用,他们有一堆夹着照片当马尼拉文件夹。该公司花了两个月时间来数字化、归类和标记图像。“当你试图解决问题时,你需要确保你有适当的数据”
  4. 需要哪些技术?业务问题将会推动技术决策。Brethenoux列举了几种成熟的AI技术,从概率推理(如机器学习,被确定为最成熟的技术)到基于代理的编程(被认为是最不成熟的技术)。
  5. 如何组织?当企业拥有几个概念证明后,应该考虑这个团队应该放在什么位置、该团队应该向谁报告以及如何支持该团队以提高其技能和技术。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Nicole Laskowski
Nicole Laskowski

Nicole Laskowski is a senior news writer for SearchCIO.com and SearchCIO-Midmarket.com. She covers CIO strategies for analytics, business intelligence and data management. Prior to joining TechTarget, she worked as the news editor for a community newspaper in Arlington, Mass., overseeing the news content of both the weekly print publication and the newspaper’s website. Nicole also has worked for two other community newspapers in Oregon and Michigan and brings 10 years of writing and editing expe

翻译

邹铮
邹铮