CIO需解决人工智能局限性

日期: 2018-04-23 作者:George Lawton翻译:邹铮 来源:TechTarget中国 英文

高性能计算以及深度神经网络新技术会带来更好的人工智能企业用例吗?在这方面,我们看到各种炒作。事实是,这些技术进步肯定会有所帮助,但CIO还需要解决人工智能的其他局限性以及认识在企业部署人工智能的潜在挑战。

在《麻省理工技术评论》(MIT Technology Review)的EmTech Digital会议上,专家们探讨了这些基本挑战以及解决这些挑战的早期研究。目前人工智能技术的局限性主要包括:需要大量昂贵的人力来训练、缺乏常识、泛化学习能力有限以及算法偏差。

自主性是AI的局限性之一

艾伦人工智能研究所首席执行官Oren Etzioni承认,工程师们在人工智能领域已经取得巨大进步,并且,人工智能在象棋、Jeopardy!和围棋比赛中还成功击败人类对手。但IT领导者必须记住,这些胜利都是基于明确的规则集和游戏板,例如在围棋中,实际上就是黑棋与白棋。这种胜利并不意味着人工智能超越了人类智能。

Etzioni称,人类与人工智能技能之间的差异主要在于自主性和智能化。青少年在周五晚上喝酒是自主行为,但并不是很智能。谷歌的AlphaGo很智能,但不是很自主。人类需要按下按钮才能开始和结束比赛,因为系统甚至无法意识到自己赢了。

在企业环境中,人类将需要管理这些自主流程。当人工智能被要求对意外情况做出反应时,尤其是如此。

高昂的人力成本

目前AI系统需要大量人力来创建类别、组织输入数据并标记这些数据。例如,在创建更好的算法来区分狗和猫时,我们需要为不同种类的猫和狗创建术语分类。另一个团队必须收集并组织图片库,展示不同种类的猫和狗。然后,其他人必须在机器学习过程开始之前标记这些图片。

Etzioni称:“即使在今天,99%的机器学习仍然是基于人类工作。”谷歌AlphaGo击败人类是数百名高技能专家多年努力的结果。从短期来看,CIO可通过部署工具来自动化执行某些人类流程,以帮助减少这种瓶颈。

从长远来看,人工智能需要开发新的方法来学习常识,这是自主的关键方面。例如,当一份医疗记录显示5岁小孩体重为500磅时,人类护士可能会思考如何对症下药。相比之下,人工智能可能会无意识地推荐基于这种重量的处方,而这可能导致致命的后果。

Etzioni正在致力于打造一种基本框架,融合机器学习、自然语言处理和众包来普及常识。这项研究仍处于初期阶段,还需要开展更多工作才能达到人类儿童的常识水平。

实现AI泛化学习需要新技术

纽约大学心理学与数据科学助理教授Brenden Lake表示,为了解决人工智能局限性,其中一种做法是开发新方法来泛化AI知识。目前部署人工智能的方法主要专注于解决特定优化问题,但当环境变化时,这些算法变得很脆弱且很容易被破坏。

例如,有的系统主要负责学习如何玩电脑游戏以获得最高分数,就无法应用相同的模型来获得最低分数。而构建更通用的框架需要找到一种方法,整合有关人类如何协作的认知科学与传统AI研究。

Lake称:“在很多情况下,人们可以用较少的数据构建更多知识。”人类擅长看到像Segway平衡车这样的组件模式,然后设想如何以新的方式将这些组件组合在一起。Lake一直在构图学习方面做一些初步研究,即教机器通过理解组件来了解基本模式。例如,这种方法着眼于让机器看到字符绘制方式来识别图形,而不是最终的图像。这可让这些机器以与人类相同的方式识别图形变化。

展望未来,泛化学习还需要直觉物理学、直觉心理学和内在动机方面的改进。直觉物理学即婴儿如何通过四处移动来理解世界的基本原理,直觉心理学则是识别另一个人的动机的能力,例如认识到玩球的小孩可能不小心跑到汽车前面。内在动机是为了好玩而学习的想法,而不是因为人类编程你来解决问题。

为算法创建数据表

CIO还需要考虑利用机器学习算法来做决策的管理问题。微软研究人员Timnit Gebru称,在用于决策的算法中可能会出现偏差,例如招聘、发放贷款甚至是刑事判决准则。虽然各种法律禁止在类似决策时使用种族、性别和其他因素,但即使没有明确考虑这些数据,也可能会有偏差。

例如,很多自然语言处理技术是基于基本规则集,其中可能会包括“医生是男人”以及“护士是女人”等规则。更复杂的系统可能还会关联种族或性别,这能间接地影响算法。

人工智能的另一个局限性与用于训练AI系统的数据集有关。例如,用于训练机器视觉系统来识别性别的数据集可能主要涉及浅肤色人群,则由此产生的算法会在区分深肤色人群的性别方面存在缺陷。

Gebru指出:“我担心的是,作为人工智能研究人员,我们通常会坐在角落里处理数据,并且每天都是这样度过。然而,我们不能忽视社会和结构问题。”

对于这个问题,可能有所帮助的方法是:开发技术表来描述数据集的特性及其算法。这种详细信息对于电气工程师来说很重要,可帮助他们理解在各种现实世界常见中所选组件的局限性。这些数据集的数据表还会描述可能导致偏差或不准确性的特定数据集或算法。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐