人工智能拥有巨大的商业前景,但显然大多数组织并没有充分利用这一优势。以下是早期采用者如何从人工智能项目中挖掘商业价值的一些建议。
各个领域的商业领袖都看到了人工智能的价值,但使用好人工智能才能真正体现其价值所在。
在这里,我们总结了一些探路者们的经验教训,希望能给后来者一些有意义的参考。根据德勤最近的一项调查显示,82%的人工智能早期采用者从认知技术投资中看到了积极的财务成果,投资回报率的中位数为17%。
一个成功的人工智能项目和一个不成功的人工智能项目之间最大的区别是什么?德勤咨询公司的分析与认知部门主管Nitin Mittal表示,无论是技术驱动的还是商业需求驱动的,都有迹可循。
希望充分利用人工智能的组织要注意了:“关注可能适合人工智能的特定用例。专注于需要实现的业务目标,证明其价值,并扩大规模。这就是我们看到的很多案例能够成功的原因。”Mittal说。
下面是将人工智能项目转化为商业价值的8个技巧,这些技巧来自于那些从人工智能中获得实际利益的人的总结。
专注于具体问题
通用电气负责软件研究的副总裁Colin Parris说,在通用电气,商业价值是每个人工智能项目的核心。
“我们从一系列最小可行的产品开始,它真的能预测什么吗?如果我们能做到,它是更便宜、更快,还是能带来更多收入?最后,我们可以如何扩展它,如何部署它来获得商业价值?”他说。
这一系列的后续行动是至关重要的。
例如,如果人工智能系统正在预测需要维护的设备,那么这些预测需要集成到工作流中。这可能意味着需要派遣合适的现场工程师在合适的时间进行合适的维护。
它还可能需要集成到库存系统中。
或者可能需要与实际机器进行集成。“如果我的人工智能让我能够真正理解何时需要提高温度或压力,我就必须集成到控制系统中,”他说。
了解AI的局限性
当人类试图做出预测时,他们有时会成为被称为Dunning-Kruger效应的心理陷阱的牺牲品。当一个人意识不到自己对某个话题知之甚少,错误地认为自己是专家时,就会出现这种情况。其结果可能既幽默又悲惨。
人工智能系统也可能落入同样的陷阱。例如,一个接受过特定数据集训练的人工智能被要求根据完全不同的数据集进行预测,这会给出完全错误的答案——但是对于已经学会依赖人工智能预测的用户来说,这可能是令人信服的。
现实情况是,这需要一位数据科学家来了解分析模型何时适合于特定数据集。“我必须理解基于数据的假设,”IBM的Parris说。“我如何测试模型?”我可能需要生成其他类型的数据,或者模拟数据,来判断它是否有效。然后我必须在数据运行时检查数据以确保这些假设是有效的。这是你作为人工智能专家经过多年培训后才能够做到的事情。”
新员工或非数据科学家可能没有接受过这种培训,从而使组织容易受到误导性结论的影响。
为了解决这个问题,通用电气已经开始研究所谓的“humble AI”,它是一种人工智能系统,能够知道其算法适用于哪些情况,并且只在那些情况下使用机器学习模型。
“如果我不在这个范围内,我就不会使用这个模型。我想回去使用我们过去20年来使用的物理模型,”Parris说。 “这种人工智能知道它自己的能力范围。”
他说,“humble AI”现在正在接受测试。“使用价值数百万美元的机器时,你绝对不想做任何损害机器寿命或性能的事情。退后一步,回到常规的套路去吧。”
倾听利益相关者和客户的意见
对于一些公司来说,确保人工智能系统产生有用的结果可能需要一些外部帮助。
健康内华达项目的首席数据科学家Jim Metcalf说:“理想情况下,你可以在白板会议上开始一个项目,所有主要利益相关者都已经花了一下午的时间来了解细节并记录查询需求。”
例如,健康内华达团队正在研究一种治疗心脏病患者的方案。这就需要收集病人出院时开药的信息。但有些药物,如他汀类药物,通常是在病人第一次入院时开的,当病人离开时会继续开出。系统假设这些药物是患者已经在服用的药物,而不是与心脏病发作相关的新药。只有当药物数量最终低于预期时,才会发现这个问题。
“如果我们从一开始就和所有感兴趣的人进行更详细的讨论,团队可能会更早地解决这个问题,”Metcalf说。“我们的数据科学团队已经学会了不做任何假设。我们会在任何人将手指放在键盘上之前进行彻底审查,讨论和记录查询要求。”
对于企业支出管理平台提供商Coupa,一个客户提示并指出了一种检测欺诈的新方法。
公司负责产品战略和创新的副总裁Donna Wilczek说:“在我们的行业中,我们一直在一个信息孤岛中看待支出欺诈。例如,有很多应用程序只关注费用报告欺诈,以及采购中的欺诈。”
但是事实证明,在一个领域作弊的员工也有可能在其他领域作弊,她说。通过与采购专家和财务审计人员的交谈,发现欺诈检测的秘密其实是针对处于欺诈核心的个人。
“这就是AI的一种非常漂亮、实用的应用所在,”她说。“这些数据对于人类审计员来说太多了,无法识别出其中的特定模式。”
人工智能还可以加快欺诈检测的过程,让企业在付款前就能发现欺诈行为。她说:“通常情况下,顾客在消费过程中不能这样做,因为这会让生意的交易流程减速。”
Coupa现在正在收集企业报告的欺诈行为的例子,然后将这些真实的例子添加到人工智能系统中。
拥抱领域的专业知识
越来越多的公司开始意识到人工智能本身并不是灵丹妙药。
“很多时候,企业会说,我有大量的数据,这个巨大的数据湖,只要插入你的人工智能,就能告诉我一些有趣的事情,”全球信息技术咨询公司人工智能和大数据技术总监JJ Lopez Murphy说道。“是的,人工智能会帮助你发现隐藏的模式,但是如果你没有一个适当的问题,它就不会给你答案。这是不会自动发生的。”
Cognoa的首席人工智能官Halim Abbas说,仅仅依靠数据科学家和人工智能专家从数据中获取洞察力是一个巨大的错误,该公司正在将人工智能应用于行为诊断领域,帮助识别患有孤独症和其他行为健康问题的儿童。
在现实世界中,数据可能相互依赖,或者一些数据也可能不相关,需要专家来了解其中的差异。例如,如果一组在有蓝色墙壁的房间里诊断的病人和另一组在有白色墙壁的房间里诊断的病人产生了不同的结果,一个寻找模式的分析模型可能会推断出墙漆具有临床意义。
“随着数据集大小的增长,你会避免这些愚蠢的结论,”他说。“但可能还会有一些微妙的变化。”
他说,没有领域专业知识的人工智能专家不会意识到这些问题。当数据集很小的时候,比如数据集很少或者人口统计数据很少的时候,这一点尤其重要。
当然,领域专家也有他们自己的偏见,Abbas说。“他们可能对某些变量和某些条件之间的联系持有错误的看法。进行双重确定的一个好方法是在接受领域专家的输入的同时,在人工智能方面也这样做,并且只处理双重验证都通过的情况。”
内部的临床专业知识也有助于Cognoa确定这些模型是否有效,并帮助改进它们。
“每次你在现实世界中精心构建的试验中验证人工智能算法的时候,你都可能会发现现实与模拟的不匹配,”他说。“但通过分析,您可以深入了解产品,并进一步进行优化。”
正如一家有111年历史的收集和发布化学研究数据的公司CAS所发现的那样,将领域内的专业知识与人工智能相结合在数据管理中也是必不可少的。
CTO Venki Rao说:“像空格、下标、破折号或化学结构中一个字母的变化,都可能导致安全反应和爆炸反应的不同。所以我们需要有超过350名博士在我们的工厂中进行管理数据。”
最近,该公司开始使用人工智能来帮助对数据进行分类和整理,从而腾出一些博士来从事更复杂的工作。但即使是建立一个简单的光学字符识别系统,也需要领域专家的专业知识。例如,“nm”是nanomolar的缩写,而“mm”是millimolar的缩写——相差6个数量级。如果系统转换不当,这可能意味着安全化学反应和危险化学反应之间的区别。
他说:“如果你是一个纯粹的技术专家,你不可能在第一天就能够为我们进行工作。如果你在不了解化学原理的情况下,用技术粗暴地强迫AI系统,它永远不会得到最佳的结果。”
Rao说,这确实使招聘变得更具挑战性,有时也使得外包变得不可能。“但是投资已经显示其在解决方案质量上的回报。”
认识到对真实世界进行测试的价值
没有一个作战计划能在与敌人的接触中幸存——也没有一个人工智能系统能在与现实世界的接触中幸存。如果你的公司没有准备好面对这个事实,你的人工智能项目甚至在开始之前就注定要失败。
瑞士信贷集团的认知和数字服务主管Jennifer Hewit正面应对了这一挑战。
当公司决定发布其新的客户支持聊天机器人Amelia时,Hewit知道聊天机器人很可能经常会被放弃并将客户发送给人工代理,而不是能够自己回答所有的或大部分的问题。
她说:“我很早就决定要上线了。”她注意到,当这个聊天机器人第一次上线时,它理解用户意图的能力只有23%。
但是通过置身于现实世界中,聊天机器人能够观察到多文化、多语言和多代人的对话——并从中学习。
“快速上线,向组织展示我们的能力,这意味着我们能够在5个月内将她理解意图的能力从23%提高到86%。”
小心人工智能的“黑箱问题”
可信度是人工智能在进入现实世界时面临的另一个问题,因为人工智能系统几乎无法看到它们是如何得出自己的见解的,这个问题被称为“黑箱问题”。
总部位于波士顿的Beacon Health Options公司的执行副总裁兼首席增长官Christina Mainelli说:“我们的经历让我们永远无法克服这个问题。”Beacon Health Options公司正为全美4000多万人提供行为健康治疗。
最终,该公司决定建立一个人工智能系统,在病人病情升级到需要住院治疗的程度之前,及早发现病人。为了确保该系统能够被实际使用,Beacon Health将使用该系统的人聚集在一起,不仅就工作流程,还就算法如何工作对他们进行培训。
因此,在系统投入使用之前,就对现有患者的旧数据进行了一次模拟运行。
她说:“那些被认为是高危人群的人实际上就是高危人群——因为他们被送进了医院。我们的临床医生可以看到它是如何工作的,这帮助我们减少了黑箱问题。”
然后,当人工智能系统被用于当前的病人时,在项目的前12周,它识别出了近300名高危人群,其中57%的人没有被之前的传统方法检测到。
“这非常引人注目。在此之前我们并不知道他们是高风险的,”Mainelli说。“现在团队正在努力影响他们。”
这包括打电话给他们,让他们联系供应商,确保他们得到他们需要的药物。
在一到两个月后,Beacon Health公司将看到这些干预措施的结果,因为在索赔通过之前还有一段时间,这将是另一个重要的现实世界测试。
“我们需要看到最后的数据才能真正知道结果如何,”她说。
建立清晰的衡量标准
拥有明确的业务指标来衡量人工智能项目的结果,对于证明它是有效的非常重要,并且应该得到持续的支持。
许多公司对AI项目的这方面没有给予足够的重视。根据德勤的调查,不到50%的受访企业衡量的是准确衡量财务回报所必需的关键绩效指标,如成本节约、收入和客户留存等指标。
报告作者、德勤技术、媒体和电信中心的执行董事Jeff Loucks表示,这是像人工智能这样的新兴技术的一个通病。
“他们通常不会像公司使用更成熟的技术一样进行严格管理,”他写道。
结果是人工智能项目可能“无处可去”,最终成为了无法扩展的试点项目或没有商业利益的项目,他说。
从内部训练人才
你可以在哪里找到既懂人工智能技术又懂业务需求的人?这可不是件容易的事。目前,全球人工智能人才短缺,再加上专业知识的要求,意味着潜在候选人的数量只能是更少。
根据德勤的人工智能调查,69%的公司表示,他们的员工中存在中等、重大或极端的技能缺口。
在通用电气,该公司也努力寻找着具备人工智能所需的编程和分析技能,以及商业方面所需的物理和工程知识的人。
通用电气的Parris说:“我们会在大学进行投资,在领英(LinkedIn)上搜索,在媒体上看文章,在会议上认识所需要的人。”
但该公司也在内部寻找具有材料科学背景的人,比如在人工智能课程中学习过的人,或者在控制系统和材料科学课程中学习过的人工智能开发者。
Parris说,找到兼具领域专业知识和人工智能技能的人只是旅程的开始。他说,通用电气需要能够将这些知识转化为能够实际应用的人才。“我如何看待业务问题并将其分解为数据问题?”
为了实现这一目标,通用电气提供跨职能培训,将人工智能和工程学结合起来。到目前为止,已经有10到15名科学家和工程师经历了这一过程——约占公司所有科学家和工程师的三分之一。
Parris补充道:“可能会有更多的人经历这一过程。”
这只是改变企业文化、组织系统、衡量标准甚至是激励机制的开始。
“对于像通用电气这样的公司来说,这是一项艰巨的任务,我们现在正处于起步阶段,”他说。“但是一旦我们做对了——我们所有人的未来都会改变。”