教AI玩《我的世界》,Facebook意图打造能自我学习的多任务AI系统

猎云网 中字

从玩游戏到人脸识别,机器智能在一系列任务上的表现都超过了人类。

但令人尴尬的事实是,AI系统仍然无法处理多项任务。AI研究人员的下一个大目标是开发一个能很好地完成很多任务的系统,而不是只擅长一项任务的超级人类。

Facebook Research的Arthur Szlam和同事们进入了这一领域,他们已经开始研究的AI助理能够和人类互动,然后根据请求执行各种任务。至关重要的是,这些助理可以从互动中学习,从而增加其执行任务的范围。

Szlam及其同事选择通过《我的世界》来实现这一目标。这是一款3D沙盒视频游戏,允许玩家在一个独特的、无限的在线世界中探索、构建、制作甚至战斗。

《我的世界》是有史以来最畅销的电子游戏,已售出超过1.7亿份。每月有超过9000万人在参与这个游戏。

但让它对AI研究有用的是,尽管《我的世界》提供了无限的多样性,但它的规则也很简单,在一定范围内是可预测的。AI研究人员已经开始使用它来训练和测试各种AI系统。

现在,Szlam和他的同事正在更进一步发展。他们表示:“我们感兴趣的不是在单个困难任务上的超人表现,而是在大量更简单任务上的能力,而这些任务是由人类指定的。”

《我的世界》是AI向人类学习的完美环境。他们说道:“由于我们是在游戏环境中工作的,玩家可能喜欢在开发过程中与助手进行互动,这为人类参与到的环形研究提供了丰富的资源。”

乍一看,《我的世界》中可能出现的行动数量是巨大的。Szlam和同事表示:“一个玩家在游戏中可能做的事情是非常多的;最天真的是,涉及所有区块的可行方法需要占据所有的内存。”

但《我的世界》中的绝大多数区块布置都是不太可能的。他们表示:“我们预计,助理玩家请求的布置将集中在游戏中实际可能的一小部分。”

这使得AI的任务变得简单得多。Facebook团队认为,即使他们的AI系统在很多任务上失败了,它仍然是有用的。他们表示:“我们相信,我们可以在成为一名有用的助理方面取得进展,而不必能够成功应对每一个可能的请求。”

但这仍然具有挑战性。困难之一是理解普通语言。Facebook团队设想了以下要求:

玩家:建造一座15个区块高的塔楼,然后在上面放上一个巨大的笑脸。

助理:好的。

这个相对简单的要求需要大量的知识。助理必须理解“塔”的概念和如何建造一座塔,知道“15个区块高”是测量塔的高度,知道“15”是什么。它还需要理解“笑脸”这个词,以及如何构建它,并知道将它放在“顶部”意味着什么。不难想象这些请求会变得多么复杂。

但AI学习的机会是巨大的。如果Facebook能够获得足够多的人类帮助,那么这个助理就可以要求人类帮助它学习。

而Facebook正在把设计AI的任务设定为自我完善。对AI系统最常见的批评之一是,它们除了接受过收集准备好的数据所提供的训练外,没有学到新的任务。但研究者认为,《我的世界》环境是发展这种学习的理想环境。

这是一项有趣的工作,为Facebook制定了一个雄心勃勃的目标。当然,现在还为时尚早。该团队将这项工作描述为“战斗的召唤”。

不过,该助理的早期版本已经可供普通用户开始试用,任何人都可以下载。

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存