近日,在由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD中,阿里巴巴凭借82.440的精准率,超越了人类82.304的成绩。
据了解,SQuAD比赛构建了一个大规模机器阅读理解数据集,其中包含10万个问题,文章来源于500多篇维基百科文章。比赛旨在通过梳理出这套试题的线索,看机器学习模型是否能够经过大量信息处理后给出问题的确切答案。
阿里巴巴研究院自然语言处理首席科学家司罗在一份公告中说,对于像“天为什么会下雨”这样的客观问题,机器给出的答案准确率会很高。这种语音技术可以逐步应用于诸如客服、博物馆指南、在线解答患者医疗问题等广泛的实际应用领域,从而以一种前所未有的方式减少人力投入的需求。
这项技术的突破在于最新的“基于分层融合注意力机制“的深度神经网络算法。该模型能够模拟人类在阅读理解问题的一些行为,包括结合篇章内容主体,带着问题反复阅读文章、避免阅读中遗忘而进行相关标注等。
同时,此项技术已被阿里内部广泛使用。例如,每年双11都有大量的顾客对活动规则进行咨询。阿里会让机器直接对规则进行阅读,为用户提供规则解读服务,完成人机自然交互。
在此次比赛中,微软程序拿到了82.6分,其他的AI程序虽然没有超过人类标准,但是得分也比较高。例如,艾伦人工智能研究所、腾讯等企业开发的AI。