语义识别是聊天机器人的下一步
如果是台湾的这款AI机器人说出“中国台湾省”不过是基于语音库作出的自然选择,只能证明是聊天机器人在语音识别的阶段的基本表现。那么,达到语义识别的聊天机器人又会有哪些表现呢?
在聊天机器人的背后,其实是一套复杂的系统,主要包括5个功能模块:语音识别模块、自然语言理解模块、对话管理模块、自然语言生成模块、语音合成模块。
首先,语音识别模块负责接收用户输入的语音并将其转换成文字形式。
然后,自然语言理解模块在理解了用户输入的语义之后将特定的语义表达式输入到对话管理模块中。
接着,对话管理模块负责协调各个模块的调用及维护当前对话状态,选择特定的回复方式并交由自然语言生成模块进行处理。
最后,自然语言生成模块生成回复文本输入给语音合成模块将文字转换成语音输出给用户。
通常来说,聊天机器人系统中的自然语言理解功能包括用户意图识别、用户情感识别、指代消解、省略恢复、回复确认及拒识判断等技术。
对话管理功能主要协调聊天机器人的各个部分,并维护对话的结构和状态。对话管理功能中涉及到的关键技术主要有对话行为识别、对话状态识别、对话策略学习及对话奖励等。
自然语言生成通常根据对话管理部分产生的非语言信息,自动生成面向用户的自然语言反馈。
目前来看,人类不过刚刚迈过了语音识别的门槛,甚至科大讯飞等公司中文的识别的准确率提升到97%以上,但是机器人作出的反馈则是基于语音库的自然连接,和被动输出已经形成的答案。聊天机器人在现阶段还做不到自己对聊天内容理解基础上的回答。曾经因接受采访而声名鹊起的索菲亚机器人,后来被证明不过是通过后台控制只能背诵标准答案的骗子。
点评:聊天机器人不神秘也不神话,它不过是语音识别在智能机器人身上的一个应用罢了。目前语音识别还难以突破语义理解的门槛,哪天人类在语义理解上突破了语义理解的瓶颈,让机器人能真正听懂人话,真正的AI机器人时代才会到来。