新年伊始,一条由北京普思投资董事长、万达集团董事王思聪在生日当天发布的微博,将一场10万元的撒币活动拉到大众面前。与此同时,“冲顶大会”、“百万英雄”、“芝士超人”等各类直播答题APP一夜之间红遍大江南北,当之无愧成为了2018开年的第一个爆点。
语音识别神术能否助力答题冲顶 帮你瓜分百万现金?
直播答题玩法很简单,基本版规则是每天在指定时间面向全民开启一轮答题直播,每一轮共12道题,每道答题时间限制为10秒内,全部答对的用户瓜分奖金。不过,视频答题的题目里囊括了天文地理、人文历史、体育科技、明星八卦等诸多领域,如何才能快速地答对问题获得现金大奖呢?有人给出了答案,语音识别问题并搜索答案,简单地说是用一部手机答题,用另一部手机语音搜索答案。
对于智能语音搜索公司而言,此次直播答题提供了推广契机,有利于提升用户认知和市场教育,让消费者更多地习惯语音交互。基于此,智能语音搜索公司纷纷推出了“冲顶神器”。百度简单搜索率先推出新版本,的介绍中专门指出为冲顶大会针对语音搜索、图像搜索做了优化,并给出了 “两秒搜索,三秒答题,越短越快,越长越准”的搜索诀窍;随后,搜狗推出“搜狗汪仔答题助手 ”。1月10日,搜狗CEO王小川在朋友圈表示搜狗的技术可以通过机器理解语义及搜索并给出唯一答案。
那么,“冲顶神器”的准确率如何?能否正确识别并回答问题?这主要看语音识别、自然语言处理这两项基础技能。这两项技术技术中,语音识别更为成熟。目前,在语音识别方面,科大讯飞、百度、苹果、谷歌等主流平台识别准确率均在96%以上,稳定的识别能力为智能语音技术的落地提供了可能。国家政策方面,也在大力推动智能语音技术发展。科技部印发的《促进新一代人工智能产业发展三年行动计划(2018—2020年)》,明确提出:“到2020年,实现多场景下中文语音识别平均准确率达到96%,5米远场识别率超过92%,用户对话意图识别准确率超过90%。”当下语音识别技术的发展趋势是与AI技术结合,实现“主动对话式交互”,不但能随时随地听懂消费者在讲什么,还可以针对疑问即时提供相关的解决方案。
相比于语音识别,自然语言处理难度较高,是各大企业需要努力攻克的技术难关。自然语言处理的能力是认知智能的核心。自然语言处理能力的增强会提升机器智能整体的推理和理解能力,进一步支持聊天、翻译、人机对话等应用的发展。目前,百度、阿里、腾讯、京东、今日头条等大型互联网公司,以及很多新锐公司(如出门问问、新华智云等)都在积极攻克自然语言处理难点。展望2018年,自然语言处理技术还将沿着致力于实现智能化、人性化的搜索推荐、语音交互、语义理解的道路继续前行。
按照目前实现的语音识别技术和自然语言处理技术,“冲顶神器”可以完成在固定的范围内回答问题,但是在逻辑推理上软件还没有办法实现突破。综上所述,“冲顶神器”还不能完美地在10秒内正确答完12道题。DoNews用“简单搜索”和“汪仔答题助手”体验多场直播答题后发现,正确率每场差别很大。“汪仔答题助手”在1月10日晚上7:00的“百万英雄”场,12道题目,机器人第1题和第4题均答错;“简单搜索”在1月12日晚11点“百万英雄”场,12道题目,机器人全部答对。但1月14日下午5点“冲顶大会”,机器人在多道题目上宣布“放弃”,甚至一度出现卡顿。
总体而言,在人工智能时代下,智能语音技术的发展已是大势所趋,“冲顶神器”虽然仍存在各种不足,但可通过技术进步、资金支持、政策鼓励以及整个大时代的发展去化解。因此,在不久的将来,随着人工智能深度学习的发展,语音识别和自然语言处理难题逐步解决,“冲顶神器”将能快速正确地帮助用户答题。