技术革命推动了新一轮的入口争夺战,人工智能站在新时代浪尖,发出了兴奋而急迫的笑声,它所涉猎的领域,呈指数的扩张至几乎所有科技的产品和服务,它开始演化成全新的基础设施。让人为之狂热又心生敬畏。
人工智能时代的入口是什么?“前端交互”和“后端智能”。最为大众熟知、运用最广泛的便是前端交互技术中的语音识别。对自然语音的处理成为未来人机交互的主要方式,也是人工智能初期最大的入口。
今天我们要谈的人工智能电视,就是客厅娱乐中人与机器语音交互最具代表性的产品。因为电视的交互远远没有手机以及个人电脑那样丰富,语音操控成为解放智能电视交互最佳的手段。
然而智能电视上的语音交互并没有想象中那么完美,仍有很多日常生活的需求无法通过语音交互实现,交互的内容仅限定于既有的设定,谈不上智能。电视语音使用场景支持的广度和深度乏善可陈。
直到2018年,海信将VIDAA智能电视系统全面升级为VIDAA AI人工智能系统之后,智能电视爆发了一场语音交互革命。人工智能语音交互,原来可以这么好用。全新VIDAA AI系统,开始让人工智能电视能够真正读懂用户的内心需求。
VIDAA AI人工智能系统技术剖析
智能电视的语音交互有哪些痛点?语音识别反应慢、识别率低、识别范围小……海信VIDAA AI人工智能系统,通过全新升级,将这些陈旧的交互痛点逐一消灭。
语音识别要经过这么几个阶段:声音采集-语音识别-语义理解-内容匹配-结果显示。每个阶段的处理都事关整个交互的速度性与准确性。
声音采集阶段:海信采用无损数据压缩算法,将声音数据无删减、体积更小易传输,传输丢包率降低30%。
语音识别阶段:海信与科大讯飞合作,引入其语音识别引擎,识别准确率方面达到行业同等水平,方言支持范围达到行业领先。
语义理解阶段:海信加强版意图理解引擎,在语义分析、模糊理解、知识图谱、上下文关联等方面实现最新技术创新,海信语音成为业内最“懂”用户的电视。
内容匹配阶段:海信依托2000多万电视用户,建立了行业最庞大的针对电视应用场景的数据库系统;同时在原有业务范围基础上扩展了衣、食、住、行等与日常生活息息相关的内容。
结果显示阶段:海信软件系统整体优化,在应用启动、界面切换速度提升25%,响应超快,而且还引入科大讯飞语音合成方案,支持11种语音播报音色。
VIDAA AI人工智能系统综合体验
光说不练假把式,既然有这么强大的技术支撑,那我们就来实操一把,看看VIDAA AI人工智能系统真正的实力。
通过体验视频我们可以清楚的看到听到,海信VIDAA AI人工智能系统对于笔者的各种语言指令都反应十分迅速,反馈的结果内容准确,同时能够解答的问题也十分全面。
海信VIDAA人工智能语音深度体验!
这就构成了海信VIDAA AI人工智能系统“快”、“准”“全”三大语音识别标准。当然这还只是扎实的基本功,还有更多超高难度的语音交互让你打开眼界。
VIDAA AI人工智能系统特色功能体验
海信通过人工智能升级,实现了三大革命性变化:第一,实现了更高级的人机对话, 拥有独家“五轮连续对话”交互体验。第二,实现了33种人物关系识别,精准理解用户意图。第三,34大类生活场景有求必应,覆盖了直播、教育、游戏、购物、音乐、美食、中译英翻译、预定飞机票火车票、预定酒店、景点查询等主要生活场景。
VIDAA AI人工智能系统特色功能体验
五轮连续对话
语音交互最难的地方就是上下文内容的衔接。比如你想看电影,模糊搜索了一遍欧美大片,但突然又想看好欧美大片里的悬疑电影,于是说了一句“悬疑的”,到这里,大部分的智能语音就开始蒙圈了,可能给到你的结果仅包含了“悬疑”这个关键词。如果继续给定条件的话,就会越来越乱。
上下文多轮对话动图演示
而海信VIDAA AI人工智能系统可以做到,联系上下文,多大五轮的连续对话。比如:
第一句:“我想看电影”
第二句:“欧美的”
第三句:“不要恐怖的”
第四句:“最新的”
第五句:“不要成龙的”
此时的答复……
海信:为您找到非恐怖 非成龙 最新 欧美 电影X部