“AI主播”真正落地,还有离不开的“三大件”
通过信息流的看听模式,“AI主播”现在有了更快、更广泛的落地方式,但要真正让用户认可,并不是简单上线一个功能这么简单,它还有三个方面的门槛。
1、技术:以自然化的表达拒绝“噱头”
生硬、冷冰冰的语音播报是之前不少“听新闻”APP或工具下,用户的主要感觉,这显然无法获得长期认同,只能“图个新鲜”。
百度、Google等巨头的加入,改变了这一情况。
实测,在百度APP的看听模式中,除了朗读节奏流畅、与真人说话几乎无异,用户还可以基于自己的喜好选择不同音色,成熟、磁性、深情、活力、可爱……
而这种拟真化,来自于百度打造的世界上第一个能在云端提供大规模并行WaveRNN等实时语音合成技术的解决方案,简单说,即能成句、成片合成音节,而不是像传统技术那样单个音频点拼凑起来(所以显得生硬、冷冰冰)。
它的背后,是AI技术的深度积累和海量数据资源优势,通过分析新闻的词汇、句法、人物和事件等信息,完成高度拟人、流畅自然的语音合成。
2、内容:优质内容支撑才能让AI技术更有发挥余地
没有优质内容支撑的看听模式是无缘之木。
即便有一天AI语音播报可以实现央视播音员的水平(这并非没有可能),如果内容本身质量不佳,所谓“听新闻”其实还是伪命题。
百度看听模式,一定只能是其长期内容耕耘的结果,在信息流层面,百度多年来持续优化创作者环境,尤其是不断加大力度引入包括人民日报在内的优质内容源,已经使得百度信息流成为权威新闻的发布平台之一,某种程度上并不输各种新闻APP。
在这个基础上进行的看听模式,就有了深厚的根基。
更进一步看,以信息和知识为主要传播对象的百度移动生态,“听新闻”转化到“听知识”(例如医学权威健康知识的碎片化学习),也不是不可能,过去的积累其实为百度移动生态埋下了更多商业可能。
3、认知:“秘书式”服务更能体现“听”的价值
从产品的角度看,“听新闻”有点像为用户定制了一个“秘书”,把有需要的新闻“念”给用户听,用户以一种舒适的心态完成APP上的新闻资讯获取。
在这个背景下,百度APP看听模式的一个亮点功能——朗读时用户可以选择通篇朗读或者提取资讯中的核心进行播报——就更好理解了。
在用户选择后,看听模式可以对每一篇资讯的要点进行抓取并生成摘要,AI只会将摘要部分朗读出来,而不会全篇阅读,这很像“秘书”般的简报服务。
这种能力,来源于NLP技术的深耕,使得AI具有某种对新闻的认知能力,会分析文章里的词汇、句法、人物和事件等信息,自动识别关键部分,最终形成方便阅读或倾听的简讯内容让AI播报出来。
毫无疑问,这将更大程度满足快节奏生活的需要,而多样化的选择本身也是赢得客户好感的过程,只不过这种多样化十分依赖AI技术来完成,不是只有一个idea就行。