三、产品建议
经过一个星期的测试,发现百度远场语音开发套件在语音唤醒、语音识别方面比较出色,识别率整体上准确很高,如果在发音相似的词语方面多加训练,效果会更好。此外根据个人的使用感受在产品的功能上提一些建议:
1、 提升音质,语音多样化
未来提供更多不同风格的发音人,并可以让用户自主选择,分别在进行购物、查询信息、播放音频资源等不同场景下有更多的音色供选择适配。让“小度”逐渐人性化、个性化。
2、 完善语音交互功能
提供更高质量的语音交互功能,加强对话理解和对话管理技术以及只是建设能力。通过不断的练习,让音箱能够更加“理解”用户的话语意思, 给用户提供更加准确的结果,轻松定制专业、可控、稳定的完整语音交互能力。
3、 音色识别
在语音交互中,通过声纹识别不同用户音色,根据音色判断交互内容并理解,可以将此功能利用在声纹解锁以及语音交互理解中,包括多人说话时执行命令的优先级。
语音交互未来可发挥的空间很大,但是现在的语音交互功能还不那么广泛的,不过相信只要坚持发展,保持数据收集、场景优化,未来一定会在各个领域有更深度的拓展。