配图来自Canva
随着AI技术的跨越式发展,智能产品逐渐渗透在日常生活的各个领域。不过,智能产品的开发,还是需要建立在AI技术进步的基础上。而AI技术的进步,则能够方便智能产品推进商业化。
在语音识别领域,代表语音技术圈领先水平的INTERSPEECH为促进语音识别技术的进步,举办了2020届语音识别挑战赛。在今年举办的INTERSPEECH 2020 DNS挑战赛中,搜狗以4.01的MOS评分夺得冠军。
AI降噪技术取得的喜人成绩,让搜狗在语音识别技术的商业化推进中有了更足的底气。在推出S1录音笔产品中,搜狗就将AI降噪技术应用其中,并获得了不错的用户评价。
不过,同样身居AI录音笔市场的科大讯飞也在不断发力,和搜狗展开竞争。与此同时,搜狗在AI商业化方面,也受到来自产品以及商业模式两方面的挑战。而在这场竞争中,搜狗和科大讯飞谁能够胜出,还有待市场考量。
DNS夺冠,醉翁之意不在酒
作为语音领域尖端组织之一,INTERSPEECH一直代表着国际语音技术领先水平,并在全球范围内拥有极大影响力。而DNS挑战作为INTERSPEECH2020的竞赛主题之一,其比赛结果就代表了企业在业界的语音识别技术最高水平。
据悉,今年举办的DNS挑战主要以MOS评分作为语音技术评价标准,考核内容为微软官方提供的500h数据集语音识别。最终,搜狗以4.00的MOS评分超过亚马逊,夺得RT(实时降噪)技术赛道桂冠;而在NRT(非实时降噪)赛道,搜狗也已3.90的MOS评分位居第二,成绩喜人。
RT、NRT技术赛道的亮眼成绩,也让致力于AI技术研发的搜狗略感欣慰。作为语音赛道早期的入局者,搜狗一直围绕语音技术展开产品创新和技术探索,并凭借着多年积累的优势在业界居于领先地位,而这次DNS挑战夺冠,也正是其在语音识别领域多年积累下强劲实力的体现。
除了获得业界AI技术认可之外,语音识别赛道取得的亮眼成就,对搜狗AI技术的商业化推进也有重大意义。搜狗在AI领域多年深耕,研发投入超过数亿美元,曾让其面临了巨大的财务压力。而这次AI降噪技术夺冠,必然对其推进AI商业化进程、降低自身财务压力大有裨益。
目前智能语音市场,对AI降噪技术的应用还比较有限,仅应用在语音通话等简单场景。在市场技术应用场景有限的情况下,搜狗率先变革创新,将AI降噪技术应用在AI录音笔上。
趁热打铁,力推AI录音笔
虽然AI降噪技术夺得冠军,但这并不是搜狗的最终目的。而搜狗在AI领域持续投入技术研发,最终还是要将技术成果商业化。
语音识别技术的商业化落地,对持续亏损的搜狗来说刻不容缓。搜狗近日发布的财报显示,2020年第二季度共亏损0.085亿美元,搜狗解释主要是搜索引擎、AI技术持续研发的投入所致。研发的持续投入,自然让搜狗承压,而抓住有限的变现渠道、摆脱亏损境况就成了搜狗必须要做的事。
事实上,搜狗早就在加紧AI技术的商业化落地。今年举办的“同舟共记”发布会上,搜狗发布了最新的S1、E1两款具有AI降噪功能的录音笔,并使用了pureVoice人工智能降噪算法、clairVoice8麦阵列算法。通过其领先的AI降噪技术,搜狗的S1、E1录音笔可以做到过滤4万余种真实噪音,还能在嘈杂的环境高度并准确还原人声。
凭借着强大的AI降噪技术实力,搜狗的S1、C1、C1Pro产品受到用户追捧,首发8小时就已售出5000台。而在罗永浩直播中,搜狗的S1录音笔也有不错的表现。在吹风机的强力干扰下,S1录音笔也能将现场录音清晰还原,其强大的语音还原能力受到了老罗和直播间网友的好评。
S1录音笔取得的亮眼成绩,多少对搜狗承受的财务压力有所缓解。不过,搜狗的录音笔虽然有AI降噪技术的优势,但同时也面临着变现模式单一、产品同质化的问题。