搜狗王小川:无人驾驶如果只做开放OS平台没戏

新出行指数
关注

今天下午,在第五届世界互联网大会上,搜狗发布了全球首个全仿真智能合成主持人。据搜狗CEO王小川介绍,与微软小冰之类的虚拟主持人不同,这个“合成”主播除了声音,还包括唇形及表情。

而在这次大会开幕前两天,搜狗也发布其Q3财报。财报数据显示,其Q3收入2.76亿美元,同比增长7%,但2390万美元的净利润则同比下滑23%。季报称,这部分收入下降的原因在于,智能硬件产品的销售下降,因为搜狗决定升级智能硬件策略,以更好地利用搜狗的人工智能能力并提高产品竞争力。而在这次世界互联网大会的专访中,王小川也对其人工智能布局、财报表现等问题言无不尽。

合成主播是一种“分身”的技术

记者:实际上虚拟主播已经有过很多,搜狗这次跟微软小冰之类的产品有什么不同?它会有什么应用场景?

王小川:我们是一个合成主播,除了声音、还有表情跟唇形,这是一种“分身”的技术,搜狗一直强调从助理、翻译再到分身、问答,一脉相承的技术路线。

作为分身它的使用场景就会有很多。比如我们现在跟凯叔讲故事正在谈合作,以前是他来讲故事,但是如果通过声音表情合成有可能变成爸爸妈妈来讲故事,应用于教育场景。

记者:另一方面,从声音模拟来看,搜狗的主播跟高德地图里的林志玲有什么不同?

王小川:高德地图用林志玲声音做导航,需要录入许多语料,并没有学习过程。而我们需要很少的语料,比如说一个主播只需要录入10分钟的声音就可以将其声音特征模拟到其他的语音内容中,这背后是我们有巨大的数据量支撑,才能实现前端更小的数据样本。

记者:科大讯飞此前提过,翻译的未来是“人机耦合”,语音识别不会取代同传,您怎么看,合成主播是否会取代主播?

王小川:首先AI技术分为感知与认知,在感知方面包括声影图像,机器可以跟人做到基本一样,但认知方面,涉及逻辑性及思考,机器现在做得很有限,这需要分层次看。

合成主播还是需要人的配合。最起码新闻稿需要新华社的编辑去写,它是单向输入这个内容。另外,实际上它是不理解稿子内容的,只是表达视觉与听觉,所以如果跟内容强相关的表情可能做得不够好。

关于财报:智能硬件不需要赚钱

记者:从财报看,医疗广告是目前搜狗广告收入占比最高的部分,但您提到要降低医疗广告收入占比?

王小川:医疗上,我们首先要做到内容权威,其次内容优先于广告,降低医疗广告收入也是为了差异化竞争,如果能让用户喜爱度提高,流量变大,收入也会进一步提升。目前,我们的医疗广告收入占比是低于百度的,我们的用户查询占比超过9%,是百度的两倍,而从收入上看,我们是占比20%,而百度是30%。

记者:从智能硬件上看,作为我们AI一个体现的智能硬件收入却下降。

王小川:明年一季度我们也会做一些大众化的智能硬件产品,但不是音箱,因为音箱的主要竞争优势在于便宜,是资金驱动而不是技术驱动,我们会在生活工作方面做一些新的尝试。

另外,不管大众小众,我们不依赖于智能硬件去赚钱。小众产品,比如翻译宝,我们做品牌;未来的大众产品也是做用户量,依赖于巨大的流量可以去做一些广告之类的其他收入方式。

记者:那我们会做车联网吗?

王小川:这不是我们的优势。单纯的AI是不能谈赚钱的,它只是一种技术,不是商业模式,商业模式只有两种,要么卖服务,向B端卖整套解决方案;要么卖产品,去造车。我们是一家2C公司,又没很大的资金量造车。

记者:那比如说百度apoll这种开放平台模式?

王小川:早期技术创新是来自于一个自我的封闭体系,就像当初PC也是IBM把软件、硬件之类的全做了。开放是一种商业模式创新,是促进一个相对成熟的市场提高效率。从目前看,单纯的一个OS平台是不可能做无人驾驶的,因为没法建立自己的真正核心竞争力。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存