自然交互+知识计算背后是AI平台
搜狗听写不会是搜狗唯一的一款人工智能产品,在王小川的规划中,人工智能是搜狗下一阶段的重要战略。
早在2012年,搜狗便开始研发智能语音技术,并开始布局相关产品的落地。去年8月3日,搜狗举行知音引擎发布会,取得机器翻译的突破。跟进当时世界上最领先的机器翻译的深度学习框架,基于attion的端到端的框架,加上搜狗以前在语音识别上的累积,用3个月时间,搭建起知音引擎,并应用于去年的乌镇大会,该引擎在今年5月份夺得WMT2017中英机器翻译的全球冠军,;去年11月份,搜狗推出了机器同传,率先商用化...
这样的案例很多。搜狗在去年年底推出了一款机器人“汪仔”,面向搜索引擎,实时的抓取海量信息,根据问题的上下文,通过文本的分析、自然语言处理的能力,把用户想要的答案提取出来。在今年5月份GMIS2017会上,“汪仔”与人工速记进行了五轮PK,最终以4:1完胜。
“到现在为止,我们可以很坚定的说,机器的识别能力与人工速记相比,已经取得了本质性的领先。”王砚峰说。
然而语音识别同样存在挑战。王砚峰说,语音识别产品未来要解决的,一是远场的问题——人与人之间的远距离喊话,大家可以听得很清楚,但机器的远距离识别是不好的;二是噪声声音识别问题。
彼时搜狗的人工智能战略还只是个轮廓:自然交互+知识计算,如今,轮廓变为框架,搜狗已经形成一个AI技术体系及平台。
平台由四个阶层组成,底层是大数据和深度学习技术;倒数第二层是语言的AI、语音的AI、图像的AI,搜狗的核心是语言,图像和语音都是围绕语言的交互方式;再上一层就是行业应用;最顶层就是搜狗的输入法和搜索两款产品。
搜狗作为一家人工智能公司,在AI落地方面做得远远不够。也正因此,下半年将在硬件、软件等场景集中一波攻势。具体而言,搜狗接下来会往三个方向发力:
1、在可穿戴、车载、客厅场景下,自主研发更多的硬件。比如搜狗在上个月已经发布了一款产品“智能副驾”,主打的模式就是通过多轮对话、地图知识和对话能力的结合,把它变成更好的导航对话引擎。
2、搜狗会积极推广AI云平台、AI云服务,服务更多的行业伙伴。
3、在更多的垂直场景下做产品。
基于搜狗的语音能力和自然交互能力,在非巨头垄断的行业,搜狗将尝试做更多硬件产品的自研、试水、投资,可能自己研发,也可能投资一些公司,以合作的方式把这些产品做出来。
在王砚峰看来,不论是车载市场、家庭场景,还是可穿戴市场,虽然玩家很多,但市场格局还未定型,在这个过程中,王砚峰认为搜狗完全有信心拿出更多爆款产品或有量产品,来抢占市场份额,例如在中国可穿戴设备硬件中排名前五名的糖猫儿童手表,目前出货量已突破100万。