文|吴俊宇
美国科技媒体CHROMEUNBOXED在今年5月Google I/O大会结束之后曾发表一篇名为《Next Generation Google Assistant Set To Revolutionize How We Talk To Devices》(下一代谷歌助手将彻底改变我们与设备的对话方式)的文章。
这篇文章提到,“我们的声音与我们的设备将在交互方面进行一场革命”。
也就是说,语音交互可能会带来新一代操作系统——它可能和“桌面+键鼠”、“屏幕+触控”一样,成为我们在智能时代的新选择。
CHROMEUNBOXED这个判断并非虚言。随着自然语言处理NLP技术的日趋进步,智能语音能够理解的事物越来越多,我们和语音之间的交互也将越来越深。
这一次百度AI开发者大会上,新发布的小度助手5.0,恰恰展现了成为“第三代操作系统”的潜力。
一、语音何以成为系统
在我看来,互联网的发展历经了两个阶段,现在正在进入第三个阶段。
第一代操作系统是“桌面+键鼠”,桌面时代的思路,是“抢入口”,比如搜索引擎、社交工具、杀毒软件。
第一个阶段的代表诸如桌面浏览器、桌面QQ、360卫士这些产品。人们对这些工具型产品有着超乎寻常的依赖,往往可以形成“三级火箭”的商业逻辑。比如“杀毒软件—浏览器-搜索”就是典型的三级火箭模式。
不过,这个模式到了移动时代就失效了,随着APP入口日趋分散,“平台+生态”成了通用逻辑。
第二代操作系统是“屏幕+触控”,移动时代的思路,是“造平台”。
第二阶段的代表就是微信,微信无论是最开始做微信公众号,还是后来的九宫格,以及当下的小程序,微信都在希望逐步加深自己操作系统的属性。
但限于微信移动产品形态的限制,它只能是腾讯寻找下一个操作系统产品的过渡期产品,将第二阶段的红利尽量延长,为自己争取更多时间。
第三代操作系统是“智能+语音”,智能时代的思路是入口无形化,服务语音调动、无所不在,服务生态在系统内实现自然闭环。
也就是说,语音成为了交互的工具。过去人们是通过“桌面+键鼠”、“屏幕+触控”调取各式各样的服务。但是在第三代操作系统这里,随着自然语音处理技术的逐渐成熟,人们可以直接通过语音去调取服务。
在微软Build2016开发者大会上,微软CEO纳德拉首先提出了Conversations as a Platform,也就是对话即平台的人工智能发展方向。
这个概念在后来也被称为是对话式人工智能。
所谓对话式人工智能指的是,对话本身就是一个平台,各种知识、信息与服务都运行在对话器上,可以形成生态环境的基础平台。人和人工智能之间的对话,即是解决各种问题的一种路径和方式。
美国科技媒体Towards Data Science在今年4月刊载的一篇名为《A Voice Based Operating System》(《基于声音的操作系统》)一文中提到了这样一句话:
Voice interfaces are the future of human computer interaction.
语音接口是人机交互的未来。
这篇文章认为,语音想要成为操作系统,必须满足这几个条件。
1、巨大的研究实验室作为人工智能的技术先驱。
2、巨大的计算资源,几乎不受限制地访问数据。
3、一个可以从基于语音的界面中获益匪浅的应用程序生态系统。
在我看来,一个真正可能“上位”的语音操作系统,还需要有着硬件生态规模作为支撑——让它真正无处不在。
二、小度助手悄然崛起
7月3日,在“Baidu Create 2019”百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏演示了小度行业领先的全双工免唤醒能力,小度现场展示的“连续对话”和“拒绝反应”能力让人看到了“操作系统级别”的体验。
某种意义上看,今天的小度助手,其实就符合这三个条件。
百度本身就是国内AI技术最领先的企业,在计算资源、算力规模方面,也无需多言。基于这些基础条件,百度开发者大会,作为国内乃至全球开发者们的顶级盛会,勾勒了一个未来操作系统的影子——小度助手5.0。
1、技术基础
语音操作系统最重要的技术基础在于自然语言处理能力。这个素来都是百度的优势。
在自然语言处理之外,百度还具备小度开放平台,专门为个人及企业开发者提供专业的对话式AI技能开发工具。其中包括智能设备开放平台和技能开放平台。
这使得小度助手可以不断演化出新的技能,技术更新速度也更快。要知道,一款操作系统最重要的基础就是应用和硬件,百度在这方面已经打通了软硬件上下游的生态。
另一个重要的技术突破在于,小度助手5.0的全双工免唤醒能力让语音交互体验迈出了一大步,用户不仅能在无需多次唤醒的情况下和机器顺畅交流,还能在与他人对话的同时互不干扰地实现人机交互。
2、用户规模
任何操作系统,必不可少的就是用户规模。语音操作系统,其用户规模的支撑又离不开硬件规模。因为只有硬件规模(如智能音箱、智能手机、智能电视等)足够庞大,能够覆盖足够多的场景,才能覆盖足够多的用户。
百度副总裁、百度智能生活事业群组(SLG)总经理景鲲在大会上提到的一组数据颇为惊人:
截至2019年6月,搭载小度助手的智能设备激活数量已经达到4亿(不包含百度系APP内置小度助手数量),小度的月交互次数超过36亿(不包含百度系APP内置小度助手数量)。
支撑如此庞大数据规模的,其实是庞大的合作伙伴生态。小度助手的合作伙伴数量已经超过300家,内置小度助手的主控设备超过160多款;小度助手的对话能力应用到智能家居、智能穿戴、车载、移动等多个场景,为用户提供语音服务。
有趣的是,根据Canalys 发布的2019年Q1 全球智能音箱市场报告,百度2019年Q1 小度智能音箱出货量达330万台,仅次于谷歌的350万台及亚马逊的460万台,成为中国市场第一,全球市场第三。
不管是合作伙伴还是自有硬件,小度助手都形成了庞大的用户规模。
3、生态规模
一个好的操作系统,背后是一套完整的生态,其中包括开发者、应用层和硬件层。今天的小度助手其实就满足这个条件。
小度技能开放平台目前可提供包括游戏、效率工具、网络电台、直播、儿童教育、智能家居等2400多种技能支持;在小度技能开放平台上的技能开发者数量已经超过3.2万人;小度助手可以控制的IOT智能家居设备已经超过了七千万。小度助手可以提供20余种跨场景、跨设备的解决方案。
小度助手5.0的发布,无论是所展现的技术能力还是智能语音技术所具备的天然优势,都让小度助手更有可能成为未来的操作系统。
更多的开发者接入,更多的技能得以实现,更多硬件厂商的拥抱态度,都为小度助手提供了成为操作系统道路的动力。
有技术、有用户、有生态,小度助手需要做的,仅仅只是等待东风的到来。
三、下一个剧变的开始
国内企业战略及管理学研究者朱恒源有一个“变革动态管理模型”。
在朱恒源看来,一个创新产品是不会马上就被所有用户接受的,在不同的阶段,主流的新增用户是不同的。随着这些用户的不断累积,就会看到市场的成长轨迹不是一条直线,而是一条“S”形曲线。
在这个“S”形的市场发展曲线上,我们可以看到四个清晰可识别的阶段:小众市场、大众市场、分众市场和杂合市场。
在小众市场的时候,它是一个渐变的过程,规模小、增长慢而且不稳定,需求多样性很高。由小众市场向大众市场过渡就是突变,接受某个产品的人数突然呈指数式增长,市场在极短的时间内极速扩大,并且达到了一个非常大的规模。
某种意义上看,当下发展阶段就是图中所示的智能手机和智能语音这两条动态曲线的重叠区间。
今天的智能语音,正处于下一个剧变的前夜。目前使用智能语音的用户主要还处在小众市场,但是随着技术不断成熟、用户不断扩大,真正的剧变即将开始。
纽约时报在2017年曾经针对智能语音发表过这样一个观点:
人工智能时代利害攸关的不在于这些零零碎碎的创新,而是可能控制的一种全新的计算平台。
如果说曾经的微软掌握了Windows从而获取了PC时代的霸权地位,后来的谷歌和苹果掌握了Android和iOS因此在移动时代叱咤风云。
那么今天的百度,可能会因为小度助手这样的第三代操作系统,在智能时代抢占新的机会。