作为一个时代的代名词,人工智能备受瞩目,从世界范围内参与其中的知名公司就可窥见一斑。在80年代,以数理逻辑为核心的体制瓦解后,人工智能分化出了五大独立学科。在这五大学科中,由深度学习推动,并顺利从科研实验室走到人们身边的智能语音,某种程度上承担了人工智能这两年的大部分热度。智能语音在2016年被美国权威杂志《麻省理工科技评论》评为当年的十大突破科技,根据易观·工信部数据,2017年中国语音产业规模就将突破百亿。
说到智能语音就不能不提智能家居。在当下的智能家居行业,语音基于其交互的自然性,被认为是未来人与家居交互的主要入口路径,以致业内普遍认为,“以语音为入口连接各种服务,构建智家生态”。
作为人工智能应用最成熟的技术之一,目前语音交互的核心环节也取得重大突破,语音识别环节突破了单点能力,从远场识别,到语音分析和语义理解有了重大突破,呈现一种整体的交互方案。自动语音识别(ASR)和前端语音处理的最新发展已使得语音控制相当成熟和有效。ASR引擎可以理解多种语言和口音,而语音生物辨识可用于辨识系统中预先登录的特定用户,以在智能家居环境中提供不同的权限。
不过,虽然大多数家居可以用语音开启导航,进行信息查询,实现一些诸如空调、开灯等功能控制,但距离“以语音为入口连接各种服务,构建智家生态”的理想仍然较远。目前的技术仍然限制在5公尺的范围内,并且难以在多人同时交谈或吵杂的环境中操作。
影响语音控制技术进入到智能家居或其他应用领域的原因很多,包括使用者的习惯是否被建立、是否提供更多“控制”功能以外的附加价值、是否有更“特别”的应用出现,以及安全性的问题。其中,安全性可说是消费者最为关注的部分。
就像著名电影《蜘蛛侠》中的那句台词:“力量越大,责任越重。”语音识别能量越大,就越需要安全阀门。首先是声纹的采集。不管是人工识别,还是依靠深度学习算法进行自动化识别,声纹库的建立都是进行一切行动的前提。当前,公安的声纹鉴别库最全,但如果是企业要想研究声纹识别,从公安处入手显然不可能,因而,企业智能自行收集声纹并建立声纹库,这是一项十分艰巨的任务。更重要的是,企业还要注意如何保障声纹不被非法利用。
其次,我们都听说过“无用输入,无用输出”的说法,但你想过这句话同样适用于负责业务的语音识别吗?企业是否有建立污染数据安全策略(它能确保攻击者不会利用篡改过的数据欺骗人工智能并让它推荐错误的决策)吗?如果设备根据错误的数据做出了错误的决策,那么,企业需要多长时间才能发现?数据污染已经是网络安全世界中的一个关注点。例如,反恶意软件根据多重来源提交的标记和样本进行工作,而反恶意软件供应商必须保持警惕,防止攻击者愚弄这一系统。
尽管如此,与其他生物特征相比,声纹识别的应用仍然具有特殊优势,比如声纹提取可在不知不觉中完成,因此使用者的接受程度也相对较高目前,声纹识别在全球市场中的占有率达到15.8%,仅次于指纹和掌纹识别,并呈现出不断上升的趋势,因此,我们有理由相信,声纹识别或将成为语音交互的下一个风口。
结语:在今天这个快节奏的社会中,语音识别技术的诞生,可以说是一次伟大的技术变革。随着高质量数据的不断积累、技术的不断突破及硬件平台算力的提升,语音识别正在向我们期待的方向快速发展。