AI语音、计算机视觉、机器学习被称为人工智能三大核心基础技术。
AI语音是人工智能发展最早、且率先商业化的技术之一,在国家政策的大力支持以及技术水平不断提升的双重积极影响下,产业生机蓬勃,产业链日趋完善,行业规模持续扩大。
最新发布的《2020-2021中国语音产业发展白皮书》显示,2020年我国智能语音市场规模已经达到了217亿元,同比增长31%,预计2021年可达到285亿元,同比增速达到44%。在受疫情影响及产业数字化需求拉动的大背景下,我国智能语音市场规模仍保持了持续稳定增长。
AI与物联网IoT正在加速融合,在AIoT时代,AI语音交互已广泛应用在家居、医疗、教育、金融、办公等社会经济生活的方方面面。
自2011年10月,苹果iphone4s发布了第一款语音助手siri,让用户真正感受到以语音技术为代表的人工智能在我们生活中的应用,从那以后,各大品牌的语音产品相继面世,用户对语音产品逐渐有了相对成熟的认知,用户“被教育”后,需求渐趋理性,对产品的“智能化”要求亦将更加严苛。
云知声联合创始人、副总裁康恒先生近日接受OFweek维科网记者采访时表示,AI语音市场已逐渐步入相对健康的良性循环,康恒认为,近年来,用户对AI语音产品的理性需求得以增长,一方面,反向推动着产品技术的迭代和创新,另一反面,推动着产品制造上游成本的不断下降,产品种类不断丰富。
全栈 · 战略
过去5年,国内AI语音技术进入落地期,智能语音助手、智能音箱等2C产品相继推出;疫情的爆发,催化了行业对非接触应用的强烈需求,AI语音相关的2B企业级应用场景受到加速推广。
然而,无论是2C消费级,还是2B企业级应用场景,对于AI语音市场的增量需求,不仅仅加速了商业化进程,还有技术水平的大幅提升,比如AI系统对语义的理解以及执行能力。
目前,若纯粹从语音感知识别的角度,AI语音主流厂商通过端到端的算法和海量的线上数据,语音识别准确率可高达96%以上,是相对成熟的技术。
然而,在实际的产品使用体验中,AI语音技术的“智商”还经常满足不了用户的高期望。
康恒认为,自然语言被识别成文字后,如何被正确地理解,以及针对这些理解如何作出正确的回答和执行,目前来讲技术还远远达不到成熟的程度,还有非常大的瓶颈需要突破。
康恒介绍,作为国内头部的人工智能独角兽企业,云知声在上述问题上早已做了深度思考。云知声认为,技术和产品要结合行业深耕才有未来,AI语音技术面临的瓶颈,主要是机器学习和认知能力还跟不上,离真正通用智能差距还比较大,要聚焦到垂直行业才能实现AI技术的实用化。
基于这一判断,云知声在技术战略上,逐步构建了全栈式的AI技术体系,为各行业和场景提供全面的技术解决方案,通过全栈式AI能力为产业解决实际问题。
康恒表示,云知声作为全栈式的AI语音技术供应商,基于“语音、语义、知识图谱”的核心能力,从语音的感知、识别,到理解、反馈等过程,都具备了完善的技术模块,甚至在特定技术环节,能够达到顶级的技术水平。
基于全栈式的AI能力,云知声不仅可以为应用场景提供全面的技术解决方案,而且以实际问题为导向,实现联合优化,让方案的落地效果更好。
突破 · 收获
对自然语言的理解能力,是AI语音亟需突破的技术瓶颈。语音理解能力的构建,一方面取决于算法本身,另一方面取决于技术供应商在某个行业的应用场景下,是否具备足够的行业认知和海量数据去训练AI语音系统。
在自然语言的处理、语义理解方面,云知声积极拥抱新的算法,并针对垂直落地的行业,打造行业知识图谱,开发出多元异构超大规模的知识图谱。
康恒介绍,云知声知识图谱的技术能力,已应用于AIoT、智慧医疗等行业,针对这些行业,我们不仅仅在数据规模方面达到行业领先,在语义理解能力方面也达到了业界标杆水平。
今年4月,云知声-中科院自动化所语言与知识计算联合实验室团队,基于在医疗知识图谱和医疗文本理解方面多年的积累,凭借自主研发的基于高效持续学习的医疗预训练语言模型CirBERTa,获得中文医疗信息处理挑战榜冠军。
康恒认为,登顶冠军的殊荣证明了云知声在医疗NLP技术方面的先进性与全面性。
目前预训练语言模型CirBERTa已经全面应用于云知声智慧医疗的多个产品线,包括病历质控系统、单病种质量管理平台、导诊预诊机器人、医保审核系统等。
据悉,云知声智慧医疗产品已上线全国100余家标杆三甲医院,与北京协和医院、复旦大学附属中山医院等建立了长期紧密的合作关系。
未来,云知声还将持续推动自然语言处理及知识图谱等技术在医疗领域的技术创新,用科技的力量在辅助医生诊断、降低医疗成本、提升医疗系统运行效率等方面,为优质医疗服务的普惠化做出更大的贡献。
深耕 · 未来
除了智慧医疗,智慧物联是云知声另一个深耕的赛道。
万物互联时代,物联网技术渗透各行各业、互联互通的各个场景,从基本的家居设备的控制,到智慧交通、智慧城市等行业应用,云知声都有非常广泛的落地实践。
在设备本身的控制方面,云知声主要以基础的芯片能力和SaaS服务,来赋能设备的开发者。
康恒介绍,云知声构建了“云端芯”一体化的产品体系,推出的“蜂鸟”系列语音芯片解决方案,已经落地上千万台物联网设备,在家居场景上提供了一站式的解决方案,实现多设备之间的互联互通互操作,大大提升了用户的使用体验。
据悉,从2018年开始,云知声开始与智慧酒店、地产行业合作,提供全屋的智能化解决方案,在设备智能化方面的标杆客户包括格力、美的等行业知名家电制造商。
谈及未来,康恒认为,技术发展是永远的战略重点,全栈式AI能力是我们快速发展的基石和源动力,语音AI全栈链条上的每一个技术点,都必须持续保持领先性。
在智慧医疗、智慧物联这两条主打赛道上,虽然云知声已经为行业提供了前瞻性的应用,取得了客户的认可和效果,但未来仍然需要对行业进行持续的、更深层次的理解和探索,从AI的角度去分析行业,挖掘行业内依然存在的未被满足的智能化升级需求,以满足行业赋予我们的更高的期望。
此外,康恒认为,未来云知声需要提升解决方案的可复用性,探索将定制化方案的成功经验,复用于中小企业客户,赋能中小企业数字化转型,期望越来越多的客户能够用合理的成本,享受到AI技术带来的好处。
2022年5月26日举办的【OFweek2022 物联网与人工智能在线大会暨在线展】期间,云知声联合创始人、副总裁康恒先生将发表《从AI芯片到全场景智能的产业落地之路》的主题演讲,与您一起解密云知声智能语音芯片及AI解决方案,如何助推行业数字化转型。