9月20日,声智科技SoundAI Azero智能操作系统全新升级,这标志着声智科技作为人工智能系统平台的旗舰型产品正式面世!
据悉,SoundAI Azero是声智科技基于全球领先的远场语音交互技术为企业、个人及第三方开发者免费开放的全链条AI操作系统,致力于连接有价值的信息、服务与设备,让智能服务随处可享。SoundAI Azero经过了数十亿次人机交互真实场景的规模验证,可为家居、办公、车载、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。SoundAI Azero默认集成了信息查询、影音娱乐、IoT控制等200+项常用技能与服务,同时提供简单好用的语音技能开发工具和一站式智能语音软硬件方案,可以极大降低AI行业应用的开发难度和使用门槛,快速满足不同用户和行业群体的个性化需求。
护城河初现,商业化空间不可限量
自2016年成立以来,声智科技便拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理(回声抵消、噪声抑制、声源定位、混响消除、波束形成等)、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、自然语言理解、自然语音合成等自主核心技术,硬核实力获得行业广泛认可。基于声学与人工智能技术领域的优势,声智科技推出了SoundAI Azero智能操作系统,并应用在新产品的研发中。
作为SoundAI Azero 智能操作系统在语音领域的垂直化解决方案, Azero智能系统可以让设备获得智能语音交互的能力,并帮助实现“智能互联”,让设备真正成为您的“智能助手”,应声而动。
构建智能语音生态的软硬件一体化方案
SoundAI Azero智能操作系统是声智科技多年积累之后,顺应潮流之作。
据了解,SoundAI Azero 与 Alexa 类似,同样提供了从声学结构设计、远场语音交互、技能服务开发的一站式全链条解决方案,但其目的又不只是做好「中文版的 Alexa」,而是基于声智科技在中文语音市场丰富的服务经验,在各个细节做精、做细,帮助设备厂商又快又好地实现产品开发和量产。
SoundAI Azero智能操作系统助力产品快速落地产品快速落地
语音交互方面,SoundAI Azero 集成了远场唤醒、波束形成、声源测向、噪声抑制、混响消除、回声消除、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话、自然语言处理、声波配网等多项技术,远场交互能力强,并支持硬件检测。
同时,SoundAI Azero 还支持自定义唤醒词。未来,设备商可以在 1~2 天内实现快速自定义唤醒词,以实现产品快速上市。而在产品上市之后,厂商还可以通过在线数据收集的方式来实现自定义唤醒词的迭代升级,让产品体验慢慢向「小爱同学」们靠近。
内容和服务方面,SoundAI Azero接入了市面上主流的音乐、有声读物、视频平台,以及信息查询、生活服务、出行路况等服务,并通过免费技能的方式开放给合作伙伴,确保设备从一开始就具备了语音交互基础的内容和服务。同时,SoundAI Azero还提供灵活的技能开发及接入方式,支持Android、Linux、QNX 等七种系统以及多种播放器,常用技能开发部署时间一周以内,可极大缩短开发周期。
为了帮助合作伙伴完成快速开发,在云端,SoundAI Azero 还支持「内容+IoT+APP」三云合一;设备端,SoundAI Azero 对 Turnkey 代码进行了开源。基于此,设备上最快可以实现7天完成快速开发工作。
在应用场景方面,SoundAI Azero 除了我们熟悉的智能音箱外,也将支持智能家居、智能会议、智能教育、智能医疗、智能汽车、金融科技、能源电力、智能法院、智能交通和机器人等多种应用场景下多个终端产品。
“Azero 智能操作系统不止是针对智能音箱,声智科技希望将语音引申到各行各业,用一套系统解决所有事情,降低中小客户在这方面的投入。”
目前,声智科技深耕智能家居、智能会议、智能教育、智能医疗、智能制造、智能汽车、金融科技、能源电力、智慧法院、智能交通和机器人等行业,与ARM、Cadence、NVIDIA、Xilinx、Bosch、Infineon、Risc-V、百度、腾讯、华为等著名公司和组织深度合作,服务小米、百度、阿里、华为、腾讯、中国移动、中国电信、奇虎360、中央人民广播电台、联想、创维、金蝶、浪潮、国美等众多客户。
关于声智
声智科技是融合声学和人工智能技术的平台服务商,致力于实现“让机器更智能”的使命,达成“用科技改善生活”的愿景,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,典型应用于智能家居、智能会议、智能教育、智能医疗、智能制造、智能汽车、金融科技、能源电力、智慧法院、智能交通和机器人等领域,拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理(回声抵消、噪声抑制、声源定位、混响消除、波束形成等)、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、自然语言理解、自然语音合成、超远场声学监控、超近场语音交互、分布场语音交互、深度学习与小样本学习、智能搜索与个性化推荐、知识图谱与智能分析、精准用户时空画像等自主核心技术。