投资界消息,1 月 7 日,人工智能企业云知声与吉利控股集团战略投资、独立运营的科技创新企业亿咖通科技合资公司——安徽芯智科技有限公司(简称:芯智科技)在合肥召开新闻发布会,宣布已成功流片业界首款车规级全栈语音 AI 芯片。
随着智能网联汽车时代的到来,人们在驾驶旅途中越来越追求快速、安全、精准的语音操控,以及真正具备自学习能力的智能语音 AI 助理。当下的车联网行业,语音交互更多的是依托云端的算力处理和反馈,而云到端、云到云到端之间的数据传输在无形中产生了更多的信息延迟。与此同时,在诸多网络环境不畅的场景下,智能语音 AI 助理的对话反馈、操作速度会受到严重影响,造成听不懂、不明白、答非所问的伪 AI 语音交互体验。
为此,作为国内为数不多拥有 AI 算法、计算能力、芯片能力全栈式技术链条的人工智能公司,云知声携手中国智能网联行业的领军企业——亿咖通科技共同投资成立芯智科技,在合肥市高新区有关部门与领导的大力支持与帮助下,落户声谷,致力于探索如何在智能座舱内充分挖掘端侧的算力及语音离线处理能力的全栈语音 AI 芯片,打造中国智能网联的核“芯”技术,提升广大车主的驾驶体验。
发布会现场,芯智科技产品副总裁孙晓欣代表芯智科技对该款芯片做了详细介绍。他指出,该芯片采用开源的RISC-V 架构,可充分满足架构灵活性与国产芯自主可控的需求。作为新一代高性能车规级语音专用芯片,该款芯片可以在复杂的环境下进行语音识别,通过采用面向深度学习和语音信号处理的AI 定制指令以及体系架构,极大提高了本地信号处理,语音识别及语义处理速度,延时更低,数据更安全。同时,芯片端云结合的混合应用架构设计,则可真正做到云端训练、本地部署,并可随着用户的习惯而自我学习升级,以此获得本地与云端能力的最佳平衡。
作为一款集音频信号处理模块、语音识别模块、离线分类引擎,自然语言处理模块、离在线仲裁模块、TTS 引擎、离线推理引擎于一体的全栈语音 AI 芯片,为了更好的应用于汽车领域,该芯片还垂直打通了汽车的数据,增强针对汽车场景的本地逻辑推理等边缘计算的能力;在隐私数据方面,芯片引入了本地加密存储单元,可以更好的包含隐私数据;同时,该款芯片支持多种人工智能算法学习和推导,处理包括感知、理解、分析、决策和行动等一系列任务,并且具有适应场景变化的能力。
综合而言,该款芯片具备如下显著功能与特点:
支持全球32+ 语言/方言
全栈语音本地引擎
针对车载场景的本地推理引擎
内存带宽利用效率比通用框架提升16-32 倍
利用硬件加速算法(FFT 等),比DSP计算效率提升13 倍;
支持CNN、DNN、RNN、LSTM 等神经网络算法,比CPU 提升64+ 倍
满足AEC-Q100(IC)Grade2,符合零失效(zero defect)供应链品质
管理标准ISO/TS 16949 规范(Quality Management System)
芯智科技 CEO 李重透露,该芯片将于今年一季度上车验证,并计划于年底准备量产。未来,芯片还将面向其他算法厂商开放,提供芯片上的整体车载交互代码开源,以及支持更多云平台与内容服务的自由接入,以期聚行业之力共同丰富与提升车内交互体验,为包括吉利车主在内的全球车主缔造最佳的用户体验。
作者:yorke