AIoT道路上的未来语音芯片
基于上文描述的逻辑,未来语音芯片的变革机会,将基于新网络条件下的大批量、全场景设备拥抱AI。那么符合这样逻辑的语音芯片产品事实上还没有出现。而从这个角度看,行业的准入证依旧没有停止发放。
从今天音箱中的AI语音芯片,到未来无处不在的AIoT语音芯片,有这样几条变化之路才刚刚开启:
三低芯片
所谓三低,是指低成本、低功耗,低时延。5G时代的物联网设备,理论上来说应该是可以长时间待机,尽量贴近可移动化的。因为设备将部署在海量并发场景,这也就让语音芯片的基础要求是足够省电和足够便宜。理想中下一个阶段的语音芯片,是能够随时保持等待唤醒,但在等待唤醒状态下极低能耗的。未来的物联网芯片、语音芯片、视频处理芯片,其实很大一部分竞争将围绕三低展开。
云边端一体化
云端一体,这个词估计大家也都听腻味了。但是没有办法,客观来说,如果我们希望一台物联网设备执行复杂且实时化的交互和推理,那么它的内部必将是本地计算、云端计算以及网络条件高效配合的。而目前的智能音箱还停留在较简单的AI任务层面,语音芯片不需要对云端任务有太强的理解和配合。而基于目前对未来的想象,本地语音任务处理,一定会与云端高效配合,这要求芯片对云端的理解必须加深。尤其在安全层面要求更好的解决方案。
能够复杂排列与定制的芯片组合
AIoT设想中,一个很重要的因素在于单一场景的智能设备应用,可能是由大量不同能耗、不能功能、不同计算能力的设备组合而成的。比如在一家养殖场里,动物身上的语音传感设备、围栏栅栏的语音设备、监控系统的语音交互能力,都需要不同的语音功能、语音硬件来完成。于是,这也要求语音芯片的规格和制式必须复杂多样,能够进行基于统一平台的互联互通。很有可能,接下来语音芯片厂商会更多与垂直行业相结合,在车联网、智能家庭、智能医疗、城市安防等领域出现垂直于行业的语音芯片厂商。
多模态芯片的到来与崛起
在AI技术向产业化的发展中,今天一个很明显的趋势在于,多模态AI能力正在明显提速。尤其是将语音识别、语义理解,与机器视觉任务相结合的AI模型。如果想要让类似任务计算效率达成最优,那么在芯片端对多模态的加速就变得十分重要。也许未来我们需要的,是机器感官芯片,而非语音芯片或者多媒体芯片。
这些发展逻辑,各自对应了新的技术挑战与变化机遇。毫无疑问,今天中国的AI语音虽然看起来红火,但距离大规模量产应用,以及部分替代目前芯片进口需求还有十分漫长的路要走。
类似语音芯片的产业,在中国还有千千万万。我们只能勉励发展、聚拢人才,并谋求在新的技术剧变中发现调换座椅的机会。
过去我们确实失去了很多,好在我们还能想象未来。(作者:脑极体)