商汤绝影CEO王晓刚:智能驾驶与智能座舱的发展路径

芝能科技
关注

在车展前的商汤绝影媒体沟通会上,商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚深入探讨了辅助驾驶与智能座舱的未来发展方向。

● 辅助驾驶正迈向生成式智能辅助驾驶阶段,世界模型与强化学习的结合将突破人类驾驶行为的局限,提升安全性和确定性。

● 智能座舱通过引入深度思考能力和多模态交互,致力于打造“家庭新成员”体验,打破体验同质化。

我们将从自动驾驶和智能座舱两个维度,结合王晓刚的观点,分析技术趋势、行业挑战及商汤绝影的战略布局,展望智能汽车产业的未来。

01

辅助驾驶:

从端到端到生成式

智能驾驶的跃迁

辅助驾驶技术经历了从基于物理模型的规则阶段到端到端数据驱动阶段的转变。

端到端模型通过输入图像和视频直接预测车辆行驶轨迹,模仿人类驾驶行为。这一模式高度依赖数据量和质量,尤其在复杂场景中,优质数据稀缺。

例如,90%的驾驶者在困难场景中可能选择停车,仅1%-10%的高水平数据具有学习价值,端到端模型存在不确定性:特定问题场景难以复现,模型更新后可能导致已解决场景的性能回退,统计性结果与自动驾驶对安全性和确定性的高要求相悖。 

辅助驾驶的下一阶段是“生成式智能驾驶”,核心在于世界模型与强化学习的协同。

世界模型通过3D重建和物理建模,精准模拟现实世界的物理定律、交通规则和运动规律,构建类似围棋棋盘的“虚拟环境”,强化学习通过反复模拟问题场景,优化端到端模型,解决特定场景问题并实现泛化,突破了人类驾驶行为的上限,还降低了数据采集的成本和风险。 

商汤绝影的“开悟”世界模型已取得显著成果,连续两年在Waymo挑战赛中夺冠。

2023年11月发布的1.0版本覆盖多种场景,2025年升级至2.0,进一步结合强化学习,形成云端与端侧协同的新范式,通过云端训练大模型并蒸馏至车端,适应不同算力水平的芯片架构,云端研发的比重将持续增加,算力中心等基础设施将成为竞争关键。

生成式智能辅助驾驶依赖云端训练,但车端算力需求依然重要,算力与模型应对复杂场景的能力呈正比。然而,类似DeepSeek的MOE(混合专家模型)架构通过优化参数激活,显著降低算力需求。

这种技术路线对车端部署大模型具有普适意义。商汤绝影通过MOE架构和工程化优化,在有限算力下实现高性能模型部署,为量产落地提供了可行路径。 

针对地平线创始人余凯“99%人类数据不值得学习”的观点,王晓刚表示认同其部分逻辑。

在端到端范式下,人类驾驶数据多为简单场景,信息量低,而复杂场景数据质量参差不齐。通过世界模型和仿真,商汤绝影能够重复问题场景并生成多样化数据,提升模型的确定性和安全性。

量产过程中,商汤结合自有采集数据与世界模型生成数据,迭代优化模型质量,确保时空一致性和场景多样性。

辅助驾驶安全性的提升离不开舱驾融合和驾驶员监控系统(DMS),DMS不仅需监测驾驶员状态(如疲劳、分心),还需通过3D视线追踪(Gaze)精准判断其关注目标。

在无保护左转场景中,DMS可确认驾驶员是否关注潜在风险车辆,从而决定采取激进或保守的驾驶策略。商汤通过与广汽、奇瑞、东风一汽等车企合作,量产J6M智驾方案和端到端智驾方案,进一步验证技术可靠性。

02

智能座舱:

从工具到家庭成员的体验升级

DeepSeek通过强化学习和思维链生成超越人类知识的数据,打破了语言模型的Scaling Law瓶颈,其表达生动幽默,深受行业关注。

直接将DeepSeek接入座舱并不适合,座舱交互场景要求简洁高效,冗长的推理过程和中间结果不适用于车内环境。

商汤绝影基于DeepSeek的核心技术,优化SenseAuto-chat模型,结合多模态推理,打造“一句话顶一万句”的交互体验,赋予座舱“有趣的灵魂”。智能座舱的同质化问题日益凸显,传统语言助手在交互能力上缺乏本质提升。

● 商汤绝影提出“家庭新成员”理念,将座舱从问答工具、功能助手升级为情感共情的伙伴。具体体现在以下技术突破:

◎ 无注册人脸识别与记忆生成:通过对话自动推断用户身份并记住面孔,结合互联网信息和交互历史生成个性化记忆,形成长期共情。例如,机器人可根据用户近期活动主动发起话题,缩短人车距离。◎ 免唤醒多人多轮对话:机器人时刻监听多人对话,理解上下文并主动参与讨论,甚至化解矛盾,提供情感调和。这种能力适配座舱多人交互场景,显著提升沉浸感。◎ 深度思考与多模态推理:商汤日日新6.0模型将DeepSeek的深度思考能力引入多模态,结合视觉、语音等多维输入,生成精准幽默的表达。

商汤绝影发布行业首个车载AI OS基础设施“绝影千机”,核心为AI内核,包含多模态模型、记忆功能、MOE架构和全时运行能力,商汤聚焦AI相关技术,与车企OS结合形成完整AI操作系统,并引入第三方智能体构建生态。

MOE架构适配低算力芯片,支持从0.几B到几十B的模型部署,确保高效体验。

● 商汤通过3D视线追踪、健康监测(心跳、血氧、血压)等技术,拓展座舱功能。

◎ 3D Gaze可识别驾驶员注视的车外目标,支持自动缴费、拍照分享等创新应用;

◎ 健康监测则提供主动关怀和安全预警,进一步融合舱驾功能。

在国内市场高度内卷的背景下,商汤绝影积极配合车企出海,满足2026年ENCAP对DMS和OMS的强制要求。

2024年,商汤已协助车企实现ENCAP最高分,未来将深化与合资和全球品牌合作,抓住海外市场对高阶智驾和智能座舱的需求增长。

小结

商汤绝影的战略布局展现了其对自动驾驶和智能座舱的深刻洞察,辅助驾驶领域,生成式智能驾驶通过世界模型和强化学习突破数据瓶颈,提升安全性和确定性;在智能座舱领域,“家庭新成员”理念以深度思考和多模态交互为核心,打破同质化壁垒。

商汤通过AI内核和操作系统生态建设,联合车企推动技术落地,同时积极布局海外市场,应对全球合规需求。

       原文标题 : 商汤绝影CEO王晓刚:智能驾驶与智能座舱的发展路径

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存