马斯克发布大模型Grok 3，号称性能超越DeepSeek和ChatGPT

前言：

2023年11月，xAI发布了其首款大型模型Grok-1，该模型拥有3140亿参数，成为当时参数量最大的开源大型语言模型；

2024年8月发布的Grok-2，在性能上可与最新的ChatGPT模型相媲美。

该系列大型模型能够通过网络连接获取实时信息，并利用X平台（原推特）上的资讯，从而保持信息获取的时效性。

作者 | 方文三

图片来源 | 网络

马斯克发布AI大模型Grok 3

埃隆·马斯克提前展示了其强大的AI技术，与OpenAI o1、DeepSeek-V3/R1等模型展开竞争。

在北京时间2月18日，马斯克领导的AI团队以类似发布会的形式，与三位技术负责人共同展示了Grok 3基座大模型。

此前，马斯克曾赞誉其为[地球上最聪明的AI]。

同时，xAI团队还公布了推理AI模型Grok3 mini（Reasoning，精简版），基于Grok 3的[深度思考]（Deep thinking）的Agent智能搜索引擎，以及基于Grok App的独立订阅服务[Super Grok]。

具体而言，Grok3模型的训练计算量（能力）比前一代提升了10倍，采用了20万张GPU卡集群进行训练。

在第一阶段，使用了10万个GPU进行了122天的全面训练同步；在第二阶段，又扩展到20万张GPU卡，再次进行了92天的训练和推理。

在技术参数方面，Grok 3模型配备了20万GPU，其计算能力相较于Grok2提升了10倍，同样是一个推理模型，并具备DeepSearch功能；而Big Brain功能则是通过更多的计算资源来解决问题。

依据xAI所提供的评估标准，Grok 3在科学、编程及数学领域的表现超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等竞争产品。

此外，在盲测环节，xAI的早期版本Grok-3在lmArena排行榜上以1402分的历史最高成绩荣登榜首，成为首个突破1400分的AI模型，这一成就超越了Google、OpenAI、DeepSeek等业界主要竞争者。

埃隆·马斯克强调，Grok-3能够降低AI的幻觉效应，其方法在于反复核查数据并努力实现逻辑一致性。

他进一步透露，相较于先前版本，Grok-3的训练过程消耗了更多的计算资源，并且大量应用了合成数据。

与DeepSeek算法优化路径（DeepSeek-V3使用2048个H800 GPU，训练耗时2788千小时）不同。

xAI公司透露，Grok-3的开发得益于一座名为Colossus的超级计算机，该计算机仅用8个月时间建成，由10万个英伟达H100 GPU提供动力，为训练提供了2亿个GPU小时，这一数字是Grok-2的十多倍。

马斯克还透露，Grok 3的语音交互功能即将推出，并承诺每次发布新版本时会开源上一个版本，这体现了xAI对技术透明度和共享的重视。

Grok 3发布后，业界普遍认为，特斯拉的FSD（全自动驾驶系统）以及特斯拉的人形机器人擎天柱可能是主要受益者。

有消息称，马斯克已经将Grok 3集成到特斯拉汽车中，利用特斯拉多年积累的车辆传感器数据和SpaceX的航天技术资料。

Grok 3能够实时解析道路积水深度、预测相邻车辆的行驶轨迹，甚至提前30天预测电池故障。

Gork3架构中的深度搜索模块引人关注

此外，xAI正致力于为Grok打造深度搜索功能（DeepSearch），该功能预期将成为其AI体的关键能力之一。

DeepSearch是一款具备推理能力的聊天机器人，它能够详细解释其对查询内容的理解过程以及制定回复策略的方式。

展示中表明，DeepSearch具备研究、创意发散和数据分析等多项功能。

马斯克团队亦透露，他们计划[尽快]推出一款基于语音交互的聊天机器人。

该模块具备迅速检索并验证信息的能力，为用户提供精确的答案。

其设计理念借鉴了当前最先进的搜索引擎技术，并且Gork3在这一基础上进行了显著的改进和优化。

深度搜索模块不仅能够模拟人类的搜索行为，迅速检索大量信息，而且还能通过推理和验证确保信息的可靠性。

在搜索过程中，Gork3会展示一个高级进度条，实时反映其思考和搜索的进度。

搜索任务完成后，界面的右侧将呈现查询模型的启动摘要，涵盖浏览的网站、验证的来源等详细信息，并且通常会进行多源交叉验证，以确保答案的精确无误。

结尾：在收购OpenAI未果后计划融资

在DeepSeek大型模型推出之后，业界开始关注是否还需要依赖[大规模堆叠芯片和计算资源]这种昂贵方式来推动AI的发展。

OpenAI的首席执行官奥尔特曼此前表示，DeepSeek使得OpenAI的领先优势不再像前几年那样显著。

他指出，在开源模型和研究成果方面，OpenAI已经站在了历史的错误一边，因此需要制定不同的开源策略。

在马斯克xAI新模型发布前数小时内，奥尔特曼通过推特发布了几条信息，试图转移公众对xAI发布会的注意力，释放了GPT-4.5、开源等关键信息。

实际上，马斯克领导的投资者财团在2月10日提出了以974亿美元收购OpenAI的提议。

马斯克的律师马克·托贝罗夫确认了这一消息，并表示已向OpenAI董事会提交了收购要约。

一旦交易完成，OpenAI很可能会与xAI合并，这将有助于xAI迅速缩小技术差距，并形成一个能与谷歌、微软等巨头竞争的AI企业。

如果这一收购计划得以实现，它将成为全球AI领域最大规模的并购交易，为全球AI行业未来的发展带来不确定性，并可能加剧马斯克与奥尔特曼之间的长期矛盾。

然而，随着马斯克提出以974亿美元收购OpenAI的消息传出，奥尔特曼并未表示支持。

对于收购要约，他在社交媒体上回应称：[不，谢谢。但如果你愿意的话，我们可以考虑以97.4亿美元收购推特。]

2月16日，OpenAI董事会正式拒绝了马斯克的收购提议。

这一目标未能实现，同时xAI也面临着融资挑战。

据报道，xAI计划筹集约100亿美元资金，目前正在与潜在投资者如红杉资本、Andreessen Horowitz等进行接触，此轮融资可能使公司估值达到约750亿美元。

部分资料参考：钛媒体AGI：《马斯克Grok 3来袭，性能超DeepSeek，OpenAI加紧围堵》，华夏时报：《马斯克发布最新一代大模型Grok 3，多模态AI或改变未来出行体验》，ITPUB：《大模型战事再起，马斯克发布[史上最聪明AI]Grok 3，称超越DeepSeek》，算力豹：《马斯克推出Grok-3大模型：算力碾压、推理能力全球登顶，反击DeepSeek、OpenAI》，腾讯科技：《马斯克狂吹的Grok 3，终于发布了》

原文标题 : AI芯天下丨热点丨马斯克发布大模型Grok 3，号称性能超越DeepSeek和ChatGPT

马斯克发布大模型Grok 3，号称性能超越DeepSeek和ChatGPT

相关推荐