马斯克发布大模型Grok 3,号称性能超越DeepSeek和ChatGPT

Ai芯天下
关注

前言:

2023年11月,xAI发布了其首款大型模型Grok-1,该模型拥有3140亿参数,成为当时参数量最大的开源大型语言模型;

2024年8月发布的Grok-2,在性能上可与最新的ChatGPT模型相媲美。

该系列大型模型能够通过网络连接获取实时信息,并利用X平台(原推特)上的资讯,从而保持信息获取的时效性。

作者 | 方文三

图片来源 |  网 络 

图片

马斯克发布AI大模型Grok 3

埃隆·马斯克提前展示了其强大的AI技术,与OpenAI o1、DeepSeek-V3/R1等模型展开竞争。

在北京时间2月18日,马斯克领导的AI团队以类似发布会的形式,与三位技术负责人共同展示了Grok 3基座大模型。

此前,马斯克曾赞誉其为[地球上最聪明的AI]。

同时,xAI团队还公布了推理AI模型Grok3 mini(Reasoning,精简版),基于Grok 3的[深度思考](Deep thinking)的Agent智能搜索引擎,以及基于Grok App的独立订阅服务[Super Grok]。

图片

具体而言,Grok3模型的训练计算量(能力)比前一代提升了10倍,采用了20万张GPU卡集群进行训练。

在第一阶段,使用了10万个GPU进行了122天的全面训练同步;在第二阶段,又扩展到20万张GPU卡,再次进行了92天的训练和推理。

在技术参数方面,Grok 3模型配备了20万GPU,其计算能力相较于Grok2提升了10倍,同样是一个推理模型,并具备DeepSearch功能;而Big Brain功能则是通过更多的计算资源来解决问题。

依据xAI所提供的评估标准,Grok 3在科学、编程及数学领域的表现超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等竞争产品。

此外,在盲测环节,xAI的早期版本Grok-3在lmArena排行榜上以1402分的历史最高成绩荣登榜首,成为首个突破1400分的AI模型,这一成就超越了Google、OpenAI、DeepSeek等业界主要竞争者。

埃隆·马斯克强调,Grok-3能够降低AI的幻觉效应,其方法在于反复核查数据并努力实现逻辑一致性。

他进一步透露,相较于先前版本,Grok-3的训练过程消耗了更多的计算资源,并且大量应用了合成数据。

与DeepSeek算法优化路径(DeepSeek-V3使用2048个H800 GPU,训练耗时2788千小时)不同。

xAI公司透露,Grok-3的开发得益于一座名为Colossus的超级计算机,该计算机仅用8个月时间建成,由10万个英伟达H100 GPU提供动力,为训练提供了2亿个GPU小时,这一数字是Grok-2的十多倍。

马斯克还透露,Grok 3的语音交互功能即将推出,并承诺每次发布新版本时会开源上一个版本,这体现了xAI对技术透明度和共享的重视。

Grok 3发布后,业界普遍认为,特斯拉的FSD(全自动驾驶系统)以及特斯拉的人形机器人擎天柱可能是主要受益者。

有消息称,马斯克已经将Grok 3集成到特斯拉汽车中,利用特斯拉多年积累的车辆传感器数据和SpaceX的航天技术资料。

Grok 3能够实时解析道路积水深度、预测相邻车辆的行驶轨迹,甚至提前30天预测电池故障。

图片

Gork3架构中的深度搜索模块引人关注

此外,xAI正致力于为Grok打造深度搜索功能(DeepSearch),该功能预期将成为其AI体的关键能力之一。

DeepSearch是一款具备推理能力的聊天机器人,它能够详细解释其对查询内容的理解过程以及制定回复策略的方式。

展示中表明,DeepSearch具备研究、创意发散和数据分析等多项功能。

马斯克团队亦透露,他们计划[尽快]推出一款基于语音交互的聊天机器人。

该模块具备迅速检索并验证信息的能力,为用户提供精确的答案。

其设计理念借鉴了当前最先进的搜索引擎技术,并且Gork3在这一基础上进行了显著的改进和优化。

深度搜索模块不仅能够模拟人类的搜索行为,迅速检索大量信息,而且还能通过推理和验证确保信息的可靠性。

在搜索过程中,Gork3会展示一个高级进度条,实时反映其思考和搜索的进度。

搜索任务完成后,界面的右侧将呈现查询模型的启动摘要,涵盖浏览的网站、验证的来源等详细信息,并且通常会进行多源交叉验证,以确保答案的精确无误。

图片

结尾:在收购OpenAI未果后计划融资

在DeepSeek大型模型推出之后,业界开始关注是否还需要依赖[大规模堆叠芯片和计算资源]这种昂贵方式来推动AI的发展。

OpenAI的首席执行官奥尔特曼此前表示,DeepSeek使得OpenAI的领先优势不再像前几年那样显著。

他指出,在开源模型和研究成果方面,OpenAI已经站在了历史的错误一边,因此需要制定不同的开源策略。

在马斯克xAI新模型发布前数小时内,奥尔特曼通过推特发布了几条信息,试图转移公众对xAI发布会的注意力,释放了GPT-4.5、开源等关键信息。

实际上,马斯克领导的投资者财团在2月10日提出了以974亿美元收购OpenAI的提议。

马斯克的律师马克·托贝罗夫确认了这一消息,并表示已向OpenAI董事会提交了收购要约。

一旦交易完成,OpenAI很可能会与xAI合并,这将有助于xAI迅速缩小技术差距,并形成一个能与谷歌、微软等巨头竞争的AI企业。

如果这一收购计划得以实现,它将成为全球AI领域最大规模的并购交易,为全球AI行业未来的发展带来不确定性,并可能加剧马斯克与奥尔特曼之间的长期矛盾。

图片

然而,随着马斯克提出以974亿美元收购OpenAI的消息传出,奥尔特曼并未表示支持。

对于收购要约,他在社交媒体上回应称:[不,谢谢。但如果你愿意的话,我们可以考虑以97.4亿美元收购推特。]

2月16日,OpenAI董事会正式拒绝了马斯克的收购提议。

这一目标未能实现,同时xAI也面临着融资挑战。

据报道,xAI计划筹集约100亿美元资金,目前正在与潜在投资者如红杉资本、Andreessen Horowitz等进行接触,此轮融资可能使公司估值达到约750亿美元。

部分资料参考:钛媒体AGI:《马斯克Grok 3来袭,性能超DeepSeek,OpenAI加紧围堵》,华夏时报:《马斯克发布最新一代大模型Grok 3,多模态AI或改变未来出行体验》,ITPUB:《大模型战事再起,马斯克发布[史上最聪明AI]Grok 3,称超越DeepSeek》,算力豹:《马斯克推出Grok-3大模型:算力碾压、推理能力全球登顶,反击DeepSeek、OpenAI》,腾讯科技:《马斯克狂吹的Grok 3,终于发布了》

       原文标题 : AI芯天下丨热点丨马斯克发布大模型Grok 3,号称性能超越DeepSeek和ChatGPT

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存