“
手握60万块H100,押注元宇宙和AI双赛道
”
作者 | Xuushan编辑|蔓蔓周公司市值达到千亿市值、重构人们社交网络以及大学辍学生。
在今天的计算机图形会议SIGGRAPH上,英伟达创始人兼首席执行官黄仁勋用三个关键句介绍了刚40岁的Meta创始人兼CEO马克·扎克伯格。
这也是扎克伯格第一次亲临SIGGRAPH现场,受黄仁勋邀请作为炉边谈话的嘉宾出席。两人不但在会上分享了不少私交趣事,会上小扎还和黄仁勋互换了皮夹克。
事实上,Meta一向与英伟达的关系紧密,其刚发布的Llama 3.1 405B模型采用了16000个H100 GPU进行训练。今年一月,扎克伯格在社交媒体上透露,计划今年年底前向英伟达购买35万个H100 GPU芯片。如此一来,Meta的GPU数量将达到60万,毫无疑问,Meta是英伟达当下最重要的客户之一。
不仅如此,英伟达也是Meta的重要客户之一。访谈中,黄仁勋介绍到英伟达内部正在使用Llama 3.1 405B达大模型,并为其优化。“Llama 2的发布是去年AI领域最大的事件。它激活了各行各业。”他还说道。而Llama 2采用的正是英伟达的A100 GPU芯片。
此外,英伟达和Meta同样在元宇宙领域关系紧密,这是目前为数不多仍在坚定投资元宇宙方向的两大北美科技巨头。黄仁勋谈及智能眼镜正好赶上了生成式AI的热潮,并提及Ray-Ban智能眼镜将AI引入虚拟世界的愿景,与英伟达将AI大模型引入Omniverse的想法不谋而合。
两大北美科技巨头的灵魂人物齐聚一堂,他们正在密切关注哪些AI突破?又在交流中透露出哪些最新信息?我们梳理了此次炉边谈话中四大关键信息,一文看穿Meta想要成为生成式AI领头者的愿景与野心。
01
AI正在重塑推荐方式Meta想用单一模型“统一”多系统
“所有和生成式AI有关的东西,都是有趣的革命。”扎克伯格说道。他提到,目前Meta旗下的社交全家桶已经在生成式AI的影响下发生不小的变化,像是Instagram、Facebook上的推荐系统,正在被AI重塑。
扎克伯格:“过去20年社交媒体的核心内容正在不断演变,今天也是。”
他认为过去的推荐系统,是推荐来自不同领域的公共内容,并不重视推荐内容的排序。但如今,在生成式AI的影响下,社交媒体的推荐系统不但会帮助你关注最新的朋友进展,还会帮助你关注一些重要事情的发生。
现阶段,你在Instagram上看到的大部分内容会是,世界各地和你兴趣相同的人正在关注的信息。除此之外,创作者还可以通过AI工具,随时创造新的内容,或者将不同的现有内容快速整合在一起。
黄仁勋认为推荐系统是世界上最大的计算系统之一。
大,也就意味着其内部数据非常复杂。扎克伯格认为推荐系统像是Transformer架构一样,要建立越来越多通用模型,将一些非结构的数据嵌入其中,而不是用不同的模型去处理不同类型的内容。
扎克伯格举了个例子,Meta内部会有一个模型来做短视频的排名和推荐,而另一个模型来做长视频的排名和推荐。然后通过一些处理,让推荐系统既可以推荐短视频,也可以推荐长视频。如果能够建立更通用的AI模型,推荐系统的推送内容则会更加精准。
“我有一个梦想是,Instagram、Facebook都用一个AI大模型,但该模型包含了不同类型的内容和系统,且在不同的时间里会有不同的目的。”他说道:“比如说早上是推荐你今天想看的有趣内容,但是下午则是帮助你建立你的社交网络。”
02
Meta推出AI studio人人皆可创作AI分身
生成式AI正在重塑人们的工作流程和产品的重大升级进程。扎克伯格希望从打造一个AI助手,能够帮助我们完成不同类型的任务,且会提出一些创造性的想法。“它们可以回答任何问题。”
他还透露道Llama 3以及Llama 4的升级方向。“AI不再像是一个聊天机器人,仅会回应用户的问题,而是用户给AI一个意图,AI可以给你拟出该想法在不同框架中执行出来的结果会是什么样的。这些任务如果要一一实现,那么用户可能是几周到几个月后才能拿到结果。”
“这有点像搭建决策树,有的时候我们做决定并非仅思考单点问题。”黄仁勋总结道。随后,他又提及Meta的创作者AI愿景。
Meta刚刚推出AI studio平台,为每个AI创作者提供丰富的“工具箱”,帮助其打造自己的AI助手,或者为企业打造互动式的Agent。“你可以把你创作的Agent训练成为你,从而代替你和多方进行互动。这几乎像是一件艺术品。”扎克伯格说。
他还提到如今的AI Agent还可以帮助用户提高自己的社交能力。比如说,“我向经理提加薪”、“我和女朋友吵架了,怎么办?”通过这些模拟提问,用户可以预测对话的走向,并提前准备。
多样化的创作也会带来更多的趣味性。“人们不想和同一个Agent进行互动,不管是Meta AI还是ChatGPT,人们只想和自己的Agent互动。这也是AI Studio发展的方向。”他分析道。
他觉得未来每个企业都会有自己的AI Agent,就像现在的邮箱、社交账号一样。他还透露Meta的AI Studio商业版将会有更多的服务支持。
03
Meta因开源省几十亿美元正搭建开放AR/VR系统
Meta同样是目前为数不多,坚持开源的科技巨头。Meta不但开源了AI框架PyTorch,而且还开源了Llama 3.1和Llama大模型。
当被问及Meta的开源哲学,扎克伯格坦白一部分原因是因为Meta在其他科技公司之后才搭建分布式计算基础设施和数据中心,失去了一定程度的竞争优势。因此,他们希望通过开源的方式从生态系统中获益。
通过公布服务器设计、网络设计和数据中心设计,供应链围绕这些基础设施搭建起相关体系,Meta也节省了数十亿美元。其中英伟达正是通过Meta的开放计算,设计了Nvidia HGX。
扎克伯格分析认为,在过去几十年互联网的变革中,封闭生态与开放生态分别统治了不同时期。网站时代,开放生态获胜。移动时代,以苹果为代表的封闭生态获胜。PC时代,则是以微软Windows生态为代表的封闭生态获胜。“我希望在下一代计算中,开放生态将会再次成为领先者。”他透露如今Meta正在通过Llama AI 在AR和VR设备中搭建一个开放操作系统。
当然,他也解释道Meta开源并非是利他主义,而是因为只有开源才能让自己构建的东西更好。
会上,Meta还推出了Segment Anything Model 2 (SAM 2)。这是Meta Segment Anything Model的最新产品,也是第一个可实时提示将视频和图像进行分割的通用模型。Meta同样开放了SA-V数据集,其中包括大约 51000 个真实世界视频和超过 600,000 个masklet。
官网介绍:https://ai.meta.com/blog/segment-anything-2/体验链接:https://sam2.metademolab.com/
黄仁勋也对此补充道,英伟达正是通过Meta的开源数据,打造了AI Foundry,帮助企业将AI数据存在任何地方,并设立好安全信息防护。如今,英伟达正在通过Llama微调,打造不同类型的AI,如芯片设计AI、软件编码AI,帮助企业分类相关的bug,并发送给合适的工程师。
“如果你还没有雇佣AI,马上去做。”黄仁勋笑道。
04
押注下一代计算平台AI或成突破点
如今,AI在计算机视觉领域的应用广泛。但除了AI识别不同的人与物之外,视频理解模型与视频语言模型还能做些什么呢?
扎克伯格对此的回答是:为下一代计算平台服务。他认为,AR眼镜将会成为下一代计算平台的移动版,而MR头显将成为工作站和主机。
目前,Meta正在推动构建AR眼镜的相关产业发展,如显示技术、芯片等等。Ray-Ban智能眼镜虽然广受欢迎,但并不是全息AR眼镜,Meta计划未来几年会推出新的全息眼镜(刚开始可能价格会很高)。同时,Meta还在打造一些时尚好看的智能眼镜。扎克伯格希望在这些外观时尚的眼镜中塞入更多的功能,像是扬声器、麦克风、耳机等等。
五年前的扎克伯格坚定全息AR眼镜将会比AI更早到来,但如今,行业形势已经发生了转变。他认为不具备显示功能的智能眼镜将会拥有数百万的用户规模,而可互动式的AI增强了用户使用智能眼镜的趣味性。
黄仁勋畅想到未来他可能有一个Jensen AI,通过智能眼镜阅读过自己看过的所有文字,并且可以通过麦克风了解自己的回答方式,并训练出自己的语言风格。日复一日的积累下,AI将成为真正的助手和伴侣,并且不带有任何批判性,甚至你只要给它一个主题,它就能自己起草几个不同版本的内容。
▼
AI与元宇宙两手抓Meta重回新生
从2021年宣布公司改名以来,Meta一直饱受争议,股价更是连连下跌。但生成式AI的爆发,又让Meta重新站回北美科技巨头的队列中。
如今Ray-Ban智能眼镜在海外颇受欢迎,Meta官方也透露如今Ray-Ban智能眼镜的销售速度比生产速度更快。Ray-Ban智能眼镜和AI的联动,又让Meta在元宇宙赛道拥有了新的竞争优势。
此次与黄仁勋的对谈中,双方还透露了不少私交甚好的消息,也进一步巩固了英伟达与Meta合作信息。
Meta在AI赛道和元宇宙赛道的双重布局,是否能成为它拿到下一个时代的船票?我们也将持续关注。
原文标题 : Llama 4最新消息来了!黄仁勋、扎克伯格对谈一文浓缩,揭开Meta布局AI野望