AI竞赛来到下半场,除了各家都在寻找AI落地的使用场景外,他们越发觉得自己一直被GPU的供应所限制。
整个行业好像被NVIDIA(英伟达)牵着鼻子走,老黄能拿出什么样的GPU,就决定了他们能搞出什么样的AI来。
并且,生成式AI越高越大,单靠英伟达一家,早就没法满足这些AI公司日益膨胀的胃口了。
据报道,英伟达性能最好的芯片 在 2024 年之前就已售空。芯片制造商台积电(TSMC)的CEO最近不太乐观,他表示英伟达以及其竞争对手的 GPU 短缺可能会持续到 2025 年。
这可不是巨头们想看到的结果。所以,微软等AI主力军纷纷下场自己搞芯片了。身为电商巨头的亚马逊自然不愿意掉队,也加入了这场“造芯”大战。
亚马逊的量子“芯”
今天,在亚马逊“AWS re:Invent 2023”活动中,亚马逊计算部门资深副总裁 Peter DeSantis推出了亚马逊的新量子芯片Trainium2 及 Graviton4 处理器。
亚马逊表示,Trainium2 的性能比 2020 年 12 月推出的第一代 Trainium 提高了 4 倍,能源效率提高了 2 倍。
Tranium2 将在 AWS 云中由 16 个芯片组成的集群中的 EC Trn2 实例中使用,在 AWS 的 EC2 UltraCluster 产品中可扩展到多达 100,000 个芯片。
亚马逊表示,十万个 Trainium 芯片可提供 65 exaflops 的计算能力,相当于每个芯片可提供 650 teraflops 的计算能力。
可能存在复杂的因素,使得餐巾纸后面的数学不一定非常准确。但假设单个 Tranium2 芯片确实可以提供约 200 teraflops 的性能,这使其远远高于2017 年左右谷歌定制 AI 训练芯片的能力。
亚马逊表示,由 10 万个Trainium芯片组成的集群可以在数周内训练出 3000 亿个参数的 AI 大语言模型。这大约是 OpenAI 的GPT-3大小的 1.75 倍。
亚马逊没有透露何时可以使用 Trainium2 实例,只是说在“明年的某个时候”。
亚马逊还推出了该公司第四款定制处理器芯片Graviton4,比前代性能提升 30%,内核数增加 50%,内存带宽增加 75%,可以帮助 Amazon EC2 云服务的各类工作负载提供最佳性价比和能效。
这款处理器还对所有高速物理硬件接口加密来提高安全性。
亚马逊声称,与在 Amazon EC2 上运行的上一代 Graviton 处理器Graviton3(但不是更新的Graviton3E )相比,Graviton4 的计算性能提高了 30%,核心数量增加了 50%,内存带宽增加了 75%。
亚马逊表示,在 Graviton3 的另一次升级中,Graviton4 的所有物理硬件接口都经过“加密”——表面上可以更好地保护具有更高加密要求的客户的人工智能训练工作负载和数据。
“Graviton4 标志着我们在短短五年内推出的第四代芯片,是我们为广泛的工作负载构建的最强大、最节能的芯片,”布朗在一份声明中继续说道。
“通过将我们的芯片设计重点放在对客户重要的实际工作负载上,我们能够为他们提供最先进的云基础设施。”
还有个新的AI助手
除了这两款重磅芯片,亚马逊在活动上还发布了一款全新的AI助手——Q。
按亚马逊的话来说,Amazon Q更多的是面向工作场景,不是为消费者准备的。
亚马逊云科技首席执行官亚当·塞利普斯基(Adam Selipsky)将其描述为能够“轻松聊天、生成内容和采取行动”,“一种新型的生成式人工智能助手,旨在工作中为你提供帮助”。
塞利普斯基说,考虑到这个聊天机器人的对话特性,Q这个名字来源于“问题”(question)这个词。这也是对詹姆斯·邦德小说中角色Q和《星际迷航》中人物的致敬。
要知道,亚马逊的创始人杰夫·贝佐斯是个狂热的《星际迷航》粉。
Amazon Q预览版目前已经上线,部分功能目前免费对外提供。未来,亚马逊最终将向企业用户收取每人每月20美元的费用,而为开发人员和IT人员提供功能的版本将收取每人每月25美元。
至此,OpenAI有ChatGPT,微软有Copilots,谷歌有Bard,亚马逊也有了Amazon Q。AI四大巨头聚齐,估计又要有一番大战了。
而我们,只想看血流成河!