英特尔出手,RISC-V能否乘上AI大模型的快车?

雷科技
关注

RISC-V,能搭上AI大模型的快车吗?

去年3月份,英特尔在更换了新的CEO后,除了加大力度推进各个现有领域的研究计划外,还将投资的目光看向了固有市场之外的领域,比如正在悄然崛起的RISC-V。 

RISC-V对于多数人而言或许都是一个陌生的名词,但是在半导体领域,这个架构正在吸引越来越多的投资和关注,在国内,RISC-V被认为将会是我们弯道超车的机会,如阿里、华为等国内科技巨头都在押注该架构。 

实际上,RISC-V已经成为继x86和ARM之后的第三大架构,在全球市场占有一定的份额,当然,如果计算具体的份额占比,那么RISC-V距离x86和ARM还有一段相当遥远的距离。RISC-V的前身RISC,是曾经一度与CISC(x86)并驾齐驱,甚至在服务器等领域的占比还超过了CISC。

files-aHViPTYzODY3JmNtZD1pdGVtZWRpdG9yaW1hZ2UmZmlsZW5hbWU9aXRlbWVkaXRvcmltYWdlXzVkOGVhMzA3YzI5ZWYuanBnJnZlcnNpb249MDAwMCZzaWc9ZDNmZDEyYjVkZDUyMjQ3YTYyNzM1MDFmNzdlOTA1Njk253D.jpg

图源:wiki 

后来的故事大家都已经知道了,在与CISC的战争中,RISC最后成为落败的一方,市场被x86完全占领,随后整个RISC阵营近乎土崩瓦解,不少公司都开始转投其他市场和架构。但是,仍然有人没能忘记RISC,经过多年的整合与调整,被命名为RISC-V的第五代RISC架构正式发布,以此为基础,一个全新的RISC联盟成立,华为等企业目前都是该行业联盟的高级会员。 

在RISC联盟的高级会员名单中,英特尔的名字显然是最显眼的,作为曾经以一己之力击败RISC阵营的公司,英特尔主动加入这个联盟总有一种“黄鼠狼给鸡拜年”的感觉。不过,现在看来英特尔并非来搅局的,他们对于RISC-V架构有着自己的独特认知,并且正在将这个架构应用到自己的新产品线中。

6455b6e706f54fe98c497deb3a35e8d0.jpg

图源:RISC-V

“最了解你的,往往是你的敌人”,作为RISC架构曾经以及未来的最大对手,英特尔对RISC架构的研究其实一直没有暂停,所以也让他们有着更多的资本来融入这个新的联盟。在去年3月宣布投资10亿美元进行RISC-V架构的处理器研发后,经过一年半的时间,英特尔正式向外界公布了自己的成果——Piuma。

 一核六十六线程 

Piuma是一颗特殊的芯片,特殊在于它虽然只有8个核心,但是却有528个线程,单核拥有66个线程,可以说在Piuma面前,单论多线程性能所有的x86芯片都要自愧不如。令人惊讶的线程数背后,还有更恐怖的互联性能,基于特殊设计打造的光学互联芯片,可以让最多131072个Piuma芯片互连,组成一个拥有1680万个核心,1.384亿个线程和512PB共享内存的庞然大物。

hot-chips-2023-intel-piuma-die-package-logo-1030x438 (1).jpg

图源:intel

在这个规模的处理器阵列面前,传统的x86架构服务器多少有点不够看,在英特尔设计人员的计划里,Piuma能够以传统处理器百倍的速度处理图形分析工作。 

不过,Piuma并非一个很新颖的概念,类似的产品此前也诞生过,那么Piuma的特殊之处在哪里呢?特殊在英特尔联合另一家公司,为其打造了一个特殊的光纤互联系统。

微信截图_20230907154551.png

图源:intel 

在光纤的帮助下,Piuma的互联带宽高达1TB/s,使其能够快速传输数据,而且相较于传统的铜线连接,光纤的延迟要低很多,使得大规模处理器阵列的搭建变得更加轻松。 

或许大家都会好奇,传统的x86处理器往往只能做到单核双线程,Piuma是如何做到一核六十六线程的?又是如何在获得充足的多线程性能同时保持一定单线程处理能力的? 

据英特尔介绍,Piuma芯片内设计有六个数据管道,其中四个中内置了16个线程,用于处理零散且多的数据,此外还有两条管道则是单线程设计,线程性能是多线程管道中单条线程的八倍。

EioKYItU8AEwAl4.jpg

图源:intel

 

有点类似于如今主流x86处理器所采用的大小核设计,只不过两者的顺序有所调换,多线程管道低主频但是多并发,主要负责处理零散任务,当遇到需要更多性能去处理,或是任务集群执行到最后一个任务线程时,处理器会将任务转交给单线程管道,腾出多线程管道空间运行下一个任务。 

如此一来就能最大限度地利用各个线程,同时处理大量的零散数据,在遇到偶然的大体量任务时,则可以由高性能的单线程管道进行处理,避免其长时间占用多线程管道。 

同时,Piuma的八个内核都有独立的定制DDR5内存控制器,加上精简指令集的帮助,可以让单个最低访问粒度为8字节,远小于普通x86处理器的72字节,意味着Piuma可以更精准的调整内存占用,使得单核超线程的性能不会受制于内存调用。 

超大AI集群来了? 

传统的x86架构处理器面对这些低负荷却繁多的任务需求,往往难以发挥出单个线程全部的性能,100%的性能却只发挥出10%甚至更少,而且还无法同时对多个任务进行处理,导致性能大幅度空置。 

x86架构的优劣势就是如此,虽然该架构可以打造出目前半导体市场中单线程性能最强的处理器,但是面对多而小的任务时,疲弱的多线程设计往往让x86架构处理器无所适从。在这个方面,ARM的表现都远优于x86,随着图形分析等小体量却多次数的任务需求增加,x86架构已经难以应对这些繁复的工作。

但是,x86所不擅长的工作,却恰好是RISC-V的强项,作为一个更精简、高效且开放的架构,RISC-V的设计师可以轻松进行针对性修改,只需要遵循基础的指令集,就可以在此基础上打造出专属的处理器。 

简单打个比喻,如果你想打造一辆车,要求是在直线跑道里跑得足够快,x86却依然要求你留下诸如刹车、方向盘、转向装置等各种普通汽车该有的结构。而在RISC-V里,你可以将两个轮子装在一个火箭发动机上,然后宣布这就是你的新车,它或许无法处理多样化的任务,但是却能够跑出最高的直线速度。 

RISC-V的优势在于其不同于x86的指令集逻辑,RISC-V可以更高效地处理小体量但多次数的重复任务,通过更精确的任务分配,让每个线程都发挥出最大的性能,同时利用指令集特性快速分配任务线程,提高整个系统的运行效率。

hot-chips-2023-intel-piuma-chip-block-diagram.jpg

图源:intel

 

正是基于这个特性,Piuma才能够做到八核五百二十八线程的超级多线程设计,虽然单线程的处理性能远低于x86架构处理器,但是却可以满足多并发的任务需求。随着人工智能等市场需求的增长,阿里的平头哥等企业都在基于RISC-V架构打造对应的多并发处理器,如今已经活跃于各个领域。 

随着ChatGPT等AI大模型成为主流趋势,以RISC-V架构打造的处理器更符合AI大模型的实际运行场景,大量的短字节文字信息在常规的数据中心里处理会浪费大量的算力,而在以RISC-V处理器为核心搭建的数据中心里,短字节数据可以被精准分配到各个线程中处理,显著提升处理效率。 

不过,想要打造出英特尔计划中的超大处理器集群,还有许多问题需要解决,目前英特尔的Piuma芯片在实际使用时,光纤的带宽只有理论带宽的一半,而且因为光纤发热问题,导致在实际使用中故障频发,需要经常检查和更换光纤连接线,以至于英特尔目前最多也只是将两颗Piuma芯片进行连接而已。

微信截图_20230907154716.png

图源:intel 

可以说,在光纤材料的难题解决之前,英特尔设想的超大处理器集群都还只停留在PPT上,但是,如果可以解决材料问题,我们将可以创造出更契合AI大模型的服务器集群。

    来源:雷科技

           原文标题 : 英特尔出手,RISC-V能否乘上AI大模型的快车?

    声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
    侵权投诉

    下载OFweek,一手掌握高科技全行业资讯

    还不是OFweek会员,马上注册
    打开app,查看更多精彩资讯 >
    • 长按识别二维码
    • 进入OFweek阅读全文
    长按图片进行保存