鲲云科技新一代星空X9加速卡量产,性能提升最高4.47倍,为AI服务器提供高性能算力支持

鲲云科技 中字

2021年4月17日,鲲云科技在第八届中国(上海)国际技术进出口交易会(上交会)上推出了新一代的星空X9加速卡,峰值性能52.4TOPS,实测算力最高可达到英伟达T4的4.47倍,面向高性能AI服务器提供高性能、低延时、高算力性价比的人工智能计算加速解决方案,助力智算中心、云计算中心、高性能计算等典型场景的应用和建设。目前该产品已经完成了量产,将于近期同浪潮完成产品适配,推出搭载星空X9加速卡的智算中心AI服务器。

鲲云创始人兼CEO牛昕宇博士展示星空X9加速卡

星空X9加速卡

星空X9加速卡

星空X9加速卡搭载4颗CAISA 芯片,全高全长,采用无风扇的被动散热设计。CAISA芯片为鲲云科技去年6月发布的全球首款定制数据流AI芯片,较同类产品在芯片利用率上有较大的技术突破,最高提升11.05倍,在实际应用中可以提供更高的有效算力。

鲲云创始人兼CEO牛昕宇博士展示CAISA芯片

得益于技术团队对底层架构的持续优化,最新的实测数据显示,X9加速卡仅用不到1/2的峰值算力,可以实现英伟达T4最高4.47倍的实测性能提升,算力性价比、芯片利用率、实测性能和处理延时等指标实现了业界领先,表现优异。

星空X9加速卡产品规格

同英伟达旗舰产品T4相比,星空X9加速卡在运行ResNet50, YOLO v3等算法模型时的芯片利用率提升了2.76-11.05倍,最高可以实现94.4%的芯片利用率。在性能方面,X9在运行ResNet50网络时性能可以达到6037.73FPS,相较T4性能提升1.12倍,运行YOLO v3、U-Net Industrial检测分割网络性能有1.99-4.47倍提升。在达到最优性能时,X9处理延时最低可达到2.65ms,处理速度相比T4提升35.73倍,适用于智算中心、云计算中心、高性能计算等对低延时有要求的高性能AI计算加速场景。

X9 vs T4 芯片利用率

X9 vs T4 性能(FPS)

X9 vs T4 延时(ms)

X9 vs T4 benchmark

随着智能化和智慧化的发展,智算中心、云计算中心等日益成为智慧时代社会运行的重要基础设施,对AI算力的需求也日益增长,星空X9加速卡的量产为底层的AI算力支撑提供了新的选择。鲲云科技还在现场展出了星空X3加速卡、星空X6A智能小站等AI硬件产品及智慧油田、智能安监、智能电网、智能制造等行业解决方案。

星空X9加速卡应用于浪潮4U服务器NF5468M5

星空X9加速卡

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存