阿里走创“芯”路:要做“平头哥”

与非网 中字

和达摩院一样,“平头哥”目标也是最终独立化运作

2014年的时候,马云就开始想:要不要做芯片,如果要做的话该怎么做。

这个情景类似谷歌在2011年的抉择。那时候,谷歌开始认真考虑使用深度学习,因为深度神经网络需要消耗大量计算资源,如果每位用户每天使用3分钟谷歌提供的基于深度学习语音识别模型的语音搜索服务,谷歌就必须把现有的数据中心扩大两倍。因此他们需要更强大、更高效,而且更适合加速谷歌深度学习任务的芯片。

后来的故事大家都知道了。2016年,谷歌自研芯片TPU问世,这款张量处理器专门针对谷歌内部深度学习计算任务加速,到今年推出第三代TPU时,在特定领域加速深度学习的性能已经超越了当时最好的GPU。

TPU不会对外销售,与谷歌的TensorFlow绑定,并且通过谷歌云对外开放,只有谷歌云的用户才能享受到TPU加速的好处,这进一步又推进了云业务,可谓一举两得。

但阿里巴巴与谷歌不同,阿里更进一步,正式成立独立的芯片公司。

马云此前曾表示,物联网时代即将到来,人们需要更便宜、更有效、更有包容性和更安全的芯片。

和达摩院一样,平头哥的目标也是最终独立化运作,在前期由阿里巴巴集团给予足够的投入和支持,运行数年后形成盈利能力,最终成长为一家自负盈亏的企业。

达摩院芯片技术部负责人骄旸告诉新智元,选择哪个业务场景,做什么定制化芯片,以及后期如何做有针对性的优化,是到目前为止阿里芯片团队经历的最艰难的环节之一。

第一代Ali-NPU针对图像、视频任务加速,负责推理。

“如果用一个词来形容这款芯片,”骄旸告诉新智元:“我会用’敏捷’,一是这款芯片本身速度快,二是从开始构思到现在,我们在大约半年的时间内完成了架构设计到前端布局。”

骄旸说,最开始来还不了解阿里业务时,他们以为要做一款类似谷歌TPU的芯片。后来,“从传统电商、云计算到物流货运,阿里业务的广度和深度非常惊人。”骄旸说。这让做芯片架构师的他们很是兴奋,而面对一个如此广阔的业务场景,要设计与之相匹配的硬件架构,是机会,也是挑战。

通过全面深入的内部调研,他们决定从图像、视频处理加速做起,是因为阿里内部业务需求,也是由于在云端,数据中心,在智慧城市,检测和处理视频,在端侧,车载辅助驾驶系统、以及今后的自动驾驶系统,从算法的角度说,上述业务在本质上都是相似的。

“谷歌自研TPU,也是为了加速他们自己的深度神经网络任务,这只有通过内部研发,了解业务的真实需求才能实现。”骄旸说:“阿里的第一代Ali-NPU也一样。”

骄旸表示,这款AI芯片预计明年下半年面世,首批芯片将应用在阿里数据中心、城市大脑和自动驾驶等云端数据场景。未来,将通过阿里云对外开放,使语音识别、图像识别等AI能力可以在云端使用。

在模拟验证测试中,这款芯片的原型让铺设阿里城市大脑的硬件成本节约了35%。

今年4月,阿里巴巴全资收购中天微,中天微是中国大陆唯一拥有自主嵌入式CPU IP Core公司。当前,基于中天微CPU IP核的SoC芯片累计出货量已突破8亿颗。

全资收购中天微,只是阿里整个芯片布局上的一个节点。实际上,马云从更早的时候就开始关注中天微,包括后来对寒武纪、深鉴科技等AI芯片创业公司的投资,都属于阿里的芯片产业战略布局。

芯片是计算力的核心,而计算力则是所有人工智能应用的基础。

脉络梳理下来,阿里在芯片流片之前,就已经找对了应用的场景,并且已经对国内AI芯片明星独角兽企业投资,站住了AI底层算力的赛道,下一步,如何该考虑如何构建起阿里芯片的庞大生态。

芯片:马云退休前留下的“最宝贵”财产之一

阿里投资了寒武纪、深鉴等AI芯片公司,为何Ali-NPU还要全部自研?

骄旸表示,只有自己内部的人,才真正懂得内部业务的需求,从而设计并提供针对每项不同业务都能达到性能功耗比最优的硬件。

另一方面,与阿里内部强大的算法部门合作,也成为芯片团队独特的优势,让他们对阿里各个专用领域算法的发展有深刻的理解。做芯片,一般需要提前3~5年规划,制作出来,要能够满足3年后的算法和应用需求。因此,在AI算法和模型快速迭代变化的当下,对算法趋势和工具链发展的预判就显得尤为重要。

至于“平头哥”的使命,也并非是聚焦简单的产品层面,更是一种宝藏。

2017年,达摩院横空出世,马云说达摩院是比阿里更宝贵的资产,“要活得比阿里更长”,超过“102年”。

在提到公司寿命的时候,马云总是爱用“102”这个这个数字——阿里成立于1999年,102年后,恰好2101年,这样就跨越了3个世纪的时间。

2018年9月10日教师节,马云宣布将在2019年的教师节卸任阿里巴巴董事局主席一职。在正式退休前,马云已经为阿里埋下了几个重要宝藏:公益、阿里云、达摩院,再加上现如今的芯片。

自己做芯片研发,才能够让阿里从算法(Alogrithm)、大数据(Big data)到计算力(Compute),再到专用领域知识(Domain knowledge)和生态(Ecosystem),彻底实现“ABCDE”的闭环。

相比其他“ABC”的公司,从底层基础硬件到最终的应用,阿里生态能形成一套完整的自循环,既不会受制于人,还能随时向外扩展业务,展望102年。

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存