(本文系紫金财经原创稿件,转载请注明来源)
2025年伊始,横空出世的DeepSeek上演了一场全球技术风暴,抢走了几乎所有AI大模型的风头。
在业内,DeepSeek的开源路线备受瞩目,甚至让OpenAI CEO山姆·奥尔特曼自省OpenAI站在了“历史的错误一边”。而DeepSeek低成本高性能的表现,更是打破了行业遵循“大力出奇迹”的原则,让大家看到了大模型的更多可能性。
不仅业内将DeepSeek视为颠覆者,DeepSeek更是破圈融入更多领域,不少AI行业外的用户也用起了DeepSeek,算命、聊天、工作,甚至还有人拿DeepSeek赚钱......上线仅仅20天,DeepSeek就突破了2000万日活大关,迅速超越ChatGPT成为全球增速最快的AI应用。
这家起源于中国杭州的科技公司,让人兴奋不已。过去“关于中国人工智能距离美国差距多远”的这个问题,有乐观者认为只有几个月,也有悲观的声音认为还有十年,两方的认知差距甚远,但DeepSeek的出现,似乎让人们看到了更清晰的光,原来中国的人工智能一直在亦步亦趋,择机超越。
DeepSeek的火热让国内用户更加自信,悲观者们也再次乐观起来。这是条搅动AI发展进程的鲶鱼,搅得全球人工智能赛道的选手们都不得不重新评估自身的技术水平及位置。DeepSeek技术水平如何,DeepSeek的成功,会是中国人工智能赶超美国的加速点吗?
颠覆全球AI行业格局
将时间回溯至两年前,2023年初,同样是春节,来自大洋彼岸的ChatGPT爆火,一场AI大模型浪潮轰轰烈烈地拉开了序幕。
彼时,ChatGPT无疑是这场AI浪潮当之无愧的引领者,而被誉为“ChatGPT之父”的Open AI CEO山姆·奥尔特曼,被《时代》周刊评为2023年度 CEO,也被媒体冠上“硅谷的造王者”之名。
Open AI的成功让行业一直跟随其发展路径,遵循“Scaling Law”原则,即认为更多的数据和更强的算力能够训练出更优秀的模型,坚信“大力出奇迹”。
此后,为了踏上这艘时代的AI大船,不少科技巨头们纷纷在数据和算力上投入巨资,试图买到通往AI世界的“船票”。而所有的努力并没有让他们快速胜出,反而成就了显卡霸主英伟达的万亿市值。
但DeepSeek的出现,打破了“大力出奇迹”的大模型原则。
根据公开资料显示,DeepSeek 的R1模型训练成本仅为560万美元,远远低于科技巨头们此前动辄数亿、数十亿美元的人工智能技术投入费用。
斯坦福大学计算机科学系和电子工程系副教授吴恩达也公开表示,OpenAI - o1模型每百万输出token的成本为60美元,而Deepseek-R1只需2.19 美元,成本差距将近30倍。
成本的大幅下降源于DeepSeek在算法、硬件利用率方面都做了革新。传统大模型遵循“预训练-监督微调(SFT)-强化学习(RL)”的三段式训练流程,其中SFT阶段需标注海量数据,成本占比超40%。DeepSeek-R1跳过了SFT阶段,使用“纯强化学习+冷启动”模式,直接用RL训练实现推理能力。
简而言之,SFT是人类生成数据,机器学习;而RL是机器生成数据,机器学习。
除了算法上的优化,DeepSeek将硬件利用率也推向极致。单GPU算力利用率行业平均是15%,而DeepSeek可以达到23%,不管是DeepSeek的FP8混合精度训练,还是动态序列长度调整,DualPipe并行架构优化,都在极大程度上榨干硬件潜能。
因此DeepSeek 采用性能更低、价格更便宜的次高端芯片就可以训练出性能不输ChatGPT的大模型。
低成本之外,DeepSeek也一反行业闭源路线,采取开源路线。在DeepSeek 创始人梁文锋看来,先有一个强大的、广泛的技术生态更重要。开源可以吸引更多大厂和技术人才涌入,共建共创一个更强大的人工智能大模型生态。
“低成本+开源路线”的组合拳,大大降低了AI应用的门槛,打破了传统AI巨头的垄断地位,让AI大模型的未来不再属于“算力霸权”,更多的中小企业也可以入局训练自己的AI,从而提供了更多的发展可能性。
可以说,Deepseek的出现几乎重塑了全球AI市场的竞争格局,催生了一个更开放、更普惠的AI生态。
加速中国人工智能赶超
不到一个月时间,大厂们纷纷接入DeepSeek。在国内市场,华为云、腾讯云、阿里云等头部云服务厂商率先行动。
华为云携手硅基流动,基于昇腾云服务推出了 DeepSeek - R1/V3 推理服务;腾讯云则利用其高性能应用服务HAI和TI平台,支持DeepSeek-R1的快速一键部署,整个流程仅需3分钟即可完成,并为用户提供了限时免费体验的机会;阿里云在PAI Model Gallery中也加入了对DeepSeek-V3和R1模型的一键部署支持,极大地简化了从模型训练到推理的全过程,同时采用按需计费模式,进一步降低了企业使用AI技术的成本门槛。
除此之外,百度智能云、京东云、火山引擎等平台也也相继跟进,积极拥抱DeepSeek。
不仅国内大厂迅速接入DeepSeek,海外科技大厂亦是如此。
微软Azure平台已将DeepSeek-R1整合至其Azure AI Foundry服务中,为企业级用户提供专业的AI解决方案;亚马逊则在Amazon Bedrock和SageMaker AI平台上实现了对DeepSeek-R1模型的部署支持,并借助AWS Trainium技术为用户提供更具成本效益的部署方案;英伟达通过NVIDIA NIM云原生微服务技术上线了DeepSeek-R1模型,
海内外的科技大厂们在如此短时间内集体接入DeepSeek,这是大模型诞生至今的独一份,是大厂们反复权衡后的选择。行业内能够迅速达成一致,认可DeepSeek,充分说明了其价值。
不过,DeepSeek收获了多少赞誉,同样也要承受多少质疑。以破局之姿出现,DeepSeek的影响力超出想象,这让很多国外的大佬们慌了。
马斯克第一时间质疑:“中国公司一定从美国获得了更高端芯片”。特朗普公开评论DeepSeek,称它在“给美国产业敲响警钟”,并呼吁“集中精力赢得竞争”。而在美国参议院外交关系委员会听证会上,智库代表公然提议“偷走中国最好的工程师”,试图引发人才战。
这些质疑声,无疑是另一个侧面证明——DeepSeek的出现让美国狠狠地焦虑了。
过去,关于中国人工智能和美国的差距,大家众说纷纭,有乐观的观点认为差距只有几个月,也有悲观者认为有10年差距。两方的想法差距甚远,但DeepSeek的出现,似乎让人们看到更清晰的光。
一方面,DeepSeek证明了中国人工智能在成本上的显著优势,依靠成本优势极有可能赶超美国。另一方面,DeepSeek通过开源路线正在构建自己的AI生态,更多开发者的加入,意味着技术的应用和迭代也将大大提速。
DeepSeek的破局,让中国AI企业首次站上技术制高点,这或许是中国人工智能赶超美国的重要加速点。
AGI之路并非坦途,DeepSeek也有难题
尽管AGI被视为技术革命的终极目标,但其发展路径充满技术、伦理与商业化难题。DeepSeek虽身披光环,但在推动AGI落地的过程中同样面临技术与现实的重重挑战,甚至它也有自己的“阴影”。
首当其冲的仍然是技术方面,模型能力与泛化性的难题。目前DeepSeek在文本生成这一单一任务中表现突出,但要想真正实现AGI,必须拥有跨领域推理和自主决策能力,这一步绝非易事。DeepSeek需要攻克多模态数据融合、模型泛化性等一系列技术瓶颈,确保AI系统能在不同场景下均能保持高精度与稳定性。
不可否认,科技巨头们生态系统更强大,数据积累、算力基础建设更多,也有更大的财力支持,在长远的AI竞争之下,DeepSeek还是得找到自己的“小米加步枪”式创新路径,以巧取胜。
其次,随着DeepSeek扩展到更广泛的企业级应用,也可能带来新的挑战。服务于大型客户、处理复杂实时数据的需求激增,对计算资源的消耗呈现出几何级增长态势,这无疑会加大成本控制与效率优化的难度。如何在保证服务质量的同时,有效控制成本,成为DeepSeek亟需解决的现实问题。
事实上,近期随着用户规模的快速扩张,服务器负载过重、响应延迟等问题已经暴露出DeepSeek在应对大规模应用时的短板,这要求DeepSeek必须在技术架构与服务模式上进行深度革新。
另外,DeepSeek也面临着激烈的竞争和开源压力。OpenAI、谷歌在AGI领域形成技术壁垒不可忽视,尤其是OpenAI通过多模态模型Sora和智能体AIAgent已经构建起应用生态,涵盖智能写作、图像生成、智能交互等多个领域,用户粘性极高。如果DeepSeek聚焦单一领域,很可能在这场激烈的竞争中逐渐丧失优势。
并且开源社区的压力会迫使DeepSeek权衡技术保密与开放协作,如何在保持竞争力的同时融入全球AGI生态,也是DeepSeek未来的战略难题之一。
结语
DeepSeek的横空出世,无疑为全球AI领域注入了一股强大的新生力量。它以低成本高性能的创新模式和开源路线,打破了传统 AI 巨头的垄断格局,重塑了全球 AI 市场的竞争生态,也为中国人工智能赶超美国带来了新的希望与可能。
然而,AGI之路并非一蹴而就,DeepSeek在追求技术巅峰的同时,也面临着诸多挑战与难题。从模型能力与泛化性的技术瓶颈,到成本控制与效率优化的现实困境,再到竞争压力与开源社区的权衡考量,每一步都充满了未知与变数。
当然这些挑战很多都是行业需要共同面对的命题,DeepSeek 此前的成功已经证明了其创新能力和无限潜力,如何在人工智能赛道上走得更远,需要DeepSeek的缔造者们更为成熟的考虑。
不管怎么说,DeepSeek带来的不仅是技术上的追赶,还有新的信心。信心之下,也许正在孕育孵化更多的可能。
原文标题 : DeepSeek是中国人工智能赶超美国的加速点吗?