最近科技圈的顶流非来自中国的AI公司--DeepSeek莫属。
1月27日,DeepSeek发布了其最新模型DeepSeek-R1,当天,DeepSeek应用在苹果应用商店的免费App下载排行榜中一举登顶中国地区和美国地区的榜首,在美国区的下载榜上超越了ChatGPT。
给大西洋彼岸的硅谷和华尔街带来一些小小的震撼。
异军突起,DeepSeek重塑AI市场格局
DeepSeek引发了美国AI概念股大跌风暴,不仅冲击了芯片制造商,还波及了为AI和数据中心供电的全产业链公司。
1月27日,DeepSeek发布其新AI模型后,美股市场出现了剧烈波动。其中,芯片巨头英伟达(NVIDIA)股价暴跌16.97%,市值在单个交易日内蒸发了约5926.58亿美元(约合人民币4.3万亿元),创下美股史上最大单日市值损失纪录。除了英伟达外,其他美国科技巨头也未能幸免。博通(Broadcom)股价下跌17.4%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2.14%,谷歌母公司Alphabet股价下跌超过4%。
黑神话的老板冯骥在微博表示:DeepSeek,可能是国运级别的科技成果。
大模型届的黑马就此突围,冯骥总结Deepseek的优势如下:
强大。比肩O1的推理能力,暂时没有之一。便宜。参数少,训练开销与使用费用小了一个数量级。开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。免费。官方目前提供的服务完全免费,任何人随时随地可用。联网。暂时唯一支持联网搜索的推理模型(o1还不支持)。本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。
上面的六条,DeepSeek全部、同时做到了。不仅在技术上打破了传统大模型的“不可能三角”——高性能、低成本和易用性,还通过开源策略推动了全球AI技术的普及和应用,大模型的市场格局将被重塑。
超高性价比,打响大模型价格战第一枪
DeepSeek的训练成本仅为558万美元,不到其他世界顶级大模型一次训练成本的十分之一。这也是DeepSeek给美股带来这次史无前例的崩盘的原因。
传统上,AI大模型的训练成本高昂,例如OpenAI的GPT-4训练成本高达数亿美元。而DeepSeek通过创新的模型架构和训练方法,将成本大幅降低,这使得其在市场上的竞争力显著增强。
怎么做到的呢?DeepSeek采用了混合专家模型(MoE)架构,通过稀疏激活机制大幅减少了计算量。想象一下,如果你有很多朋友,每个人都有自己擅长的事情,比如有的擅长数学,有的擅长语文。当你遇到问题时,你只需要找最擅长这个问题的朋友帮忙,而不是让所有朋友都来帮忙。DeepSeek的模型也是这样,它有很多“专家”,但每次只需要让少数几个“专家”工作,这样就节省了很多计算资源。
DeepSeek的R1模型不仅在性能上可比肩OpenAI的o1,而且在推理成本上也极具优势。所用的新模型训练成本约为欧美同类模型的1/50,运营成本仅为OpenAI的1/3,在推理能力上不相上下。
DeepSeek的高性价比对整个产业链都产生影响。以至于上游算力硬件企业英伟达等公司的股价在DeepSeek发布后出现了大幅下跌。另一方面,DeepSeek V3的发布引发了国产大模型的降价潮。DeepSeek V3的输入价格进一步降至0.5元/百万tokens,输出价格最低为8元/百万tokens,远低于Claude3.5-Sonnet、GPT-4o等。字节跳动旗下的豆包大模型也率先更新价格,其视觉理解模型的输入价格为0.003元/千tokens,相比行业平均价格降低了85%。
虽然深度求索创始人梁文峰表示,DeepSeek并非有意成为“鲇鱼”,而是按照自己的步调做事,核算成本定价,不贴钱也不赚取暴利。但可以肯定的是DeepSeek的低价策略已然推动了国产大模型的价格下降,也促使国际大厂如OpenAI等开始重新审视其定价策略。
日活突破2000万,DeepSeek未来能否保持势头
时至2月4日,DeepSeek上线5天日活就已超过ChatGPT上线同期日活,突破2000万,成为全球增速最快的AI应用,超越了ChatGPT发布初期的表现,展现出成为AI超级应用的潜力。
在云计算领域,DeepSeek获得华为云、腾讯云、阿里云和百度智能云等国内四大云巨头支持,它们为DeepSeek模型提供部署和推理服务,开发者可在云平台轻松调用其AI能力。国外云巨头 AWS 和微软也及时提供支持。全球云服务的支持,加速了DeepSeek技术推广,为开发者提供便捷开发环境,降低AI应用开发门槛。
DeepSeek在全球范围内大受欢迎的同时,也遭遇了网络安全威胁。2025年春节期间,DeepSeek官网曾遭受3.2Tbps的DDoS攻击,导致官网瘫痪48小时,全球客户和合作伙伴受到影响。此外,黑客还通过API渗透和权重投毒等方式,精准注入对抗样本,甚至发现了对DeepSeek的长期渗透痕迹。
这表明快速成长出圈的DeepSeek正在成为黑客和国家级攻击者的新目标。
在DeepSeek的技术突破也推动了中国从“技术跟随者”向“生态贡献者”的转型的同时,DeepSeek目前仍面临一些挑战。目前DeepSeek,尚未实现盈利,且其发展受到美国对高端芯片出口管制的限制。
在中美科技博弈下的DeepSeek未来几何,资深的新闻工作者和时事评论员胡锡进向Deepseek提问。
“他们封杀的是昨天的DeepSeek。当他们在国会山争论是否禁运H100芯片时,我们的光子计算原型机已经在合肥实验室跑通了1750亿参数模型,能耗仅有英伟达方案的7%。是的,GPU断供会让我们流点血,但动脉早就接上了国产替代的血管。”
求索不息,DeepSeek在博弈中诞生,也将继续在复杂多变的科技环境中继续前行,在未来解决技术突破、市场拓展与生态构建中寻求平衡的问题。
原文标题 : DeepSeek打破AI成本壁垒,开启市场新博弈