回归小镇青年，DeepSeek的草根狂欢

文源 | 源媒汇

作者 | 谢春风

编辑 | 苏淮

DeepSeek几乎承包了今年春节期间的大半热度。

截图来源于DeepSeek官网

国产AI独角兽DeepSeek的意外出圈，令其创始人梁文锋的家乡——广东湛江吴川覃巴镇米历岭村吸引了众多游客前往“打卡”。甚至还有建筑风水师拿着罗盘，研究起米历岭村的房屋布局和梁文锋的家宅布局。

一时间，科技与玄学巧妙“相融”。

在国内大厂以及国际巨头纷纷倾力押注AI大模型的市场背景下，DeepSeek，这家由量化私募公司幻方量化（下称“幻方”）孵化的大模型公司，团队核心成员仅百余人，没有铺天盖地的发布会，却以“能用、好用、用得起”的口碑悄然渗透市场。

DeepSeek的崛起，不仅曾引发美国科技股的大幅下跌，甚至迫使行业掀起价格战。

而梁文锋本人更因豪捐上亿善款、拒绝资本裹挟的姿态，成为中国AI领域的一股清流。

一场“沉默”的技术革命

与多数AI公司依赖资本“造势”不同，DeepSeek的春节走红充满“草根性”。

主要体现在两个方面：

第一，技术下沉。例如，DeepSeek开源的7B小模型，在英特尔至强CPU上即可运行，让县城中学能用老旧机房开展AI教学，甚至县城程序员用它调试代码。此外，DeepSeek开源的数学推理模型，更被中小科技公司接入业务系统；

第二，极致性比价。例如，DeepSeek-R1和DeepSeek-V3等模型的API调用价格低至0.14元/万token，仅为行业均价的1/20。河南某农产品电商，借此将智能客服成本压缩92%。

支撑DeepSeek“极致性价比”的，是幻方从量化交易中淬炼出的生存哲学——自研“动态计算图”技术，让同一批GPU可并行训练3个模型，硬件利用率达89%，远高于行业平均水平；训练数据清洗引入量化风控模型，将无效数据标记率提升至93%，百亿参数模型训练成本控制在800万元内。

不同于大厂执着于万亿参数竞赛，DeepSeek专注提升“单位算力产出效率”。其13B参数模型在法律文书审核场景击败多家千亿级大模型，核心在于对合同条款、行业术语的精准理解——这源于幻方量化团队多年处理金融法律文本的经验迁移。

此外，梁文锋坚持“用量化交易的钱养AI研发”。其曾表示，作为出资人之一的幻方，有充足的研发预算，另外每年有几个亿的捐款预算，之前都是给公益机构，如有需要亦可做调整。同时，还有分析称，幻方将每年净利润的90%投入技术攻坚，团队成员甚至自愿将年终奖转为研发基金。

这种模式，避开资本对短期回报的追逐，但也暗藏风险——2023年A股波动导致幻方研发资金同比减少18%，团队不得不暂停两个长期项目。

第一桶金与“不差钱”的底气

2016年成立的幻方，最初只是杭州一家低调的量化私募基金，团队不足20人，却凭借AI算法在二级市场屡创收益神话。

幻方的财富密码始于量化交易。梁文锋团队早年开发出一套基于机器学习的高频交易系统，在2015年A股波动中逆势斩获300%年化收益，迅速积累数十亿资本。

至2022年，幻方管理规模突破千亿，成为亚洲最大量化私募之一。同年，幻方和员工向慈善机构捐赠共计约3.6亿元，其中一名员工以个人名义捐赠1.38亿元。该捐赠人也被外界锁定为梁文锋。

图片来源：幻方量化公众号

“不差钱”的梁文锋，甚至多次公开表示：“幻方不需要融资，我们赚的钱足够养活创新。”

之后，梁文锋团队将量化领域的AI技术积累迁移至大模型赛道，成立DeepSeek，仅用3年时间便冲至全球大模型竞技场第二梯队，与谷歌、Meta同台竞技。

天眼查显示，杭州深度求索人工智能基础技术研究有限公司（下称“深度求索”）成立于2023年，由宁波程恩企业管理咨询合伙企业（有限合伙）和梁文锋分别持股99%和1%，而前者亦为梁文锋控股公司。

DeepSeek运营主体便是深度求索。

相较于OpenAI数千人的团队和百亿美元投入，DeepSeek核心团队仅百余人，研发成本不足行业巨头的1/10。其开源模型DeepSeek-Math在GSM8K数学推理测试中超越GPT-4，而API价格仅为GPT-4的1/50。这种“极致性价比”直接冲击市场，倒逼阿里、百度等大厂降价应战。

DeepSeek崛起背后，是近乎“疯狂”的技术投入。

曾被小米创始人雷军以千万年薪招揽的DeepSeek开源大模型DeepSeek-V2的关键开发者之一，被誉为“天才AI少女”的罗福莉，曾直言：“在幻方，技术理想比商业回报更有吸引力。”

DeepSeek的崛起，侧面反映出国产芯片行业的当前困局。

中国需要100个DeepSeek

“中国AI芯片的问题不在制程，而在生态。”

“如果我们能让国产芯片的算法效率提升30%，就能撕开一道口子。”

在近期央视访谈中，梁文锋如是谈到。

为了规避英伟达限制，DeepSeek使用华为昇腾910B训练模型，但算子兼容性问题导致训练效率降低40%，团队不得不用30%工程师人力开发转换工具。对此，梁文辉认为，这原本该是芯片厂商的工作。

此外，也有业内观点认为，如果中国AI只能在英伟达芯片和OpenAI论文基础上修修补补，这不过是另一种形式的代工。

当多数公司焦虑“何时做出中国版GPT-4”时，幻方用数学思维重新定义竞争维度——不做参数规模的奴隶，而是深耕“输入1度电，产出10倍智能”；

当行业沉迷资本故事时，幻方证明，用量化交易的“快钱”支撑硬核科技的“慢研发”，并非天方夜谭；

当全球追逐通用人工智能（AGI）圣杯时，中国或许更需要1000个深度改造制造业、农业、小微企业的“专用智能”。

春节假期结束第一天，DeepSeek社区出现一条高赞留言：“我们县城程序员用你的模型接了三个订单，养活了一个五人小团队。”这或许才是中国AI最真实的生命力——不在融资新闻的头条里，而在无数普通人用技术改善生活的细节中。

当全球AI陷入千亿美金“军备竞赛”时，梁文锋与幻方提供了一种反主流叙事——用数学家的极致理性、工程师的务实创新，以及近乎偏执的成本控制，证明“聪明资本”与“技术理想主义”可以共存。

这或许正是中国AI破局的关键密码：不需要另一个OpenAI，而是需要100个DeepSeek。

冷峻又务实，或为国产AI的未来。

部分图片引用网络如有侵权请告知删除

原文标题 : 回归小镇青年，DeepSeek的草根狂欢

回归小镇青年，DeepSeek的草根狂欢

相关推荐