回归小镇青年,DeepSeek的草根狂欢

源媒汇
关注

图片

文源 | 源媒汇

作者 | 谢春风

编辑 | 苏淮

DeepSeek几乎承包了今年春节期间的大半热度。

图片

截图来源于DeepSeek官网

国产AI独角兽DeepSeek的意外出圈,令其创始人梁文锋的家乡——广东湛江吴川覃巴镇米历岭村吸引了众多游客前往“打卡”。甚至还有建筑风水师拿着罗盘,研究起米历岭村的房屋布局和梁文锋的家宅布局。

一时间,科技与玄学巧妙“相融”。

在国内大厂以及国际巨头纷纷倾力押注AI大模型的市场背景下,DeepSeek,这家由量化私募公司幻方量化(下称“幻方”)孵化的大模型公司,团队核心成员仅百余人,没有铺天盖地的发布会,却以“能用、好用、用得起”的口碑悄然渗透市场。

DeepSeek的崛起,不仅曾引发美国科技股的大幅下跌,甚至迫使行业掀起价格战。

而梁文锋本人更因豪捐上亿善款、拒绝资本裹挟的姿态,成为中国AI领域的一股清流。

01

一场“沉默”的技术革命

与多数AI公司依赖资本“造势”不同,DeepSeek的春节走红充满“草根性”。

主要体现在两个方面:

第一,技术下沉。例如,DeepSeek开源的7B小模型,在英特尔至强CPU上即可运行,让县城中学能用老旧机房开展AI教学,甚至县城程序员用它调试代码。此外,DeepSeek开源的数学推理模型,更被中小科技公司接入业务系统;

第二,极致性比价。例如,DeepSeek-R1和DeepSeek-V3等模型的API调用价格低至0.14元/万token,仅为行业均价的1/20。河南某农产品电商,借此将智能客服成本压缩92%。

支撑DeepSeek“极致性价比”的,是幻方从量化交易中淬炼出的生存哲学——自研“动态计算图”技术,让同一批GPU可并行训练3个模型,硬件利用率达89%,远高于行业平均水平;训练数据清洗引入量化风控模型,将无效数据标记率提升至93%,百亿参数模型训练成本控制在800万元内。

不同于大厂执着于万亿参数竞赛,DeepSeek专注提升“单位算力产出效率”。其13B参数模型在法律文书审核场景击败多家千亿级大模型,核心在于对合同条款、行业术语的精准理解——这源于幻方量化团队多年处理金融法律文本的经验迁移。

此外,梁文锋坚持“用量化交易的钱养AI研发”。其曾表示,作为出资人之一的幻方,有充足的研发预算,另外每年有几个亿的捐款预算,之前都是给公益机构,如有需要亦可做调整。同时,还有分析称,幻方将每年净利润的90%投入技术攻坚,团队成员甚至自愿将年终奖转为研发基金。

这种模式,避开资本对短期回报的追逐,但也暗藏风险——2023年A股波动导致幻方研发资金同比减少18%,团队不得不暂停两个长期项目。

02

第一桶金与“不差钱”的底气

2016年成立的幻方,最初只是杭州一家低调的量化私募基金,团队不足20人,却凭借AI算法在二级市场屡创收益神话。

幻方的财富密码始于量化交易。梁文锋团队早年开发出一套基于机器学习的高频交易系统,在2015年A股波动中逆势斩获300%年化收益,迅速积累数十亿资本。

至2022年,幻方管理规模突破千亿,成为亚洲最大量化私募之一。同年,幻方和员工向慈善机构捐赠共计约3.6亿元,其中一名员工以个人名义捐赠1.38亿元。该捐赠人也被外界锁定为梁文锋。

图片

图片来源:幻方量化公众号

“不差钱”的梁文锋,甚至多次公开表示:“幻方不需要融资,我们赚的钱足够养活创新。”

之后,梁文锋团队将量化领域的AI技术积累迁移至大模型赛道,成立DeepSeek,仅用3年时间便冲至全球大模型竞技场第二梯队,与谷歌、Meta同台竞技。

天眼查显示,杭州深度求索人工智能基础技术研究有限公司(下称“深度求索”)成立于2023年,由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋分别持股99%和1%,而前者亦为梁文锋控股公司。

DeepSeek运营主体便是深度求索。

相较于OpenAI数千人的团队和百亿美元投入,DeepSeek核心团队仅百余人,研发成本不足行业巨头的1/10。其开源模型DeepSeek-Math在GSM8K数学推理测试中超越GPT-4,而API价格仅为GPT-4的1/50。这种“极致性价比”直接冲击市场,倒逼阿里、百度等大厂降价应战。

DeepSeek崛起背后,是近乎“疯狂”的技术投入。

曾被小米创始人雷军以千万年薪招揽的DeepSeek开源大模型DeepSeek-V2的关键开发者之一,被誉为“天才AI少女”的罗福莉,曾直言:“在幻方,技术理想比商业回报更有吸引力。”

DeepSeek的崛起,侧面反映出国产芯片行业的当前困局。

03

中国需要100个DeepSeek

“中国AI芯片的问题不在制程,而在生态。”

“如果我们能让国产芯片的算法效率提升30%,就能撕开一道口子。”

在近期央视访谈中,梁文锋如是谈到。

为了规避英伟达限制,DeepSeek使用华为昇腾910B训练模型,但算子兼容性问题导致训练效率降低40%,团队不得不用30%工程师人力开发转换工具。对此,梁文辉认为,这原本该是芯片厂商的工作。

此外,也有业内观点认为,如果中国AI只能在英伟达芯片和OpenAI论文基础上修修补补,这不过是另一种形式的代工。

当多数公司焦虑“何时做出中国版GPT-4”时,幻方用数学思维重新定义竞争维度——不做参数规模的奴隶,而是深耕“输入1度电,产出10倍智能”;

当行业沉迷资本故事时,幻方证明,用量化交易的“快钱”支撑硬核科技的“慢研发”,并非天方夜谭;

当全球追逐通用人工智能(AGI)圣杯时,中国或许更需要1000个深度改造制造业、农业、小微企业的“专用智能”。

春节假期结束第一天,DeepSeek社区出现一条高赞留言:“我们县城程序员用你的模型接了三个订单,养活了一个五人小团队。”这或许才是中国AI最真实的生命力——不在融资新闻的头条里,而在无数普通人用技术改善生活的细节中。

当全球AI陷入千亿美金“军备竞赛”时,梁文锋与幻方提供了一种反主流叙事——用数学家的极致理性、工程师的务实创新,以及近乎偏执的成本控制,证明“聪明资本”与“技术理想主义”可以共存。

这或许正是中国AI破局的关键密码:不需要另一个OpenAI,而是需要100个DeepSeek。

冷峻又务实,或为国产AI的未来。

部分图片引用网络 如有侵权请告知删除

       原文标题 : 回归小镇青年,DeepSeek的草根狂欢

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存