(点击文末阅读原文,可查看PDF报告)
摘 要
本报告基于“研究、实践、支撑”三维评估框架,系统解析中国大模型领域动态。数据显示,2023年8月至2024年12月,中国大模型综合指数年复合增长率7.69%,呈现“爆发增长-震荡调整-韧性修复”的演进格局,政策推动、技术迭代与资本周期成为关键主导因素。
政策层面央地联动:国家网信办《生成式人工智能服务应急响应指南》推动安全合规,工信部《5G扬帆升级方案》等文件加速AI与工业互联网融合;地方政策聚焦算力(天津、山东)、场景(上海金融大模型语料库)、生态(广东大模型开源社区),初步形成“技术研发-合规治理-产业协同”的政策矩阵。
行业实践表现分化:备案大模型因政策窗口期呈脉冲式增长(2024年Q4备案数量环比增90%),而初创企业受资本流动影响剧烈波动(2024年4月融资额环比暴涨73倍)。技术突破方面,混合专家架构(MoE)、低精度训练(FP8)等技术显著降低国产大模型训练成本(如DeepSeek训练成本仅为GPT-4的8.8%),中文多模态、全流程Agent(如Manus)等差异化能力凸显竞争优势。
挑战与机遇并存:算力基础设施波动与社会创新情绪周期性震荡倒逼构建稳定性支撑体系。展望未来,技术国产化、轻量化与场景专业化将主导下一阶段发展,而政策需进一步平衡创新激励与风险管理,强化数据要素流通与绿色算力协同能力。
01
大模型相关政策
(一)我国大模型行业相关政策
为促进大模型技术的发展,我国陆续发布了多项行业政策(如表1-1所示)。
例如,2024年11月,工信部等十二部门发布《5G规模化应用“扬帆”行动升级方案》,提出支持互联网企业、基础电信企业和终端企业联合建设5G新型应用创新工场和体验中心,开展AI大模型、面向公众应用的网络切片等新技术试点,促进网络、内容、终端协同创新,为5G新业务新产品研发提供试验环境。
2024年12月,国家网信办发布《网络安全标准实践指南——生成式人工智能服务安全应急响应指南(征求意见稿)》,提出围绕生成式人工智能服务安全事件给出了安全事件的分类和分级建议,并给出了生成式人工智能服务安全事件应急响应过程,包括应急准备、监测预警、应急处置、总结改进阶段的管理措施和技术方法,可用于指导生成式人工智能服务提供者提高安全应急响应能力。
表1-1 我国大模型行业部分相关政策(2023年8月-2024年12月)
资料来源:公开渠道,零壹智库
(二)部分省份大模型行业相关政策
为了响应国家号召,各省份积极推动大模型行业的发展。比如,2024年7月天津市发布《天津市算力产业发展实施方案(2024-2026年)》,提出加快算法模型发展。发展计算机视觉、语音语义识别、言语交互等领域算法模型,积极布局通用和垂直行业大模型,支持高校、企业和科研机构加强基础理论和共性技术研究。部分省份大模型主要相关政策如表1-2所示。
表1-2部分省份大模型行业部分相关政策
(2023年8月-2024年12月)
资料来源:公开渠道,零壹智库
02
评价体系
(一)指标体系
本报告延续前期大模型指数的指标框架,仍然从大模型研究、大模型实践和大模型支撑3个一级指标、8个二级指标构建指数。在末级指标上,对两项指标做了适当优化和调整,具体包括:
人才支撑指标优化:原“相关高校数量”与“相关专业数量”指标因存在显著同步性,即高校数量增长与专业增设趋势高度一致,合并为单一“相关专业数量”指标以提升评价效率。
企业实践指标完善:保持“初创企业”和“备案企业”双维度评价,其中备案企业评估新增“备案大模型公众关注度”观测指标,形成更立体的评估视角。
表2-1 中国大模型发展指数指标体系
(二)指标权重
指标权重的确定有客观赋权和主观赋权两类方法。客观赋权法可排除主观干扰,应用相对广泛。熵权法、标准离差法和CRITIC法是主要的客观赋权法,三种方法均用变量的变异确定权重。其中,CRITIC法考虑了变量之间的冲突,确定的权重更为精准(Chen et al.,2021;Chen et al.,2022;许涤龙和陈双莲,2015)。本报告首先对各指标数据进行离差标准化处理,以避免量纲的差异对测算结果的影响。
本报告选择CRITIC法确定各指标的权重。第i个指标的权重:
根据上述计算公式,计算各一级指标权重。
(三)数据来源
本指数所涉数据来源于国家统计局、网信办、教育部、中国知网、中国日报网、智慧芽、企业预警通、零壹智库等。
03
大模型指数总体情况
(一)大模型总指数年复合增长率7.69%
2023年8月至2024年12月,大模型指数呈现“波动式上升”特征。从100增长至326.96,累计增长226.96%,月复合增长率约7.69%。2023年8月至2024年4月快速上升,指数从100飙升至217.56,其中2024年4月增速高达35.18%。2024年5月、8月出现明显回调,增速分别为-13.53%、-1.28%。
图3-1 大模型指数与增速
数据来源:零壹智库
1. 2024年4月增速突增原因
一是政策催化。2024年4月,中国工业和信息化部发布《人工智能赋能新型工业化实施方案》,明确提出加速大模型在制造业的落地应用,并通过专项资金支持企业技术升级。政策红利直接刺激市场预期,推动相关企业指数快速上涨。例如,华为盘古大模型因工业场景适配获得多地政府订单,当月订单金额超10亿元。北京、上海等地同期启动“AI+工业”试点项目,大模型供应商订单量激增。二是技术突破与产品发布。
二是技术突破与产品发布。多家头部企业发布新一代大模型产品,参数规模与性能显著提升。例如:百度发布“文心大模型4.0”,支持多模态交互,调用量单月增长120%;腾讯推出金融行业专用大模型“星脉”,与国有银行签订战略合作。
三是算力基础设施扩容。2024年Q1全国新增智能算力规模达200EFLOPS,同比增长45%,4月起多地智算中心投入运营,降低企业训练成本。例如,阿里云宣布大模型训练费用下调30%,吸引中小企业加速模型部署。
2. 2024年11月增速突增的原因
一是年底项目冲刺与资本集中投放。11月为传统“年终预算执行期”,政府与企业为完成年度目标加速项目落地国有银行、保险机构在年底前集中采购风控、客服类大模型服务;地方政府AI专项债资金在Q4密集拨付,推动智慧城市、医疗等领域需求爆发。如2024年11月AI招标项目数量环比增长68%,金额超200亿元。
二是电商与消费场景驱动。双十一期间,大模型在营销、物流、客服等环节的应用需求激增,如京东“言犀”大模型处理客服咨询量达日均10亿次,同比提升3倍;阿里“通义千问”赋能商家生成个性化广告素材,覆盖超50万店铺。
三是国际竞争与国产替代加速。2024年10月美国升级AI芯片出口限制,倒逼国内企业加快大模型自主研发,华为昇腾芯片产能11月环比提升40%,支撑国产大模型训练;百度、科大讯飞等企业宣布完成“去英伟达化”技术迁移。
(二)中国大模型研究指数月复合增长率达9%
中国大模型研究指数是由学术研究和技术研究两个二级指标所构成,从计算得出大模型研究指数从2023年8月92.45增长到2024年12月355.95,增长了263.50点,月复合9%。大模型研究指数增长率从15.24%下降到3.83%。
我国大模型研究指数逐月上升的原因,主要是因为学术成果和技术研发水平不断提高所导致。
图3-2 大模型研究指数及增长率
数据来源:零壹智库
1.大模型学术研究指数增长率先下降再上升再下降
大模型研究指数的增长是政策、技术、市场、产学研协同及国际竞争共同作用的结果,大模型研究中的学术研究和技术研究都在全面发展,这就导致研究成果丰硕。
从原始数据来看,学术研究论文数量从2023年8月412篇增加到了2024年12月的4106篇,增加了3694篇,技术研究(专利授权数量)数量从23615件增加到53008件,增加了29693件。
从指数计算结果我们可以看出大模型研究二级指数学术研究指数从2023年8月35.72增长到2024年12月的355.95,学术研究指数增长率从2023年08月21.84%增长到2024年7月30.73%后再下降到2024年12月3.61%;技术研究指数从2023年8月157.68增长到2024年12月的355.95,技术研究指数增长率从13.52%下降到2024年7月-1.03%后再增长到2024年12月4.09%。
大模型学术研究指数增长率先下降再上升再下降的原因,主要是前期的部分研究方向因效果未达预期而被暂时搁置等导致;中期随着数据中心、智能计算中心、数字技术不断突破等使研究成果显著;后期随着中国大模型相关政策的实施,引发公众信任危机,导致部分研究转向安全性与可解释性优化,使研究成果在短期内受到一定影响。
2.大模型技术研究指数增长率先下降再上升
大模型技术研究指数增长率从2023年8月13.52%下降到2024年10月0.27%再上升到2024年12月4.09%,呈现出先下降再上升。
先下降的具体原因算力与资源不足、市场竞争日益激烈、技术难题等导致;上升的具体原因是新技术(知识蒸馏)的出现显著降低训练成本使得中小企业和学术机构能够参与研究,同时提升了应用场景的多样性吸引了更多资本投入等原因导致。
图3-3 大模型学术研究指数和大模型技术研究指数及增长率
数据来源:零壹智库
(三)大模型实践指数月度复合增长率达12.21%
大模型实践指数从2023年8月的52.54攀升至2024年12月的331.85,实现12.21%的月度复合增长率。期间经历两次显著震荡:2023年10月和2024年5月分别遭遇52.29%、52.71%的断崖式下跌;2024年4月与11月则呈现105.74%、180.27%的爆发式增长。
图3-4 大模型实践指数及增长率
数据来源:零壹智库
1.政策周期主导备案大模型的脉冲式增长
备案大模型指数与政策监管节奏高度同步,2023年8月《生成式AI服务管理暂行办法》实施后,在合规窗口期触发备案大模型的短期爆发。
备案大模型数量从8个激增至14个,增幅75%,同步推动备案公司注册资本增长30.0%,由295万元增长至384万元,直接推动当月备案大模型指数暴涨395.67%。2024年11-12月,备案大模型数量从214个跃升至407个,增幅为90.2%。备案公司注册资本从2513万元增至13.6亿元,增长441%。
一方面,地方政府在年末产业规划周期中强化前沿技术布局,通过资质审批与财政补贴等引导企业集中备案,从而促进备案大模型的增长。另一方面,中国石油天然气集团有限公司等大公司入局,导致大模型备案企业注册资本量激增。
图 3-5 备案大模型指数及增长率
数据来源:零壹智库
2.资本流动引起初创企业指数波动
2024年4月,初创企业资本金从3月的42.6万元飙升至3152万元,增长73.4倍,但次月骤降98.3%,降低至52万元,同期初创企业指数呈现先增长169.84%然后下降60.89%的极端波动,这也导致了大模型实践指数在该时期的剧烈波动。
图3-6 大模型初创企业指数及增长率
数据来源:零壹智库
2024年11月,初创企业资本金环比增长999%,由29.5万元增长至3232万元,资本窗口期效应在该月表现尤为显著。根据公开数据,2024年10月,全球AIGC行业融资总额达到724亿元,较9月上升234%(注1)。2024年下半年,海外AIGC产业链企业获得融资次数显著高于前两个季度,共有608家海外企业在年内披露了融资。
同时,国内AIGC赛道在2024年整体呈现出逐渐活跃的趋势,前三个季度的融资次数分别为68、103和171,十一月一批企业密集完成融资。下半年大模型的密集融资推动初创企业指数单月增长211.90%,凸显资本对技术里大模型的敏感性。
(四)大模型支撑指数复合增长率达8.2%
1.大模型支撑指数的总体变化特征
大模型支撑指数从2023年8月的177.81增长至2024年12月的288.49,全年呈现“波动上升”趋势,年均复合增长率8.2%,但中间经历多次剧烈震荡。最明显的两次下跌发生在2023年12月(-15.03%)和2024年2月(-8.70%),而最大涨幅出现在2024年5月2024年12月分别增长16.16%和10.96%。
3-7 大模型支撑指数及增长率
数据来源:零壹智库
这种波动主要源于算力基础设施和大模型创新热情指数的不稳定。具体来看,算力基础指数剧烈波动,单月暴涨1069%或暴跌93%,社会创新热情大起大落,导致指数整体“进两步退一步”的特征。而政策支撑呈现稳步增长,人才支撑在一定时期内相对稳定。由于人才支撑由于高校招生一年一次,导致数据在月度研究中相对稳定,在此不做分析。
2.算力基础和社会创新热情波动加剧大模型支撑指数震荡
算力基础设施方面,超算中心和智能计算中心数量整体较少,波动较为平稳,且均在2024年12月上升至巅峰,均为10个。数据中心数量的剧烈波动造成了算力基础设施指数的震荡。其中,2024年5月算力指数暴涨1069%,从17.06升至199.55,推动支撑指数单月增长16.16%。这源于数据中心数量的距离波动,从15个暴增至134个。
图3-8 大模型支撑指数下属指数及增长率
数据来源:零壹智库
此外,社会创新热情指数大起大落,加剧整体波动性。大模型创新热情指数与社交媒体讨论量、融资事件等强相关。其中,2024年3月,大模型创新热情指数增长率高达116.69%,可能与该月 Claude 3 Haiku、sora等大模型发布,以及马斯克与openai的纠纷等事件有关。
3.政策支撑稳步增长
大模型政策从2023年8月19.56升2024年12月至355.95。大模型治理文件词频从6020次增至15834次,翻了2.6倍,是促进大模型支撑指数增长的稳定器。
大模型政总体呈现递增趋势,尤其是在研究期早期呈现显著的增长,2024年之后,随着政策进步一步完善,大模型政策增长有所放缓。除了数量增长外,大模型政策内容也逐步升级,早期政策侧重“合规准入”,后续政策转向“算力调度”“绿色低碳”等精细化管理。
图3-9 大模型政策指数及其增长率
数据来源:零壹智库
04
专题一:Deepseek打破
AGI“参数规模决定性能”铁律
DeepSeek是由深度求索(DeepSeek)公司推出的先进大模型系列,自2023年首次亮相以来迅速崛起,通过持续迭代实现多项技术突破。
2024年,DeepSeek开源了通用大模型DeepSeek LLM和代码专用模型DeepSeek Coder,凭借128K长上下文窗口和强大的数学推理能力引发行业关注。2025年2月,DeepSeek发布里程碑式的DeepSeek-V3版本,不仅在MMLU、GPQA等权威评测中超越GPT-4 Turbo,更以超万亿token的高质量训练数据和创新的MoE架构树立新标杆。更重要的是,DeepSeek以超低训练成本达到了全球一流水平,改写了大模型的研发范式。
DeepSeek的开源策略显著降低了AI技术应用门槛,推动产学研协同创新,同时企业级API服务为金融、教育、医疗等行业提供了智能化解决方案。该系列通过持续优化模型效率与成本平衡,正在重塑AI商业化落地范式,成为全球AGN竞争中的重要参与者。
(一)Deepseek优势
1.多模态支持与中文优化
DeepSeek支持文本、图像、语音等多模态数据处理,并通过中文语料库的深度优化,显著提升了中文场景下的语义理解和生成质量。其“深度思考”功能结合预训练知识库和逻辑推理能力,可对复杂问题进行多维度分析。
2.混合专家架构(MoE)与轻量化部署
采用MoE架构(如DeepSeek-V3含6710亿参数,每次仅激活370亿参数),动态路由算法减少计算冗余,配合FP8混合精度训练,显著降低显存占用和训练成本(如V3模型训练成本仅557.6万美元)。支持本地化部署,可在消费级硬件(如RTX 4090)运行。
3.强化学习驱动的推理能力
通过纯强化学习(如GRPO算法)实现推理能力自主进化,无需依赖监督微调(SFT),在数学解题、代码生成等复杂任务中表现优异。
4.开源生态与低成本API
开源1.5B至70B参数模型及工具链(支持FP8量化、动态负载监控),并提供每百万tokens仅0.48美元的API服务,成本仅为OpenAI的2%-5%。
表4-1 deepseek与国外竞品比较
资料来源:公开渠道,零壹智库
(二)DeepSeek的行业影响
1.软件开发效率的革新
DeepSeek通过开源模型权重和代码补全工具,显著降低了开发门槛,使中小企业和个人开发者能够快速构建定制化应用。其代码补全工具在过去12周内用户量增长72%,直接冲击传统网页开发、应用开发领域,自由开发者需转向更高阶的创意或架构设计以保持竞争力。
开源生态吸引了全球开发者参与优化,例如华为云、阿里云等平台集成DeepSeek模型后,开发者可一键调用API,加速产品迭代。此外,模型蒸馏技术允许企业从大模型中提取轻量化版本,进一步适配资源有限的小团队需求。
2.教育行业的智能化转型
生成式AI工具(如问答助手)导致传统教育平台流量下滑,用户转向AI驱动的个性化学习方案。例如,北森控股推出AI招聘助手、智能面试官等工具,结合DeepSeek模型提升招聘效率;Boss直聘通过自研模型优化简历匹配和面试辅导,缩短招聘周期至数分钟。教育模式从标准化内容分发转向自适应学习,AI可根据学生能力动态调整教学路径,降低教师重复性工作负担。
3.制造业的流程优化与成本控制
DeepSeek大模型助力制造业实现生产流程智能化,例如景业智能通过部署AI优化机器人控制与信息化管理,提升生产线效率;华为云与徐工集团合作开发工业大模型,实时分析设备数据以减少停机时间。物流领域,顺丰利用AI优化配送路径,降低运营成本20%以上。此类应用推动制造业从“经验驱动”转向“数据驱动”,减少对人工经验的依赖。
4.创意产业的效率与内容革新
DeepSeek的图像生成工具简化了设计流程,冲击传统设计平台(如Figma),但也为Canva等工具提供了功能扩展机会。AI在文案生成、视频剪辑等领域的应用,替代了部分基础创意工作,例如营销文案生成效率提升50%,但需人类审核以规避“幻觉”风险。AI同时为创作者提供数据驱动的灵感支持,例如通过分析用户偏好生成定制化内容。
5.芯片行业的国产化与生态重构
DeepSeek的优化技术(如FP8混合精度训练)降低了推理阶段的算力需求,推动市场从训练芯片向推理芯片转移,威胁英伟达的垄断地位。国产芯片厂商(如华为昇腾)加速适配低精度运算需求,出货量增长超30%。开源模型还促进软硬件协同创新,例如景业智能的本地化部署案例推动边缘计算芯片需求,形成国产算力生态闭环。
05
专题二:Manus重构
人类与机器在复杂系统的共生范式
2025年3月5日,中国AI创业公司蝴蝶效应(Butterfly Effect)正式发布了全球首款通用AI智能体产品——Manus,标志着智能体技术迈入全新阶段。Manus基于革命性的"神经符号协同架构",首次实现了大语言模型的推理能力与专业智能体执行系统的完美融合。Manus的核心优势在于其自主规划任务并实时调整的能力,能够在没有预先规划的情况下完成复杂任务。
Manus开放平台已吸引超过300家制造业、医疗和服务业企业接入,正在重塑从工业自动化到家庭服务的全场景智能生态。
(一)Manus优势
1.全流程自主任务执行能力
Manus是一款通用型AI Agent,能够独立完成从任务规划到执行的全流程操作,例如撰写报告、股票分析、旅行规划等。其核心在于将用户指令转化为具体行动,直接交付成果(如可视化图表、代码文件、分析报告等),而非仅提供建议。例如,在简历筛选中,Manus可自动解压文件、逐页分析、生成候选人排名。
2.多智能体协同架构
采用多代理系统(MAS),各子代理运行于独立虚拟机中,分别负责规划、执行、验证等环节,模拟人类“Plan-Do-Check-Act”工作流。这种架构提升了任务分解与并行处理能力,同时确保不同任务间的隔离与安全性。
3.强大的工具调用与集成能力
Manus可灵活调用代码编辑器、浏览器、文档处理器等工具,支持自动化代码编写、网页爬取、文件操作等复杂操作。例如,在房产分析中,它能通过Python计算预算、抓取房源数据并生成多维度报告。
4.自主学习与记忆优化
内置长短期记忆模块,可记录用户偏好(如输出格式偏好)并优化后续任务执行策略。例如,用户若偏好图表呈现,Manus会在同类任务中自动调整结果展示方式。
5.技术性能领先
在GAIA基准测试中,Manus的Level 1-3任务处理能力均达到SOTA(State-of-the-Art),性能超越OpenAI的DeepResearch等同类模型。
表5-1 Manus与国外竞品比较
资料来源:公开渠道,零壹智库
(二)Manus的行业影响
1.技术范式革新
Manus的"神经符号协同架构"突破了传统AI智能体的局限性,将大语言模型的泛化能力与专业领域执行系统相结合,实现了从"单任务自动化"到"多场景自主决策"的跨越。其动态技能扩展机制为智能体赋予了持续进化的可能,推动行业从静态规则驱动转向自适应学习驱动的技术范式。
2.产业应用变革
在制造业领域,Manus智能体已实现从产线质检到供应链调度的全流程自主优化,某汽车工厂部署后生产效率提升40%;在服务业,其多模态交互能力使客服、导购等场景的响应准确率达到人类专家水平。这种跨行业的渗透正在重新定义"自动化"的边界,催生"智能体即服务"(Agent-as-a-Service)的新商业模式。
3.生态重构与标准竞争
Manus开放平台吸引了全球开发者共建技能库,其模块化设计降低了智能体开发门槛,形成类似"App Store"的生态体系。这一策略加速了行业从封闭系统向开放协作转型,同时使中国首次在智能体技术标准制定中掌握话语权,动摇了西方企业在AI基础设施层的主导地位。
4.人机关系重塑
Manus构建了全新的"智能伙伴"交互范式。传统AI系统作为被动工具需要精确指令,而Manus通过多模态感知和意图理解技术,实现了对人类模糊需求的"心智化"解读——当用户说"帮我处理这个麻烦事"时,它能结合上下文自动识别"麻烦事"具体指代的工作瓶颈还是家庭矛盾,并给出针对性解决方案。
5.改变全球AI竞争格局
Manus的快速商业化验证了通用智能体的可行性,迫使谷歌、Meta等巨头加速相关布局。其在中国市场的先发优势,助力本土产业链在智能制造、智慧城市等领域形成差异化竞争力,可能改变全球AI产业的价值分配格局。
06
总结与展望
(一)总结
1.政策驱动下的多维度布局
政策重心从“合规准入”(如《生成式AI服务管理暂行办法》)转向“生态构建”和“场景深耕”(如广东聚焦开源社区、上海建立金融大模型语料库)。地方政策强化差异化竞争,宁夏利用算力补贴吸引数据中心,山西推动矿山安全大模型研发,形成“国家统筹+地方专精”的协同路径。
2.技术突破与成本重构
混合专家架构(MoE)、动态路由技术(如DeepSeek-V3)使大模型参数激活效率提升5-10倍,训练成本降低80%以上(从GPT-4的6300万美元降至500万美元级)。国产自主化进程加速,华为昇腾芯片产能提升40%,FP8低精度训练等技术推动推理成本降至国际竞品的1/20。
3.实践落地的两极分化
备案模型爆发,2024年Q4新增备案模型193个(环比+90%),主要集中于金融风控、政务客服等高合规需求场景。初创企业高波动,2024年4月单月融资额环比增73倍,但次月骤降98.3%,反映资本对大模型研发周期与商业化落地效率的审慎评估,短期投机性注资与长期价值锚定尚未形成有效平衡。
4.支撑体系的脆弱性暴露
算力基础设施增长依赖脉冲式投入(如2024年5月数据中心数量单月增780%),社会创新热情易受国际技术事件(如Sora发布)扰动。折射出数字基建与创新生态的结构性失衡,算力供给的脉冲式跃进难以支撑可持续创新韧性,国际技术事件的应激性扰动突显自主创新链成熟度不足。
(二)展望
1.技术革新驱动“三化”趋势
一是AI Agent轻量化。MoE架构+低比特量化(如4-bit权重)推动百亿参数模型在手机、IoT设备端运行,催生“个人AI代理”时代。
二是能力升级自主化。强化学习(如GRPO算法)与神经架构搜索(NAS)结合,实现模型推理能力的动态优化,适用于实时决策场景(如自动驾驶、高频交易)。
三是多模态融合深度化。视频生成大模型(对标Sora)、3D建模大模型(如3D-GPT)将突破文本-图像的单向交互,构建沉浸式工业设计、元宇宙社交新范式。
2.新范式重构产业逻辑
一是AI Agent生态崛起。以Manus为代表的全流程Agent将渗透企业核心业务流。例如,金融领域实现“自动财报分析→风险预警→投资决策”闭环,工业场景支持“需求感知→智能排产→故障自修复”。开源Agent框架(如AutoGPT)降低开发门槛,预计2025年全球Agent经济规模将突破千亿美元。
二是存算一体架构革命。基于忆阻器、光子芯片的存算一体技术,将解决传统冯·诺依曼架构的“内存墙”问题,支持EB级模型的实时推理(能效比提升100倍)。
3、政策与产业协同的关键方向
一是绿色算力网络建设。结合液冷技术(PUE<1.1)与西部可再生能源,构建“东数西算—低碳智算”一体化基础设施,支撑万亿参数模型的可持续发展。
二是数据要素市场化突破。通过联邦学习+区块链技术建立跨行业数据沙盒,推动医疗、交通等领域的大模型训练合规化。
三是安全治理体系升级。动态风险监测(如AIGC深度伪造溯源)、对抗攻击防御技术将成为大模型服务的标配能力。
四是AI原生硬件突破。专为大模型优化的三进制芯片、光子计算卡、神经形态芯片量产,支撑ZettaFLOP级算力需求。中国将有机会在全球AI硬件竞赛中开辟“第二战场”,推动大模型研发从“依赖制程工艺”转向“架构定义规则”的新阶段。
注:1、2024年11月全球AIGC投融资报告-End-
(点击文末阅读原文,可查看PDF报告)
原文标题 : 2024年中国大模型发展指数报告(总第3期)