【编者按】为了及时跟踪中国大模型动态,深入研究大模型产业发展的广度、深度、锐度,零壹智库联合多家学界和业界的机构和专家,编制“中国大模型发展指数”。大模型的发展日新月异,指数以月为单位更新数据。第1期指数数据更新到2024年4月,因第一期指数在数据挖掘、处理、建模、调研等用时较长,今日才得以发布。第2期指数将更新到2024年9月,将于近期发布。我们期待各界人士为指数提供建议、观点和优秀案例,我们将不断改进指数,为中国大模型的发展制作精准的风向标和参照系。——《中国大模型发展指数》编写组
摘要
本报告构建了中国大模型发展指数,旨在量化评估中国大模型发展现状和趋势。指数涵盖大模型研发、大模型实践和大模型支撑三个维度,共20个四级指标,以2023年5月至2024年4月的数据为基础进行分析。
中国大模型发展指数显示,国内大模型在技术和应用方面均取得了显著进展。大模型技术作为推动科技创新和产业变革的核心技术,正逐步成为经济发展的新引擎。
大模型研发方面:研发指数反映出学术研究和专利授权的稳步增长,表明中国在大模型领域的技术创新和学术探索持续活跃。尽管增速有所放缓,但大模型研发的总体趋势依旧向上,显示出国内在该领域的深厚积累和创新潜力。
大模型实践方面:实践指数揭示了大模型在实际应用中的增长态势,尽管短期内增速有所放缓,但大模型在各行业的应用水平仍在提升。特别是大模型创业指数的快速增长,表明市场对大模型应用的高度认可和积极响应。
大模型支撑方面:支撑指数的显著增长凸显了中国在算力、人才、政策和创新环境等方面的坚实基础。算力中心数量的增加、高校专业人才的培养、国家及地方政府的政策支持,以及开源社区的活跃度提升,均为大模型的快速发展提供了有力支撑。
典型案例:KAN网络提出了一种创新的神经网络架构,在理论基础、结构设计、参数效率和可解释性方面具有优势。智谱清言是一款新一代基座大模型,具备多模态能力。在高级自然语言处理能力、多语言交流、深度文本分析、智能写作、信息搜索、个性化服务、文档理解等众多方面得到应用。
东方财富妙想金融大模型凭借其自研技术、金融数据挖掘、专业词表、高效训练算法、算力集群、金融场景应用、数据积淀和专业生态,已成为金融科技领域的领先者,服务于百万专业投资者和金融机构。
百融云创结合行业专知,引入检索增强生成技术(RAG),融合多模态,为金融行业提供了精准、高效和个性化的服务,成为AI产业应用的典范。
结论与展望:中国大模型发展迅速,已成为全球重要力量。未来需要加强技术研发,拓展应用场景,完善政策环境,营造良好创新生态。中国大模型有望在多个领域发挥重要作用,推动经济和社会发展。
人工智能技术正引领新一轮科技革命,其中AI大模型作为核心技术,在推动科技创新和产业变革方面发挥着重要作用。
中国密集出台政策支持大模型发展,并在技术研发和应用方面取得了显著成效。然而,目前缺乏对中国大模型发展现状的量化评估工具。
为此,本报告构建了中国大模型发展指数,旨在从大模型支撑、大模型研发和大模型实践三个维度,对中国大模型发展情况进行全面评估,为相关决策提供参考依据。
01
指数背景
(一)国家政策背景
伴随人工智能技术的加速演进,AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。特别是自2022年以来,以ChatGPT为代表的通用人工智能大模型在全球掀起了新一轮的人工智能发展浪潮。
作为新质生产力的重要组成部分,大模型有望揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。当前,全球主要国家已经着手制定大模型相关的发展战略和政策文件。
1. 美、欧等人工智能战略动向
2021年,白宫科学技术政策办公室(OSTP)宣布启动国家人工智能倡议办公室,负责协调和监督美国政府的国家人工智能政策计划。
2023年 5月,美国政府发布了新版《国家人工智能研发战略计划》,同年6月宣布投资1.4亿美元成立7 家新的国家人工智能研究所,7月在白宫召集亚马逊、谷歌、Anthropic、Meta、微软等七家AI头部公司签署人工智能的自愿承诺协议,9月再次与英伟达、IBM、Adobe、Salesforce、Scale、Cohere等八家企业签署该协议。
2023年6月,欧洲议会通过了《人工智能法案》的一系列修正案,预计于2024年正式通过《人工智能法案》。
欧盟主要针对人工智能的定义、禁止的人工智能应用清单、高风险人工智能的义务及基础模型、执法机制几个争议性的领域加以讨论和修正。还将成立 “人工智能委员会”,在欧洲议会的建议下建立一个新的人工智能办公室,该机构将拥有行政、咨询、解释和执法相关的一系列权力,并负责协调跨境调查。
当下,围绕《人工智能法案》的争议集中在它是否会过度约束大模型的发展,由此可以看出,欧盟内部对以大模型为代表的新一代人工智能整体还是持审慎态度。
日本对人工智能技术采取的战略性举措包括整体规划“社会5.0”《新机器人战略》《下一代人工智能促进战略》《人工智能技术战略》《人工智能技术战略实施计划》《以人为中心的人工智能社会原则》以及《人工智能战略》等加强对人工智能技术和专利发展的战略性引导。
近年来,新加坡瞄准人工智能在当今国际局势中的战略性地位,大力发展人工智能以赋能智慧国家建设并发挥国际战略优势,在战略、军事、治理等方面展现数字革命时代下新加坡的文化 特色。
新加坡致力于用数字信息科技改变新加坡,在2006年、2014年分别启动“智慧国家2015计划”与“智慧国家2025计划”,并发布《国家人工智能战略》,计划于2030年成为人工智能广泛应用的智慧国家,实现经济与产业转型并成为全球人工智能创新的领跑者。
2. 我国大模型政策布局动向
我国对大模型产业持包容审慎态度,自2022年下半年以来,密集出台了一系列大模型相关政策。
表1-1:中国AI大模型行业最新政策汇总一览表
资料来源:公开渠道,零壹智库
在技术创新方面显著提升,加快形成大模型产业。在国家政策的指导下,国内各地密集出台人工智能政策,围绕算力、算法、数据等大模型应用基本点发力,加快形成大模型产业。
各地人工智能政策发布呈密集态势,且主要聚焦通用人工智能大模型,多省市在2023年上半年密集出台人工智能相关利好政策,都在努力抢抓发展风口。
据不完全统计,2023年上半年,重点省市共出台人工智能发展相关政策19项,而2022 年同期仅有5项,增长率近400%。北京、上海、深圳、成都、杭州、武汉等大城市均高度重视大模型产业发展。
国内多地大模型政策主要以“三算”(算力、算法、算据)、应用和企业布局为同质化着力点。
从算力上看,杭州、上海等地加快建设算力基础设施、统筹调度平台及算力协调体系,集聚算力资源、夯实发展“底座”,如妙想金融大模型致力于以底座能力赋能金融场景。
从算法上看,南京、深圳等地聚焦基础软硬件体系、大模型算法核心技术,做好底层支撑以突破算法瓶颈。
其中,成都、杭州、廊坊实施首试首用、支持首版次等措施来支持算法研发;北京则强调通用人工智能算法发展,如百融云创金融大模型结合了算力、行业专知对模型进行算法精调;苏州和无锡提出探索元宇宙相关算法。
从数据上看,北京、成都等6地提出归集高质量数据开放共享资源集、支持数据交易、探索公共数据开放使用途径,打通数据资源壁垒,其中,北京谋划建设数据训练基地、建设数据基础制度先行示范区,成都和杭州都考虑构建行业级数据集或数据平台。
表1-2:主要城市大模型政策
资料来源:公开渠道,零壹智库
(二)技术发展背景
数字技术创新成效显著。我国大模型爆发式增长,紧跟国际前沿步伐,特别是在技术创新领域,成效显著。
人工智能、区块链、云计算、大数据和物联网等数字技术(统称ABCDI)是发展大模型的关键技术。
为了更好地获得ABCDI数据,我们选择从企业预警通、智慧芽等渠道获取数据并分析得出,ABCDI专利申请数量自2008年的10018件至2021年达到峰值415982件,但在2023年回落至214478件。
专利申请的增长率也从2021年的27.04%显著下降至2023年的-40.16%。
这一趋势反映出近三年专利申请数量的明显减少,主要是区块链的专利申请数量下降明显;专利申请数量逐渐减少导致后期专利授权数量逐年减少,授权数量从2008年的1872件,到2022年最高峰为161988件,2023年略有下降为131125件,专利授权增长率从2009年的46.31%上升到2020年78.59的峰会,之后下降到2023年的-19.05%。
图1-1:数字技术创新增长率
数据来源:智慧芽,零壹智库
大模型专利累计数量逐年增长,以2023年05月-2024年04月共达到384506件,月平均增长32042件,具体如图1-2所示,从图中可以看出大模型专利增长强劲。
这也说明自2022年以来,以ChatGPT为代表的通用人工智能大模型在全球掀起了新一轮的人工智能发展浪潮。大模型作为新质生产力的重要组成部分,有望揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。
图1-2:2023年5月-2024年4月每月大模型专利数量
数据来源:智慧芽,零壹智库
(三)产业发展背景
近年来,人工智能得到快速发展,激发了新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。当前我国人工智能技术被广泛运用在无人驾驶、移动网络、智能家居等产业中,逐步形成了依赖基础技术支持并融合人工智能技术和人工智能应用链接的产业框架。
通过人工智能技术应用于实体经济,促进技术进步,带动产业升级和经济转型,进一步推动经济的持续增长,2022年中国核心产业规模达到5080亿元,同比增长18%。
在技术创新领域,中国在人工智能芯片、深度学习软件架构和中文自然语言处理等领域取得了显著进展,同时AI技术正在医疗健康金融科技和新消费等领域广泛应用,赋能到各行各业。
截至2023年,人工智能显示出强劲的发展势头并通过创新推动实体经济的发展,涵盖人工智能产业链相关行业的创新、工业机器人和服务机器人产业的创新,以及物联网和智能商业模式的创新。
人工智能产业作为一个充满巨大机遇和潜力的新兴产业,对于国家经济发展和社会进步具有重要意义。人工智能产业的发展也面临着一系列挑战和问题,需要政府、企业和社会各界共同努力解决。
总体来看,在市场机遇和技术挑战的双重驱动下,人工智能产业迎来了前所未有的发展机遇。但是,政策环境和国际竞争的不确定性仍然给人工智能产业带来一定的挑战。因此,只有进一步加强政策引导,加强国际合作,才能够促进人工智能产业健康、可持续发展。
02
评价体系
自2022年11月底发布ChatGPT以来,以其为代表的通用人工智能大模型在全球掀起了新一轮的人工智能发展浪潮。作为新质生产力的重要组成部分,大模型有望揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。
目前,尚未有指标对我国大模型发展情况进行衡量。因此,鉴于大模型的快速发展,本报告以月度数据作为基础数据,拟选取2023年5月至2024年4月十二个月,从大模型支撑、大模型研发和大模型实践3个维度,构建中国大模型发展指数指标体系,对我国大模型发展情况进行量化研究。
(一)构建原则
本报告基于我国大模型研究和发展实际,坚持科学性、系统性、可操作性、可比性原则,构建中国大模型发展水平的评价指标体系。
1. 科学性原则
指标体系的设置考虑指标的内在因果逻辑,严谨、准确地反映大模型发展水平和发展潜力。其中,指标权重的确定采用CRITIC客观赋权法,指标的构建以定量指标为主,最大限度排除主观干扰。基于此计算得到的中国大模型各级指数能够反映中国大模型发展的现实发展水平、变化程度、未来趋势等。
2. 系统性原则
选取指标尽可能地全面反映大模型发展的各方面,又能突出重点,确保指标体系完整、客观、合理。系统性原则使得单个指标能反映大模型发展的某个侧面,综合指标又能反映大模型的整体情况。
本报告从大模型支撑、大模型研发和大模型实践3个维度对我国大模型发展情况进行测量。其中,大模型支撑是大模型发展的基础条件,本报告从算力、人才、政策以及创新环境等维度测量我国对大模型发展的支持情况。
对大模型的学术研究和技术研发是大模型创新发展的重要源泉,而良好的开源生态有利于大模型技术持续创新。大模型实践是大模型在企业和产业的实践和落地情况。三个维度较好地囊括了我国大模型发展基础、学术和技术研发及实践应用情况。
3. 可操作性原则
本报告立足现行统计制度和方法,聚焦大模型相关实物量和价值量指标需求,充分考虑大模型学术和行业数据的可获得性、可操作性,力求全面、准确反映大模型发展状况。数据以定量数据为主,主要通过查阅国家统计局、教育部、中国知网和网络搜索等途径获得数据。
其中,大模型技术研发活跃度数据来源于全球最大的开源社区之一—github,基于该平台检索我国开源大模型数量、参与者数量及项目参与者活跃度。这一做法,很大程度上减少了数据遗漏,使得数据可以持续获得。
4. 可比性原则
通过对各月基础数据进行归一化和去量纲等方法进行处理,消除不同特征之间的量纲差异,使不同特征数据之间具有可比性,从而使计算结果具有综合可比性。同时,针对计算结果进行基期指数化,更直观地反映我国大模型发展指数变动情况和趋势。
(二)指标体系
向上联结学术、向下扎根行业,实现技术创新与社会价值的接轨是大模型发展的第一性原理(注1)。而这一切也都需要人力、算力和创新环境等的支撑。由此可以看出,对大模型发展而言,大模型支撑是基础,大模型研究是创新的源泉,大模型实践是落脚点。
基于此,本报告从大模型支撑、大模型研究和大模型实践3个一级指标(见表2-1)、8个二级指标、13个三级指标和18个四级指标构建大模型发展指数指标体系,衡量我国大模型发展水平。
表2-1:中国大模型发展指数一级指标
1.大模型支撑
算力、人才、政策的支持,以及良好的创新环境,是大模型发展的重要支撑。算力和人才指大模型发展最重要的资源投入之一。大模型发展离不开训练和推理,大模型训练包含海量高质量数据获取、大规模训练集群稳定训练、模型算法调优等多个环节,每个环节都需要大量人才、算力等资源的投入。
本报告分别用算力中心数量和高等院校相关专业数量来衡量我国算力和人才支持情况(表2-2所示)。
同时,政府政策是保障大模型健康发展的重要规范。大模型的使用可能会出现各种各样的错误,也会带来一些伦理、安全和隐私等方面的问题。这就需要政府从大模型治理、隐私保护等各方面出台各项政策支持,保障大模型安全、健康、持续发展。
如,2023年7月,国家网信办联合国家发展改革委、教育部等7部门联合公布《生成式人工智能服务管理暂行办法》。从数据和基础模型的合法性、知识产权保护、个人信息保护等方面提出了相关要求,对促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益意义重大。
本报告以大模型、内容平台、生成式人工智能等关键词(见附录二)在知领政策库检索大模型相关政策数量作为基础数据。
此外,技术创新是大模型发展的首要驱动力。大模型发展面临诸多挑战,如鲁棒性、安全性及效率问题,这些挑战的解决依赖于技术进步和原始创新。
大模型的实践,除了技术层面的突破,也需要商业模式的创新。因此,良好的创新环境是大模型研发和应用的动力源泉。基于此,本报告以大模型、内容平台、生成式人工智能等关键词(见附录二)在中国日报网等进行检索,以表征创新热情。
表2-2:大模型支撑指标
2.大模型研发
大模型研发主要集中于两类,分别是学术研究和技术研发(表2-3所示)。其中,学术研究层面,近年来,高校与科研院所积极布局大模型,大模型学术研究雨后春笋般涌现。
本报告以中国知网作为检索平台,以大模型、预训练、生成式预训练、GPT、涌现能力、语言大模型、NLP、大语言模型、LLM、ChatGPT等作为关键词(见附录一),检索我国关于大模型研究的学术论文数量。
在技术研发方面,专利是衡量创新产出的重要指标。本指标从智慧芽等平台检索我国专利授权数量,以此衡量我国技术创新成效。
此外,良好的开源生态不仅有利于大模型技术持续创新、拓展大模型应用路径,还能在多方携手共建的基础上更好地解决大模型的可解释性、安全性、稳定性等问题。
因此,本指标基于github社区,检索我国开源大模型规模,及各开源模型贡献者(contributors)表征开源大模型参与者数量,各位贡献者存在多次提交(commits),以各参与者提交次数累计值表征开源大模型参与者活跃度。
表 2-3:大模型研发指标
3.大模型实践
大模型作为新物种,一直在快速进化,目前已经初步形成包括各参数规模、各种技术架构、各种模态和各种应用场景的大模型家族。本报告从大模型创业和大模型应用两个维度分别测量我国大模型创业情况和大型企业在大模型应用上的实践(表2-4)。
目前,投创界积极入局大模型竞赛,本报告借助企业预警通平台,通过关键词检索(见附录1),据此统计大模型创业企业规模,初始资本等,衡量我国大模型创业情况。同时,通过爬取AIGC企业投融资数据,作为创业企业资本补给基础数据。
大模型的实践应用上,行业大模型是大模型在产业中的应用拓展与典型,是大模型专业化、场景化和垂直化的体现。另一方面,大模型输入模态从文本向语音和图像等多模态的扩充的趋势。
多模态应用进一步提升了产业应用的适应性,让大模型解锁了更多的可能性。因此,本报告从大模型垂直应用、单模态应用和多模态应用三个维度测量大模型应用水平。该部分数据来源主要是网络搜索。
表2-4:大模型实践指标
(三)指标权重
指标权重的确定有客观赋权和主观赋权两类方法。客观赋权法可排除主观干扰,应用相对广泛。
熵权法、标准离差法和CRITIC法是主要的客观赋权法,三种方法均用变量的变异确定权重。其中,CRITIC法考虑了变量之间的冲突,确定的权重更为精准(Chen et al.,2021;Chen et al.,2022;许涤龙和陈双莲,2015)。本报告首先对各指标数据进行离差标准化处理,以避免量纲的差异对测算结果的影响。
本报告选择CRITIC法确定各指标的权重。第i个指标的权重:
根据上述计算公式,计算各一级指标权重如下。
表2-5:中国大模型发展指数一级指标权重
(四)数据来源
本指数测量时间为2023年05月至2024年04月,所涉数据来源于国家统计局、教育部、中国知网、中国日报网、智慧芽、企业预警通、知领政策库、零壹财经、github平台等。
03
中国大模型总体情况
大模型作为人工智能领域的重要突破,对于推动科技进步和产业升级具有至关重要的意义,它们在揭示科学规律、促进技术创新方面发挥着核心作用,为各行各业的转型与发展提供了强大的动力。
通过上述的指标体系,计算得出了中国大模型指数。为了更深入地理解这些指标背后的含义,并从中提炼出有价值的信息,接下来将进行中国大模型指数分析,揭示中国大模型发展的特点。
(一)中国大模型总体指数快速上升
从2023年5月至2024年4月,中国大模型指数从100点基数增长至257.40。
图3-1:中国大模型总体指数
数据来源:零壹智库
我国大模型总体指数快速上升的原因是:
其一,国家政策驱动大模型发展。我国高度重视人工智能的发展,将其上升为国家战略,并出台了一系列的扶持政策和规划,为AI大模型产业发展创造了良好的环境。
如2024年,多重利好因素推动大模型快速发展,首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再加上科技公司加大对 AI 领域投入资金、人力、技术研发,各环节协同支撑大模型发展。
积极发展 AI、促进 AI 与实体经济深度融合,成为中国实现经济可持续高质量发展的必然选择。
其二,基础设施支持大模型发展。我国具备发展人工智能较好的基础,算力中心、5G网络等基础设施发展迅速,企业创新能力和动力强劲,快速跟上全球大模型发展前沿,涌现出一批具有行业影响力的大模型。
其三,资本赋能大模型发展。大模型能够有效的解决人工智能方面的很多问题,不断降低资源需求、提高性能、创造良好的效益,不断激发了业界和资本的动力,推动了大模型的发展。
(二)我国大模型研发指数增长4倍
大模型研发指数是由学术研究和技术研发两个二级指标构成,从计算得出大模型研发指数从2023年05月63.57增长到2024年04月258.54,增长4倍;大模型研发指数增长率从26.20%下降到9.33%。
图3-2:大模型研发指数及增长率
数据来源:零壹智库
我国大模型研发指数增长强劲,其原因如下:
其一,学术成果丰硕,从计算结果得出,大模型学术研究指数从2023年5月44.35增长到2024年04月的253.37,增长5倍,原因是围绕大模型的学术论文从2024年05月216篇增长到了1018篇,大模型专利数量从2023年05月13001项增长到了2024年04月39412项。
大家都明白,自2022年以来,以ChatGPT为代表的大模型在全球掀起了新一轮的人工智能发展浪潮,能揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。
其二,技术研发水平不断提升,从计算的结果得出,大模型技术研发指数从2023年05月82.24增长到2024年04月258.54,增长3倍。原因是技术创新成效、开源大模型研发水平、开源项目开发进展三个指标增长较快,分别从64.13增长到258.54、从96.86增长到、258.54;从95.14增长到258.54。这会加大大模型技术快速发展,使我国大模型产业发展将迈入快车道。
1. 大模型学术研究指数增长率有所放缓
大模型研发二级指数学术研究指数从2023年05月45.25增长到2024年04月的285.54,学术研究指数增长率从2023年6月28.70%下降2023年12月12.14%,一直到2024年12 月稳定在12%左右;技术研发指数从2023年05月79.07增长到2024年04月的253.37,技术研发指数增长率从25.86%下降到6.37% 。
图3-3:大模型学术研究指数和大模型技术研究指数及增长率
数据来源:零壹智库
其增速放缓的原因如下:
其一,创新边际递减效应。创新的边际递减效应是一个经济学原理,它描述了随着技术发展,每增加等量的投入,所带来的产出增长会逐渐减少的现象。
这一效应在学术发展过程中同样存在,尤其是在学术研究成熟期,创新的难度和成本增加,而获得的额外效益却逐渐减少。
从大模型学术研究数据来看,2023年5月到2023年6月大模型论文由216篇增长到278篇,只增长了62篇;而增长率却为28.70%。2024年3月到2024年4月大模型论文由1098篇增至1234篇,增长了136篇,而增长率仅为12.39%。大模型论文的增长率呈现出边际递减效应。
其二,论文选题方向边际递减效应。现有的大模型研究主要方向是深度神经网络、Transformer架构、自监督学习、预训练与微调策略,以及高效的优化算法,之后研究转向了大模型处理复杂任务时的适应能力和泛化能力。
然而,随着时间的推移,大模型处理复杂任务研究逐渐遇到了性能瓶颈,即在现有理论框架和技术手段下,进一步的性能提升变得越来越困难,导致研究产出的增长速度开始减缓,呈现出论文选题方向边际递减效应。
2. 大模型技术研发指数增长率逐渐降低
大模型技术研发指数增长率从2023年5月24.7%下降到2024年4月6.13%(图3-3),增速逐渐放缓。其具体原因主要是:
其一,市场竞争日益激烈。大模型领域的竞争愈演愈烈,各类企业纷纷投入研发和推广,为了争夺市场份额,各大企业不断推陈出新,使得技术更新速度越来越快,在这种情况下,大模型研发的高增长率难以持续;
其二,当前大模型的应用场景有限。尽管大模型在很多领域都表现出了出色的能力,但实际上,它们的应用场景仍然相对有限。许多企业在尝试将大模型应用到自己的业务中时,发现实际效果并不如预期;
其三,大模型的高成本和技术难题也是制约其增速的重要因素。开发和维护大模型需要大量的资金和技术投入,这使得一般的中小企业难以承受,同时大模型的技术难题也使得很多企业在实际应用中面临诸多挑战。这些问题的存在,导致大模型的热度逐渐降低。
(三)我国大模型实践应用复合增长率16%
大模型实践指数从2023年5月44.68增长至2024年4月234.37,复合增长率16%。大模型实践指数在短期内经历了一段“降温”期,但从中期视角来看,指数仍然呈现出“稳步加温”的态势。
特别是在2023年的6月、11月,以及2024年的2月,可以观察到了显著的增长率高峰(参见图3-4)。总体而言,大模型实践指数保持着上升的发展轨迹,尽管增长率在不同时间段表现出一定的波动性。
这些数据点揭示了一个模式:尽管大模型实践可能会遇到暂时的冷却期,但经过一段时间的沉淀和调整,研究和应用的热情往往会被重新点燃。
这种周期性的波动可能与技术突破、市场需求变化或政策导向等因素有关。因此,尽管面临暂时的挑战,大模型的发展前景依然乐观。
其“降温”原因如下:
其一,大模型认知鸿沟被逐步填平。大模型神秘面纱正在不断被揭开,同时开源社区也获得了蓬勃起步,学术界也积极参与和支持开源化,这进一步降低了大模型在应用侧的门槛。
随着认知差逐步平衡,上手试验成本降低,在初期结构性红利诱导下的冲动臆想正在快速消退,产业界逐步回归理性。
其二,国家出台政策进一步约束大模型安全合规问题。国内对大模型安全高度重视,国家网信办等七部门于2023年7月10日联合公布了《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。
该办法就生成式人工智能可能面临的安全问题提出了一系列明确的约束规范,比如要求提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德;要求采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务。
规定提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识(注2)。
大模型的安全和伦理约束是确保技术负责任发展的关键。
虽然这些约束在一定程度上抑制了技术的迅猛发展,但它们对于防止技术滥用和潜在风险至关重要,不仅避免了技术的过热,也为行业的可持续发展提供了宝贵的思考和调整空间。
通过这种适度的制约,我们可以确保大模型技术的发展方向与社会的整体利益相一致,促进行业的健康和有序发展。
图3-4:大模型实践指数及增长率
数据来源:零壹智库
1.大模型创业指数总体增速较快,月均复合增长率26%
大模型创业指数初期发展水平较低,总体增速较快。从2023年5月19.21增长至2024年4月253.36,月均复合增长率为26%(图3-5),增速较快。
其中,2023年6月增长率激增,高达124.40%,随后增长率下降至2024年1月11.62%。随后2月,增长率增长至42.43%。整体增长情况与大模型实践指数保持一致。
图3-5:大模型创业指数及增长率
数据来源:零壹智库
溯其根源,大模型相关企业数量、初创企业资本金和大模型企业融资金额基础指标总体呈现递增,2023年5月初创企业数量从28449家增长至2024年4月303779家,初创企业资本金2223.5亿元增长至106427.80亿元,大模型企业融资金额从15.16亿元增长至176.37亿元。
三个下属指标均在2023年6月呈现快速增长,这也导致大模型创业指数在6月份激增。
图3-6:大模型相关企业数量、初创企业资本金和大模型企业融资金额
数据来源:企业预警通,零壹智库
其一,2023年开始,创投界青睐对大模型投资青睐有加。据统计,2020年至2022年,各年投融资事件数量未超过5起,而2023年共有20起(注3)。
从已知金额来看,2023年,国内LLM领域投融资金额已高达64.27亿元(图3-6)。其中,腾讯和阿里是国内最“慷慨”的投资方,国内5家大模型独角兽公司中(月之暗面、智谱AI、Minmax、零一万物和百川智能),阿里参投率高达100%,腾讯参与了其中3家的投资,参投率为60%(图3-7)。
2024年4月,中国人工智能(CAAI)和蚂蚁集团联合发起设立“CAAI-蚂蚁科研基金(大模型专项)”,用于支持大模型领域的产学研合作和共同发展,该基金课题涵盖行业应用大模型、 通用大模型、大模型数据、大模型安全、大模型 infra 等五个方向。
表3-1:2022年至今国内大模型独角兽融资情况
数据来源:公开渠道,零壹智库
其二,大型语言模型投融资地区、覆盖的行业不均衡。从大型语言模型投融资事件发生的地点来看,主要集中在北京、上海、广东等经济发达地区,这些地区经济发展水平居前,科研技术水平较高、科研氛围良好,三地投融资事件数量共计占全国的半数。
其中,北京占比27.4%,广东占比13.7%,上海占比8.2%。从被投公司的行业分布来看,截至2023年,我国LLM领域投融资项目以企业服务细分为主,具体来看,主要是各类AI内容平台商。企业服务领域占比高达58.3%,其次是元宇宙,占比为25.0%。工具软件、文娱传媒占比均小于10%(注4)。
其三,从外部环境来看,政策出台助力为科技型企业提供全生命周期的多元化接力式金融服务。
2023年6月,国务院总理李强主持召开国务院常务会议,审议通过《加大力度支持科技型企业融资行动方案》(以下简称《行动方案》)。
会议强调,要引导金融机构根据不同发展阶段的科技型企业的不同需求,进一步优化产品、市场和服务体系,为科技型企业提供全生命周期的多元化接力式金融服务。《行动方案》的出台为大模型初创企业解决融资难、融资贵问题具有重要意义,也有效提升了大模型创业指数。
此外,仅2023年4月28日,OpenAI单次完成3亿美元融资;截止当日,OpenAI已获得约103亿美元融资(据美国科技媒体TechCrunch数据)。由此催生的创业浪潮点燃了风投公司投资热情,带来了一定时期内的投资热潮。
2.大模型应用指数复合增长率8%
大模型应用指数发展水平整体较高,增长速度逐步放缓,增长趋势与大模型创业指数基本一致。由2023年5月89.05增长至2024年4月201.28,复合增长率8%,且增速明显放缓。
图3-7:大模型应用指数及增长率
数据来源:零壹智库
从下级指标来看,大模型应用水平上,应用大模型数量从34个增长至100个,其行业覆盖率从25%增长至85%,现大模型已覆盖大部分行业。大模型未涉及的行业范围越来越少,导致覆盖率增速放缓。就离散度而言,大模型所覆盖行业的增速慢于大模型数量增长率,因此离散度有减缓的趋势。
图3-8:应用大模型数量、大模型覆盖率和离散度
数据来源:零壹智库
在大模型单模态应用上,单模态大模型数量呈现先递增后减少的趋势。而在大模型多模态应用上,多模态大模型数量呈现递增的趋势。
究其原因,不难发现,相比传统的单模态大模型,多模态大模型更加符合人类的多渠道认知方式,从而导致单模态大模型与多模态大模型的此消彼长。多模态大模型能将不同模态信息相互补充,提高信息的完整性和准确性,从而更好地应对复杂环境、场景和任务。
落实到应用层面,多模态能使机器更好地理解人类的意图和需求,提供精准、个性化服务。
图3-9:单模态和多模态大模型应用
数据来源:公开渠道,零壹智库
其次,垂直大模型致力于解决特定场景问题,因此其发展节奏与大模型创业企业发展节奏基本一致。此外,中国大模型产业发展源于多领域的广泛需求,例如办公、金融、医疗、政务等场景和诉求。随着大模型应用场景和领域增长,大模型未涉及的行业领域越来越少,导致覆盖率增速放缓。
综上所述,我们可以从以下方面分析大模型应用指数呈现整体较高,增长速度逐步放缓特征的原因。
其一,随着基础模型的不断强大,开发应用的难度逐渐降低,导致其发展水平整体较高。如李彦宏预测,在未来,各个行业领域都可能依据自身独特的场景和丰富的经验,催生出大量的智能体,从而构建起一个庞大的智能体生态(注5)。
其二,随着大模型行业应用将更加广泛,涵盖越来越多的行业和场景,大模型未涉及的行业范围越来越少,导致覆盖率增速放缓。
其三,垂直大模型致力于解决特定场景问题,因此其发展节奏与大模型创业企业发展节奏基本一致。
大模型本身的特性与金融、医疗等行业有着天然的契合,导致大模型应用在某些行业应用较多(表3-2)。以金融领域为例,该领域数据种类具有广泛性和深度,要满足不同用户的需求,妙想大模型结合相关技术提高性能,满足不同顾客需求;金融数据多且杂,导致大模型可能产生的“幻觉”问题,百融云创金融大模型运用创新增强生成技术解决此问题。
以医疗领域为例,该领域存在大量模态种类丰富且跨学科的数据,大模型与医疗行业有着天然的契合性,医疗AI大模型不仅能深刻理解临床数据,还能生成富有洞见的医疗知识(图3-10)。
从影像诊断到药物研发,这些模型正逐步改写医疗服务的未来(注6)。
表3-2:国内应用大模型所属行业top10
数据来源:GitHub - wgwang/awesome-LLMs-In-China: 中国大模型
图3-10医疗健康AI大模型应用场景
图片来源:介入医学工程国创平台
(四)我国大模型支撑指数累计增长68%
大模型支撑指数总体持续平稳增长。从2023年5月至2024年4月,大模型支撑指数从150.89增至253.37,累计增长了67.92%(图3-14)。大模型支撑指数总体增速有两个月较快,分别是2023年7月和2024年4月。
2023年7月增速最大,达28.86%;2024年4月增速为6.02%。除此外,其他月份大模型增长速度保持相对平稳,每月平均增速为2.32%。这两个月指数增长较快的原因:
其一,我国算力数据有很大提升。2023年6月增幅达80%,中国算力大会公布数据显示,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197百亿亿次/秒(EFLOPS),存力总规模超过1080艾字节(EB)。
算力枢纽节点建设了130条干线光缆,数据传输性能大幅改善。这些数据体现在2023年7月的大模型支撑指数和增幅上,导致指数增长较快。
其二,人才支撑有了大幅度提升。因2020年开设与大模型相关专业(如:大数据技术、数据科学、计算机科学与技术、信息技术等专业)数量增长明显,导致2024年1月的毕业生人数有较大幅度增加。2019年大模型相关专业数量为304个,到2020年增加至335个,增幅达10.2%。
图3-11:大模型支撑指数及增长率
数据来源:零壹智库
1.大模型政策指数增长4.23倍
大模型政策指数从2023年5月59.94,增长至2024年4月253.37,增长了4.23倍,增速较快(图3-15)。
其中,2023年6月和9月增长率激增,分别是55.45%和23.67%,随后增长率下降至2024年2月的2.14%。
随后至4月,增长率略有增长至10%左右。大模型政策指数总体增长增速在放缓。
主要原因是,我国大模型政策集中在2023年出台发布,如2023年7月发布《人工智能气象应用工作方案(2023-2030)》《生成式人工智能服务管理暂行办法》,8月发布《电子信息制造业2023—2024年稳增长行动方案》,10发布《人形机器人创新发展指导意见》,12月发布《关于加快推进视听电子产业高质量发展的指导意见》《“数据要素+”三年行动计划(2024-2026)(征求意见稿)》;2024 年《政府工作报告》中提出开展“人工智能+”行动。
我国各地方政府也在2023年出台相关支持政策,加快大模型产业的持续发展。如北京、深圳、杭州、成都、福建、安徽、上海、广东等地在2023年均发布了关于 AI 大模型的相关政策。
图3-12:大模型政策支撑指数及增长率
数据来源:零壹智库
2.大模型创新环境指数增长14.16倍
大模型创新环境指数从2023年5月17.89,增长至2024年4月253.37,增长了14.16倍,并且一直保持高速增长(图3-16)。其中,2023年6月增长最快,最高达111.07%;其次是2023年9月,增速为35.01%。主要原因如下:
其一,受大模型实践成功的刺激。受到ChatGPT4以及SORA等大模型的成功案例影响,激起中国大模型业内人士兴趣,开始国产化大模型的研究与应用,国内的研究院所、高校、企业等单位成为大模型创新的主要推动者。根据不完全统计,仅在开源大模型项目commits参与者人数达32万余人。
其二,受到中国大模型政策的鼓舞。中国大模型政策鼓舞了大模型企业,促进大模型行业应用。致使中国大模型从业者不断地将大模型技术运用垂直领域,从而在应用领域等相关方面快速地创新。
其三,受益于中国创新环境的改善。“中国科技创新能力迅速提升”已成为国际广泛共识。中国科学技术发展战略研究院2023年11月21日发布的《国家创新指数报告2022—2023》显示,中国创新能力综合排名上升至第10位,较上期报告提升3位,是唯一进入榜单前15位的发展中国家,向创新型国家前列进一步迈进。
在世界知识产权组织的《全球创新指数》评价结果中,中国创新能力综合排名由2012年的第34位提升至2023年的第12位。在欧盟委员会的《欧洲创新记分牌》评价体系中,中国创新能力2014年总体水平仅相当于欧盟的44%,2023年总体水平已达欧盟的95%。创新环境的不断提升,致使我国大模型领域受益,并且取得巨大进步。
图3-13:大模型创新环境支撑指数及增长率
数据来源:零壹智库
04
国内外典型案例分析
国外大模型展现出强大的创新驱动力,通过跨学科合作和全球视野,不断推动技术边界,引领行业发展,同时在数据隐私和安全方面展现出高度适应性,保障了全球化合规运营。
国内大模型则紧密贴合本土市场和国家政策,通过深入实践和技术创新,优化算法和数据处理能力,推动了金融、医疗、教育等行业的数字化转型,同时积极探索与新兴技术的结合,成为推动中国科技创新的关键力量。
(一)国外大模型创新典型案例:KAN
2024年5月,MIT刘子鸣的论文《KAN:科尔莫戈洛夫-阿诺尔德网络》,引起了业内人士的高度关注。KAN网络(Kolmogorov-Arnold Networks)是一种创新的神经网络架构,其核心创新点主要体现在以下四个方面:
1.理论基础由MLP转为Kolmogorov-Arnold表示定理
该论文颠覆了 MLP 的数学地基——通用近似定理,采用的是Kolmogorov-Arnold表示定理。
KAN网络的设计灵感来源于Kolmogorov-Arnold表示定理,该定理指出,任何多变量连续函数都可以表示为单变量连续函数和加法运算的组合。这一理论启示KAN网络的构建,使之能够以全新的方式处理多元函数的学习问题。如图4-1所示。
2.结构设计由多层感知器转向可学习的B样条激活函数
与传统的多层感知器(MLP)不同,KAN网络在权重上放置了可学习的激活函数,这些激活函数被参数化为B样条函数。
在MLP中,激活函数是固定的,并位于神经元上,而权重则以多维度的参数矩阵形式存在于边上。KAN的这种设计允许每个权重参数不再是一个单一的数值,而是一个函数,从而增强了网络的表达能力。
3.参数更少精度更高
KAN网络声称能够以更少的参数量实现更高的精度。这是因为它使用B样条函数作为激活函数,这些函数能够以更少的参数表征复杂的函数关系。这种参数效率的提升是KAN网络的一个重要优势。
KAN能用更少的参数在数学、物理问题上取得更高精度。在各种任务中,包括回归、解偏微分方程和持续学习,KAN的表现都优于MLP。
4.可解释性实现零的突破
KAN网络在模型的可解释性方面表现出色。由于其结构的特点,KAN网络能够提供对模型决策过程的更深入理解。这种可解释性对于需要高度透明度和可靠性的应用场景尤为重要。
KAN通过揭示组成结构和拓扑关系提供了可解释性,为科学发现带来了希望。可能在数学和物理研究中的辅助模型更受欢迎,帮助发现和寻找更基础的数值规律。
图4-1:MLP与KAN对比
资料来源:《KAN:科尔莫戈洛夫-阿诺尔德网络》
(二)国内大模型应用典型案例:智谱清言
2024年1月16日,智谱 AI 团队全面展示了其投身于大模型事业三年多来所积累的技术成果,并发布了新一代基座大模型 GLM-4。在自然语言处理领域展现出卓越的性能和丰富的功能,如图4-2所示,体现了其在专业领域的特色:
图4-2:智谱清言大模型界面
资料来源:智谱清言
1.强大的自然语言处理能力
一是先进的预训练模型。智谱清言大模型基于海量文本数据进行预训练,学习到了丰富的语言知识和语言规律,使其能够理解和生成自然语言,并进行逻辑推理和连贯性表达。
二是多模态融合。智谱清言大模型融合了文本、图像、语音等多种模态信息,能够进行跨模态理解和生成,例如根据图片生成描述性文字,或根据语音生成文本内容,提升了模型的表达能力和泛化能力。
三是可解释性。智谱清言大模型内部包含多个注意力机制,这些机制能够识别文本中与当前任务相关的关键信息,并将注意力集中在这些信息上。
通过可视化注意力机制,可以观察模型在处理文本时关注哪些信息,从而理解模型的推理过程。注意力机制只能提供对模型决策过程的有限洞察,难以揭示模型内部的深层机制。
2.丰富的功能和应用场景
一是自然语言理解。智谱清言大模型能够理解用户输入的自然语言指令,并执行相应的任务,例如信息搜索、问答、对话等,为用户提供便捷的交互体验。
二是自然语言生成。智谱清言大模型能够根据用户需求生成各种类型的文本内容,例如文章、报告、邮件、诗歌等,满足用户多样化的内容创作需求。
三是智能对话系统。智谱清言大模型能够与用户进行流畅自然的对话,并根据用户情感和意图进行理解和回应,例如进行闲聊、咨询、建议等,为用户提供个性化的交互体验。
四是文本摘要。智谱清言大模型能够对长文本进行摘要,提取关键信息,帮助用户快速了解文本内容。
五是机器翻译。智谱清言大模型能够进行多种语言的机器翻译,帮助用户跨越语言障碍,进行跨语言交流。
3.开放的生态系统
一是开源社区。智谱清言大模型开源了其代码和数据,吸引了大量开发者参与模型开发和改进,促进了模型的迭代更新和性能提升。
二是API接口。智谱清言大模型提供了丰富的API接口,方便开发者将模型集成到自己的应用程序中,拓展模型的应用场景。
三是开发者工具。智谱清言大模型提供了开发者工具,例如模型训练工具、模型评估工具等,方便开发者进行模型训练、评估和优化。
智谱清言大模型在自然语言处理领域展现出卓越的性能和丰富的功能,体现了其在专业领域的特色。其强大的自然语言处理能力、丰富的功能和应用场景、开放的生态系统,使其成为推动自然语言处理技术发展和应用的重要力量。
(三)大模型应用典型案例:东方财富妙想大模型
东方财富妙想金融大模型是由东方财富自主研发的金融行业大语言模型,于2024年1月正式上线,在专业投资顾问服务、深度财经要闻分析、定制化财富管理、内容机会挖掘等金融场景上达到世界先进水平,如图4-3所示,体现了其在专业领域的优势与特色:
图4-3:妙想金融大模型领先优势
资料来源:东方财富
1.自研妙想大模型底座行业领先
一是金融数据特色挖掘:为了让自研大模型充分学习金融知识,特别是细分深入的业务逻辑维度,自研大模型充分挖掘东方财富既有的结构化数据,将金融的业务、财务、基本面等数据构造成表格数据,在增加模型结构化数据解读能力的同时强化金融能力。
二是金融词表让模型从源头懂金融:研发团队为自研大模型准备了高达12万的金融词表,覆盖中英文金融词汇、各类金融标的、常见指标等金融专业术语,以确保使大模型从根源上理解金融语义,生成内容更贴合金融场景逻辑。
三是创新模型训练算法:在训练过程中,自研大模型通过采用FlashAttention2异步优化、虚拟流水线等方法,显著提高了超千卡集群的训练速度,在模型训练中达到了高效的显卡利用率,高于业内平均水平,较高的训练效率有效地支撑了模型的快速迭代。
团队通过Scaling Law技术、模型架构优化、金融数据和通用数据的配比优化等多种创新算法提升模型训练效率,极致提升模型的金融能力。
四是超千卡算力集群支撑快速迭代:自研大模型构建了超千卡级别的算力集群,可支撑千亿级别的模型训练规模。集群配套可伸缩分布式调度系统,配合高速大存储,实现了自动故障检测与应对,报警和训练机器高速切换功能,能够支撑起模型的快速迭代优化。
五是高性能推理支撑场景需求:自研大模型通过量化、模型算子优化等措施极大提高了速度,结合Paged Attention、Continuous Batching、张量并行推理等技术优化推理框架的性能,在金融场景下算力的利用率提高了数倍。
考虑到高性能推理算力的持续供给,更新优化了推理框架,能够灵活适配多种异构算力。
2. 金融应用场景立体闭环
自研大模型致力于以底座能力赋能金融场景,为用户创造更多价值。自研大模型发力投研、投顾、投教、投资等金融核心场景,基于资讯、数据、研究、交易、交流等用户场景痛点,对智能问答和智能投研场景进行了个性化的功能设计,提供数据查询、信息搜索、事件解读、知识问答、智能选股、投资建议等数百种场景解决方案。
致力于成为用户随时随地的金融百科全书和专业投资者的投研提效利器,贴心服务金融场景用户。以下介绍3个主要场景模块:
一是股票分析模块。该模块通过自研大模型提供个股的全面分析。基本面诊股深入分析股票的盈利、成长、营运、现金获取和偿债能力,关注公司长期发展趋势。
技术面诊股侧重短期行情、资金流向和技术信号,追踪市场趋势。消息面诊股则关注公司相关新闻和公告,为投资决策提供信息支持。
综合分析整合各维度,帮助投资者全面了解股票优缺点,做出更准确的投资预判。
二是特色分析模块。该模块深入挖掘投资者关注点,提供多角度智能分析。股票对比模块通过多维度分析帮助投资者发现高成长性股票。估值分析模块深入个股估值,提供多角度比较。
机构观点模块通过机构专业分析,减少信息不对称风险,提供权威投资建议。涨跌分析模块解析个股行情趋势原因,帮助投资者理解市场规律。自选分析模块对用户自选股进行综合分析,辅助规避风险,加深了解,优化投资决策。
三是内容资讯模型。妙想大模型融合多维度智能信息,提供实时股票报价、行业动态、板块走势等全面资讯。
大模型注重信息真实性,提供可追溯的来源,增加用户信任。同时,妙想深入分析市场趋势和历史数据,预测影响,辅助决策。丰富的行情信息及时更新,帮助用户把握投资机会。妙想旨在提供全面、真实、深入的信息服务,助力用户快速了解市场并做出明智决策。
3. 专业数据积淀与应用生态
妙想大模型的数据库是一个全面而专业的金融数据集合,覆盖了多种市场和金融品种。
它包括沪深上市公司的详尽数据,为投资者提供了上市公司的全面信息和关键指标;新三板数据,为关注中小企业的投资者提供了重要的市场信息;科创板数据,专注于科技创新型企业的动态和表现;公募基金数据,涵盖了基金的净值、持仓、业绩等关键信息;投资理财数据,为用户提供了理财产品的收益、风险评估等数据;综合资讯数据,包括市场新闻、政策变动等,帮助用户及时了解市场动态;债券数据,提供了债券市场的深度分析和估值信息;宏观行业数据,涵盖了宏观经济指标和行业发展情况,为宏观经济分析提供了数据支持;期权期货数据,为衍生品市场的参与者提供了实时的交易数据和市场分析。
这些数据种类的广泛性和深度,使得妙想大模型能够为用户提供一个全面、多维度的金融信息视角,满足不同用户的需求。
自主可控、数据安全、数据资产等数据优势,确保了模型的独立性、安全性和数据的丰富性。
自主可控意味着模型从数据生产到算法开发再到模型训练均由东方财富自主完成,这不仅保障了技术的创新性,也确保了模型的适应性和灵活性。
数据安全方面,通过全量数据审核和用户数据脱敏等措施,保护了用户隐私和数据安全。而数据资产的丰富性,为模型的训练和优化提供了坚实的基础。这些优势共同构成了东方财富妙想大模型在金融科技领域的核心竞争力。
目前东方财富妙想金融大模型已经为Choice金融终端的PC版和APP实现智能化赋能,服务了超过100万位专业投资者,赋能20000余家金融机构,并获得各类用户的高度认可。
不仅能为专业投资者提升用户体验,也为金融机构提供了强大的技术支持,后续也会为更多金融工具实现赋能,进而推动金融行业的创新和发展。
(四)大模型应用典型案例:百融云创大模型
百融云创自2014年起专注于决策式人工智能(AI)技术的研发,奠定了其在AI领域的基础。2017年底,公司拓展至生成式AI领域,专注于智能语音和多轮文本与语音对话技术的研发。
凭借对金融行业的深刻理解和前瞻洞察,于2018年3月在业内率先成立了人工智能实验室。不久,实验室升级为X-Dynamics(以下简称X动力),实验室汇集了国内外众多顶尖人工智能专家。X动力在决策式AI、生成式AI、隐私计算、计算语音、自然语言处理、知识图谱等多个技术领域进行了深入的研究与实践,积累了丰富的实战经验。
2018年,百融云创成功将这些技术应用于智能运营业务,推出了第一代AI Chatbot产品,标志着其技术在实际业务中的首次应用。随着技术的不断成熟,百融云创在2021年实现了这些技术的规模化商业变现,进一步巩固了其在AI领域的市场地位。
2023年,公司推出了具有里程碑意义的大模型BR-LLM,并以其为技术基础框架,陆续开发了包括对话大模型VoiceGPT、自动编程模型BR-Coder、建模工具ORCA-GPT以及一站式大模型应用开发平台——赛博坦。
图4-4:赛博坦技术框架图
资料来源:百融云创
1.行业专知与多模态融合
百融云创大模型的核心竞争力在于其深厚的行业专知(know-how)。公司不仅拥有庞大和复杂的网络结构、众多参数和深层数,更重要的是结合了算力、行业专知和模型精调的综合能力。
行业专知决定了对行业洞察的深度和广度,使得百融云创能够在CRM等关键领域形成专有部署,并不断优化模型。此外,百融云创的大模型与多模态技术有效融合,如数字员工和数字人产品,支持多国语言,提供接近真人的交互体验,胜任多区域的营销和接待任务。
2.检索增强生成技术(RAG)
为了解决大模型可能产生的“幻觉”问题,百融云创引入了检索增强生成技术(RAG)。RAG通过整合外部知识库,使得大模型在生成答案前能够检索并参考外部信息,从而生成更准确和相关的内容。这一技术不仅提升了大模型的输出质量,还避免了重新训练的复杂性。
百融云创在Q&A场景中对模型能力进行了特别强化,使得大模型能够学习到个性化、专业化的知识,显著提高了答案的精准度和专业性。在第三方测评中,百融云创大模型的准确性和精准性在行业中处于领先地位,多项指标超越了ChatGPT 3.5。
3.绿色金融领域的精准识别服务
百融云创在绿色金融领域提供了一项创新服务,通过其强大的大模型技术,帮助金融机构精准识别和分类绿色项目。公司利用大模型处理和分析大量政策文件和金融标准,构建了一个全面且独一无二的绿色金融知识库。
这一知识库不仅能够实时更新以反映最新的政策调整,还能通过检索增强生成(RAG)技术实现精准检索和内容生成。这种服务大幅提升了识别效率,同时确保了业务流程的准确性和合规性,满足了监管机构和金融机构的多维度管理需求。
4.证券市场的知识管理和智能决策支持
在证券市场,百融云创的大模型技术为证券公司提供了一站式的智能解决方案。通过本地化部署和微调,公司快速搭建了企业级知识库,利用RAG技术对海量非结构化数据进行挖掘和分析,提炼关键信息,转化为结构化数据。
这一服务不仅提高了信息处理的效率,还增强了决策的准确性和合规性。此外,百融云创的智能版面识别模型确保了从复杂文档中提取信息的准确性,为证券公司提供了强有力的决策支持。
5.财富管理领域的个性化服务和客户体验提升
在财富管理领域,百融云创的大模型技术为金融机构提供了个性化的客户服务和资产配置建议。通过生成式AI,公司能够帮助从业人员自动化完成大量工作,同时根据客户的具体情况量身定制投资组合方案。
这种服务不仅提升了客户经营的效率,还通过提供专业且随时可用的“私人顾问”服务,增强了客户的体验和信任。经过一段时间的运行,营销响应率显著提升,资产管理规模(AUM)也实现了大幅增长。
百融云创的大模型技术是人工智能在产业应用中的典范,通过技术创新和行业深度融合,公司不仅推动了金融服务的智能化,也为其他行业的数字化转型提供了强有力的支持。
公司通过成立人工智能实验室并升级为X-Dynamics,汇集了全球顶尖专家,深耕决策式AI、生成式AI等前沿技术,并在隐私计算、自然语言处理等领域积累了丰富经验。
百融云创不仅在技术栈构建、大模型开发和RAG技术应用上展现了卓越创新能力,还在绿色金融精准识别、证券市场智能决策支持以及财富管理个性化服务等方面提供了创新解决方案,显著提升了金融服务的效率、准确性和客户体验,推动了金融科技的实质性进步。
05
结论与展望
(一)结论
本报告构建了中国大模型发展指数,对我国大模型发展情况进行了量化研究。研究结果显示,尽管面临市场竞争、技术挑战和政策约束等因素的影响,中国大模型整体上仍保持着积极的增长态势,并呈现以下特点:
1.中国大模型的研发进展显示出强劲的创新动力和市场适应性
尽管遭遇了市场竞争加剧、技术瓶颈和成本挑战等问题,研发指数的持续增长反映了国内在大模型技术上的不断突破和优化。特别是在算法创新、模型微调和多模态学习等方面,国内研究者和企业正积极探索适合本土需求的解决方案,以期在全球人工智能领域占据一席之地。
2.大模型的实践应用在中国正逐渐拓展至更深层次和更广泛的领域
从金融风控到医疗诊断,从智能客服到教育辅助,大模型正成为推动各行各业数字化转型的关键力量。实践指数的增长,尽管增速有所放缓,但反映了大模型应用正从初期探索转向更加成熟和系统化的阶段,其中,对垂直化和场景化应用的深入挖掘,成为推动大模型实践应用稳步增长的重要因素。
3.国家层面对大模型的政策支持和创新生态的培育,为大模型的快速发展提供了坚实的基础
政策指数的显著增长和创新环境指数的突飞猛进,表明了政府在推动大模型发展方面的积极作用,包括算力基础设施建设、人才培养计划、数据开放政策以及鼓励创新的法规框架等。此外,开源社区的活跃、产学研合作的加强以及风险投资的增加,共同构建了一个有利于大模型技术创新和产业应用的生态系统。
4.大模型创新涌现,应用场景不断拓展
大模型应用场景不断拓展,涵盖办公、制造、金融、医疗、政务等领域,并逐步深入到各个行业的核心环节,……。东方财富妙想金融大模型通过自研技术和专业金融数据的深度融合,实现了金融场景的智能化应用,提升了金融服务的效率和质量,成为金融科技领域的创新先锋。金融大模型百融云创结合行业专知,引入检索增强生成技术(RAG),融合多模态,为金融行业提供了精准、高效和个性化的服务。
(二)展望
1.中国大模型体指数持续增长
中国大模型指数,包括创新指数、应用指数、支持指数,将继续保持较快增长。随着AI技术的快速发展,中国在大模型领域的研究和应用正不断加深。
中国的AI模型不仅数量还将增加,而且模型的质量也将不断提升,这表明中国在AI大模型领域的创新能力正在迅速提升。社会公众对大模型的热情将持续高涨,活跃人数不断增加,开源项目层出不穷。
2.市场规模与应用场景相互促进
中国市场规模的增长将继续加速。中国AI大模型的市场需求源于多个领域,如办公自动化、智能制造、金融科技、智慧医疗和电子政务等,这些领域的智能化转型为大模型提供了丰富的应用场景。不同应用场景大模型的应用,提高我国大模型的总体应用规模。
我国大模型市场潜力巨大,预计到2028年,中国大模型产业市场规模将达到1179亿元人民币,显示出巨大的市场潜力和增长空间,巨大的市场规模将为我国大模型应用提供广泛应用场景。
3.中国在大模型的技术创新上不断取得突破
特别是在自然语言处理、计算机视觉和语音识别等领域。
同时,随着对模型可解释性的重视,中国正加强对可解释性AI技术的研究,以提高模型的透明度和可信度,这将有助于大模型在金融、医疗等敏感领域的广泛应用将更加紧密地结合,可解释性技术得到发展。
4.中国算力资源和人才队伍建设将得到进一步加强
为了支撑大模型的发展,中国正在加速构建高性能计算中心,提升算力水平。例如,中国的AI模型评测结果显示,模型在不同能力维度上的表现优异,这背后离不开强大的算力支持。同时,中国正通过教育体系和实训基地的建设,培养更多高素质的AI专业人才,为大模型的发展提供坚实的智力支持。
注释:
原文标题 : 中国大模型发展指数(第1期)