2024年,是大模型翻天覆地的一年。
“百模大战”爆发不久,大模型价格战随之而来,成本高昂的大模型几乎进入了免费时代。大模型从庞大的实验室工具,转变为高效灵活的应用助手,以狂飙猛进的速度在众多行业落地生根。
不再有人质疑大模型是“拿着锤子找钉子”,更急迫的需求来自市场端。行业对大模型应用的渴望推动着AI Agent走向前台,围绕AI Agent的混战已然开启。
与此同时,大模型的技术范式飞速演进,以视频生成模型Sora为代表的多模态技术逐渐成熟,为人们带来了巨大的想象空间。
这一年,大模型领域充满着混乱和兴奋,技术和应用彼此成就,共同推动着市场快速前行。
回顾2024年大模型产业发展,我们看到了一条逐渐清晰的演进路径:低成本降低了大模型落地的门槛;AI Agent提供了大模型绝佳的应用方式;多模态直接拓宽了大模型的能力边界,这一切都为大模型产业落地按下了加速键。
如果说“成本、AI Agent、多模态”三个关键词,代表着2024年大模型的进化方向,那么它们也代表着大模型迈向产业落地的关键节点。
随着新一年的到来,这一发展趋势是否会在2025年延续下去?大模型产业落地又将卷向何方?
成本
打通大模型落地的卡点
过去一年,大模型来到了更务实的落地阶段,但落地始终绕不过一个卡点——成本。
大模型参数高达千亿级别,一次训练所需要的资金,是绝大多数企业都“烧不起”的。因此企业在选择模型时,除了看重效果,对成本的考虑,更是决策的重要一环。
这种变化来自市场对大模型的真实需求。2024年,在市场需求和激烈竞争的双重推动下,大模型的价格战提前来临,国内最头部的大模型厂商几乎都卷入了这场降价潮,价格被打到了不可思议的地步。但在某种意义上,价格战也最大程度降低了大模型的接入门槛,企业不会因为价格而犹豫了。
与此同时,大模型的落地推进,让越来越多企业意识到,在具体场景上或许并不需要跑出通用大模型的计算量。
“大模型不是参数规模越大越好”,一位金融科技负责人在落地大模型项目后发现,在很多垂类场景中,更轻量的大模型也能达到通用大模型的效果,而推理成本更低,使用更简单。
随之而来的趋势是,轻量级大模型开始流行。
在海外,Google发布了从20 亿到70 亿参数轻量级模型Gemma;Meta发布了Llama系列模型,从70亿、130亿、330亿到700亿,不同场景选择不同的模型组合,效果都已被验证。
在国内,百度发布了三款轻量级模型,由大到小是ERNIE Speed、ERNIE Lite、ERNIE Tiny,由百度智能云千帆大模型平台对外提供模型调用服务,核心理念是帮助客户降本增效,在特定的场景下通过精调,使小尺寸的模型也能够达到千亿级别大模型的效率。
在经历过这一系列大模型需求的变化后,百度智能云千帆产品负责同学有感而发,“在极致关注成本的状态下,大家对大模型的期待就变成了‘不用给我最大的参数规模和最贵的模型’,而是‘在我的场景下效果最好的模型’,不再追求一个模型去解决所有问题”。
杭州全诊医学采用的就是“性价比”更高的ERNIE Speed。通过使用20万份精标病历数据对大模型进行精调,使AI医疗助理的医学用语更准确、更规范,病历生成的准确度提升了45%,医生的接诊量提高了20%。
在这一过程中,模型蒸馏、混合专家模型(MoE)等创新技术层出不穷,为的就是在保留大模型性能的同时,减少模型的计算资源消耗。
但极致的降本不止于此。在实际业务中,企业往往需要针对特定场景定制模型,以实现成本效益最大化。
宁波传媒就利用大模型定制开发了一套甬派记者作文AI点评助手系统。“小记者们投来5万多篇投稿,宁波晚报的记者老师眼睛都要看花了,好在现在有了百度智能云的千帆ModelBuilder平台开发的智能作文批改系统,可以直接提高作文的筛选和批改效率,还可以对作文进行AI点评,也能提出改进意见”,宁波晚报某技术负责人表示。
这套系统的背后,是基于百度智能云千帆ModelBuilder提供的模型精调模版——作文点评样板间来实施的,同时还辅以全流程的模型训练和精调工具链,以提高模型的运行效率。
不仅如此,千帆ModelBuilder也提供一站式的数据洞察和处理平台,企业可以构建自身的数据飞轮,让模型越用越聪明;其底层则通过百舸平台为千帆平台的模型训练及模型推理提供稳定高效的算力支撑,确保稳定、极速的性能。
这些技术演进,都进一步为企业带来了降本增效,推动着大模型的产业落地。
沙利文联合头豹发布的《2024年中国行业大模型市场报告》显示,2023年中国行业大模型市场规模达105亿元人民币,2024年市场规模约为165亿元,同比增长达57%,2028年市场规模有望达到624亿元人民币。
总的来看,2024年行业内通过降价、工具链、定制模型等一系列措施,成功打通了大模型落地的卡点,用超高的性价比迎来了产业落地需求的爆发。在这一过程中,企业对大模型成本极致的追求,也在逐步升级为提升业务的效率和核心收益,大模型技术正在走入更大的商业世界。
AI Agent
大模型应用的场景化突破
伴随AI产业竞争进入“落地赛”的下半场,业界将目光从模型本身投向了AI应用。
2024年上半年,国内大模型项目中标大多还围绕智算中心、模型中台建设,从下半年起,众多企业的招标内容全都转向了应用,且越来越细分。
百度创始人、董事长兼首席执行官李彦宏曾公开表示,基础模型本身是需要靠应用才能显现出来价值。那么,AI时代应用的核心载体应该是什么?这个问题一度成为业内热议的焦点。
在百度世界2024大会上,李彦宏公开表示“智能体是AI应用的最主流形态,即将迎来爆发点”。尽管业界对于AI Agent的定义尚未达成共识,但李彦宏的发言让行业对AI应用的发展方向更笃定了。过去一年,国内外的云厂商、大模型厂商、运营商、软件厂商纷纷涌入赛道,谁也不想错过这个“香馍馍”。
毫无疑问,AI Agent成为了2024年大模型领域最耀眼的存在,其数量一度呈爆发式增长。数据显示,截至2024年11月,千帆大模型平台上已经帮助客户精调了3.3万个模型、开发了77万个企业应用。
更让人兴奋的是,AI Agent的爆发并非虚假的繁荣,而是具备真实的市场基础。相比大模型的昂贵,能用得起的企业并不多,AI Agent更像是一个轻量化的AI解决方案,具备自主思考、自主编排、记忆、反思等能力,能够针对具体场景,解决特定业务问题,为企业带来最真实的降本增效。
但企业级业务容不得大的偏差。如何按照设定好的工作流来执行任务,并保证输出的可靠性和个性化,是企业级Agent全面落地的一个巨大挑战。
例如,在保险行业的车险续保业务场景中,让Agent替代真人销售就涉及很多业务难点:面对客户最初的拒绝态度如何化解和引导?如何根据客户历史车险情况给出优惠政策?如何按照工作流成功引导客户续保?
为了解决这些问题,百度智能云基于千帆AppBuilder工作流Agent探索,通过工作流编排的形式和大模型的能力,来落地车险续保售前数字员工。
这样的工作流Agent,可以很好地避免大模型凭空发挥,同时辅以人工编排,提升执行的稳定性和可控性,在规划调度方面的准确率能达到95%。同时,工作流Agent还具备随时学习新知识和记忆回溯的能力,记忆准确率可达96%+,为用户提供个性化的服务。
过去公司要培养一位这样合格的金牌销售至少要一两年,但现在打造这样一个“数字员工”,最快却只需要一小时。这样的工作流Agent还可以快速集成到百度搜索、微信公众号、企业官网等业务系统中,便利触达用户。
当AI Agent达到了企业级的要求,一些过去AI不太可能实现的业务场景就照进了现实。而更具市场想象力的,是多Agent协作产品的推出。
2024年11月,百度发布的无代码开发工具“秒哒”就极具代表性,由大模型直接生成代码,不需要人写,它门槛很低,人人可上手;通过文心大模型的思考和规划能力,实现对不同Agent的调度和编排,这意味着每个人自己就能指挥多个Agent来协同完成任务,不用写一行代码,只需要用自然语言就能直接生成代码、创建应用程序。
李彦宏更是宣称“我们将迎来一个前所未有的只靠想法就能赚钱的时代”。
“秒哒” 产品的发布,标志着AI Agent走入大众视野中。当越来越多的人意识到AI Agent有用,应用爆发的速度就会非常快。据银河证券研报预计,到2028年,中国AI Agent市场规模将激增至8520亿元,年复合增长率达72.7%。
如果将2024年看作是AI Agent爆发前夜,那么2025年将是AI Agent落地元年。对于企业而言,会更看重AI Agent在业务场景中的效果;对于大模型厂商而言,AI Agent技术及工具链的支撑能力成为基本要求。
多模态
原生融合的AI交互方式
2024年,AI领域迎来了一个重要的转折点——多模态大模型的兴起。
视频生成模型Sora的诞生,OpenAI多模态AI大模型GPT-4o的到来,百度百舸支持国内第一个全自研视频大模型Vidu的发布等代表性事件,都让业界看到了AI发展的新方向,多模态一下跃升为全球大模型厂商竞争的重点。
从技术上看,多模态增强了AI系统处理复杂任务的能力。比起单模态,融合了文本、图像、音频、视频等多类型数据的多模态大模型,能够提供更全面、更准确的理解和响应。
不仅如此,多模态大模型极大拓宽了AI的应用领域。过去一年,基于多模态大模型技术的创业公司如雨后春笋般诞生,文生图片、文生视频、文生3D、文生音乐、文生代码等多模态应用层出不穷,智能硬件更是基于多模态焕发了新生,为市场带来了巨大的想象空间。尽管多模态大模型勾勒的未来非常美好,但也必须承认,多模态离产业落地还有很长的一段距离。
李彦宏在百度世界2024大会上发表了类似的观点:“过去24个月,大模型最大的变化就是基本消除了‘幻觉’,今天文字层面的RAG已经做得很好,让大模型变得可用、可被信赖。但图像等多模态技术要实用,也需要准确性和可控性”。
这番发言印证了业内新的探索方向:消除多模态生成幻觉,进一步提升多模态生成的可用性。
目前,iRAG是业内公认的提升模型能力的技术方向,是一种通过引入外部知识的检索增强生成技术,能够更好地去掉大模型的幻觉。
在全球范围内,百度的这项能力是最领先的,基于检索增强的文生图技术iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG可以大幅降低创作成本。
近日,百度智能云千帆大模型平台全面上线iRAG功能,用户可通过千帆ModelBuilder直接调用使用iRAG接口;与此同时,千帆AppBuilder提供iRAG图片生成、文生视频、图生视频等丰富的多模态组件以及数字人能力,可以在Agent中定制属于自己的智能体分身;截止目前,千帆AppBuilder已提供90多个如百度搜索、百度地图这样的高质量官方组件,让AI用上更多工具,进一步提升AI能力;消除大模型的幻觉,是AI应用爆发的基础。
展望2025年多模态大模型的发展趋势,或许可以用一句话来总结:离幻觉更远,离落地更近。
AI落地
从产业到行业
过去一年的激荡,让人们充分感受到,2024年是大模型改变世界的一年。模型能力的持续迭代与训练成本的持续降低,智能体的蓬勃发展,多模态市场的快速增长,都在宣告一个新时代的到来。
来自市场的数据,直观呈现出过去一年中国大模型的落地爆发。百度数据显示,截至11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。李彦宏感慨“这个增速超出预期”,这条陡峭的增长曲线,说明AI是真需求。
根据公开招投标数据,2024年国内大模型中标项目数量和金额都呈现大幅度增长。2024年1至11月,大模型中标项目共728个,是2023年全年的3.6倍;中标金额17.1亿元,是2023年全年的2.6倍。
数据激增的背后,是AI的价值开始被看见。尤其作为领头羊的央国企,已开始进入到更深层次的产业落地。
国家电网联合百度打造国内首个千亿级多模态电力行业大模型,为电网安全稳定运行、促进新能源消纳、做好供电服务提供“超级大脑”。
山东港口联合百度打造全球首个落地应用的港口大模型,将智能化服务深入到港口管理的各个环节,打造车船货全链条智能服务网络,提升了物流供应链客户服务效率。数据显示,超过六成的央企在联合百度智能云进行AI创新。
不仅如此,各个行业的头部企业都在陆续跟进,许多上半年在观望的企业,下半年开始主动寻求已成功落地的解决方案,希望在自己的业务中复制。
蔚来汽车携手百度智能云千帆平台共同打造了端云多模态大模型,研发了人工智能助手NOMI的问答功能,让NOMI成为一个更懂用户、更聪明的座舱AI伙伴。“我们没有把它当语音助手,而是人工智能的伙伴”,蔚来汽车座舱人工智能研发负责人高杰表示,随着大模型技术的出现,NOMI的能力得到了进一步提升。
2024年,大模型已经在多个行业中实现了广泛而深入的落地,为各行各业带来了显著的价值。正如百度集团执行副总裁、百度智能云事业群总裁沈抖所说,过去的一年,是大模型从技术变革走向产业变革的关键一年。大模型重构一切,为每个企业提供平等的增长机会。
在这轮产业变革中,大模型厂商们也迅速构建了自己的技术能力、打法体系,以百度智能云为代表的头部厂商都构建了端到端、全链路的体系,从大模型底座,到企业级大模型开发平台及全链条工具,再到多样化的AI应用,充分应对用户对大模型整体解决方案的需求。
公开数据显示,2024年,百度智能云大模型在中标项目数、行业覆盖数、央国企中标项目数这三个维度里均为第一,在能源、政务、金融这三个行业的中标项目数位于所有厂商第一,成为企业级应用大模型落地的主力军。
如今,大模型仍然在快速渗透进各个行业。IDC预计,到2025年,中国的生成式AI软件市场规模将达到35.4亿美元。随着大模型产业以惊人的速度继续向前演进,2025年大模型市场格局必将发生新的变化,或许会带来人类历史上的又一次生产力跃迁。
部分素材来源官方媒体/网络新闻
【科技云报到原创】
原文标题 : 大模型进化论:AI产业落地将卷向何方?