2024年将成为国内大模型产业应用爆发的元年。
文|周享玥 赵艳秋
编|牛慧
01
一次至关重要的会议
今年大模型市场正在发生剧烈的变化。
2024年春节开工后第一天,国资委召开了“中央企业人工智能专题推进会”,央国企一把手全部参加了会议。此前,央国企在大模型落地上差异巨大。“这次会议后,央国企及各地政府的变化是剧烈的。”一位行业资深人士说,“现在大家都在行动。”
“未来回望这次推进会,我认为它将被认为是人工智能发展进程上一次至关重要、意义重大的会议。”百度智能云AI与大数据平台总经理忻舟告诉数智前线。百度执行副总裁沈抖也参加了这次会议,向央国企负责人介绍大模型和产业应用现状。
会后,有央企重新撰写了今年的数字化规划,将人工智能做了重点补充。有大模型应用企业,则被东南沿海某市纳入人工智能产业专班,参与梳理大模型落地场景,加速AI落地。
更多的政策在出台:政府工作报告中提出了“人工智能+”行动;国务院印发了关于大规模设备更新的行动方案。“相当于大部分工厂的设备全要升级了。”一位工业互联网人士说。国家发改委有关负责人称,这将是一个“年规模5万亿元以上的巨大市场”。
在一系列政策和动作之下,“2024年将成为国内大模型产业应用爆发的元年。”3月21日,在首钢园区举办的百度智能云开年产品大会上,百度副总裁谢广军做出预测,并宣布千帆大模型平台的一系列新产品和举措,为大模型落地千行百业,进一步补充“弹药”。
02
“氛围起来了,我一天就睡5小时”
实际上,去年大模型的落地并不达预期,以至于去年下半年,投资市场变得谨慎。
但在这一年中,伴随基础大模型效果的改善,标杆效应,应用开发门槛的降低,再叠加政策层面的巨大推力,AI大模型不可逆的趋势,已成为业界共识。
3月21日,百度副总裁谢广军也公布一组数字:千帆平台服务企业用户数已突破8万,仅在一个月内就增长上万家,千帆ModelBuilder累计精调模型1.3万个,通过AppBuilder开发的应用数超16万,不管是客户数、精调模型数还是AI原生应用数都有大幅增长。“我们判断,2024年会成为AI原生应用的元年。”谢广军表示。
“我现在一天就睡5小时,光战略合作都忙不过来。”一位工业领域资深人士告诉数智前线,他们今年的目标是落地至少几百、上千个大模型项目。
另一位大模型服务商透露,去年是他们主动找客户,但今年元旦过后,已变成“被动接洽需求”。客户数上,2024年一季度尚未结束,这家公司处在不同环节的需求数已有上百个,每周以10个的数量新增,“我们不得不开始筛选”。
03
企业最关心的三个问题变了
“去年不少to b大模型项目都验收不了,因为客户的预期拔得很高,认为大模型是全能的。”一位服务商告诉数智前线,今年业界看到,客户对大模型有了更深的理解,已变得理性,关注的Top3问题也随之变化。
“客户之前更关注大模型通用能力能有多好,以及智算中心的规划建设,但目前已逐步转向产品驱动的应用落地。”一位政务云人士表示。
“他们现在比较关心的是大模型落地的价值。”忻舟也告诉数智前线。“企业一旦验证模型的价值后,第二步关心的就是如何降低成本,在一个能够接受的效价比下,更好地去使用模型。”
技术的延续性也备受关注。“我经常被问到,大模型的技术发展那么快,我们之前选型或采购的模型会不会过时?为它做的定制、数据标注会不会失效?”忻舟表示,这也要求大模型厂商和服务商保证产品和服务的良好延续性。
04
用户会为哪些场景买单?
针对企业最关注的落地价值,大家都在努力找杀手级应用场景。客观说,不管是C端还是B端,都还没有一个杀手级应用出现。“现在,大家都想借助这一波新机会,找到更多有价值的场景。”业内人士说。
从目前落地的场景看,“除了规模庞大的设备更新市场,我们看到不少与文本相关的应用。”忻舟说。比如,智能办公中的内容创作、PPT辅助创作;教育领域的作文批改、问题辅导和解答;营销类的广告文案生成;视频大模型辅助娱乐和视频内容的生成......但大家在寻找更具颠覆性的场景。
企业为之买单的场景也与回本周期紧密相关。“一年能回本,客户很容易接受;三五年回本,客户就要考虑考虑;7年回本,肯定得政策强制要求了。”一位大模型服务商称。他们提出了“小切口”的场景策略。
客户类型也很关键。好多客户都在做PoC,但让客户真正付钱,是一个很大的槛。上述服务商观察,有两类客户愿意为大模型买单,一类是一直享受科技红利的行业,如金融;另一类则是传统行业,国家在推动他们做数字化转型,而这些行业老龄化严重,迫切需要人工智能来解决实际困难。
05
不是性价比,是“效价比”
一旦大模型应用到企业的生产环境中,客户格外关注性价比。不过在大模型落地上,百度提出了“效价比”的概念。
“效价比最关键的是效,我们希望效果不变或效果降低程度在可控范围内,它所花费的成本最低。”忻舟说。
谢广军举例,提高效价比的方式有很多:在IaaS层,如何更高效的利用百舸AI异构计算资源;在框架层,应用飞桨深度学习框架中,加速模型的能力;在模型层,采用量化模型的方案。而在3月21日,百度发布三个轻量级大模型,来进一步推升效价比。
06
轻量级大模型,开始流行
“模型不见得是参数规模越大越好。”谢广军说。一位大模型服务商在落地一些项目后也发现,在很多垂类场景中,轻量级大模型也能达到通用大模型的效果,而推理成本更低,使用更简单。“客户不要太复杂的东西。”
轻量级大模型正成为一种趋势。在海外,Meta发布的Llama系列模型,从70亿、130亿、330亿到700亿,不同场景选择不同的模型组合,效果已被验证。
3月21日,百度发布了三款轻量级模型,由大到小分别为ERNIE Speed、ERNIE Lite、ERNIE Tiny。虽然未公布参数规模,但谢广军介绍,这三款模型是百度经过实践,最适合做模型精调和场景的模型。
百度智能云AI平台副总经理李景秋介绍,ERNIESpeed定位“最适合微调的基座模型”,推理最高可支持128K。ERNIELite由ERNIE-Bot-Turbo升级而来,但成本较后者降低53%,适合低算力AI加速卡推理使用。而ERNIETiny的部署和精调成本在文心系列模型中最低,适用于检索及推荐、意图识别等高并发低延时场景,以及端侧推理场景。
谢广军告诉数智前线,百度发布轻量级大模型,核心理念就是帮助客户降本增效,在特定的场景下,通过精调使小尺寸的模型也能够达到千亿级别大模型的效率。当轻量级大模型不能很好地解决客户问题时,就让旗舰模型来“兜底”。
这实际契合了企业用户对大模型的真实需求。一家落地了大模型的企业告诉数智前线,他们并不要求一定要用最顶尖的模型,而是更倾向于选择最适合的模型。深圳齐心集团股份有限公司CTO于斌平也透露,他们此前曾试过文心4.0的大模型,效果惊艳,但其实略超出他们的业务场景需求,于是在最近切换成了“效价比”更高的ERNIE Speed。
一位资深人士则预测,大模型会和第二次工业革命中兴起的电器一样,“最终并非一个电器通用,而是会涌现出各种各样的电器,从灯泡到电饭煲,它只会取决于不同场景下怎么样的性价比最高,怎么样的功能最强,客户接受度最高。”
07
产品化,业界今年的大动作
为了进一步提升效价比,加快落地,今年大模型企业和服务商一个明显的动作,就是加快将确定性的东西产品化,“一旦产品化,推广复制就会很快”。
百度在开年大会上,发布了两个垂直场景大模型,ERNIECharacter和ERNIEFunctions,企业不需要额外精调,可直接来开发智能助理。
其中,ERNIECharacter适合角色扮演类应用场景,如游戏NPC、客服对话等;ERNIEFunctions则更适合对话、问答场景中的外部工具和业务函数调用。某旅游出行App用ERNIEFunctions打造了智能客服助手,在执行订票、查询航班的多种方式调用下,准确性达到85%,超过了GPT4。
“同时,不管是千帆ModelBuilder还是AppBuilder上,都会做很多预置场景。”忻舟说,“这也是百度产品化中的一个重要环节。”
在工业领域,一些服务商将大模型与工业系统结合,今年将出现大量软硬件一体、成套的产品。由于产品化,一些模型落地从过去数个月,缩短到半个月。
08
大模型落地,有没有方法论?
行业人士都在寻找落地路径,在经历了一年的探索,大模型落地的一些关键点已浮出水面。
最关键的是快速闭环。一些服务商选择小场景先切入,快速形成闭环来看效果。
“企业需要基础设施和平台,快速帮助他们去找到场景,并且快速将这些场景形成demo,快速试用并得到反馈,从而形成一个很好的闭环。”忻舟说。最初千帆大模型平台的重点在推理工具链,发现企业处于找场景阶段后,他们快速调整,推出千帆AppBuilder,让企业一线业务人员通过它,能更便捷和低成本地去构建场景和应用。
3月21日,AppBuilder再度升级,组件工具已扩充到55个,同时还新增了一句话生成应用功能,能让开发者最快只需三步即可完成应用的创建与开发,进一步拉低应用门槛。
“一线听得到炮火,更有能力去解决痛点。”一位政企服务商补充说,目前大家都在场景寻找和闭环的道路上。
09
五到十倍增长,可能估少了
过去一年间,价格已经被首先“卷”了下来。
去年大模型刚在市场上出现时,模型、数据、算力等成本都非常之高,训练一个效果较好的基础大模型,动辄需要几百上千万,甚至是上亿元的投入。但随着技术的进步和使用量的增多,不管是训练成本还是推理成本,都有大幅降低。
一位工业大模型服务商告诉数智前线,现在做大模型私有化部署,成本已降到百万元起,一些小的嵌入式产品甚至可以做到5万元起。一位政务云人士透露,几十万到小一两百万元,是中腰部企业普遍能接受的价格区间。一些服务商最近推出大模型训推一体机,价格在几十万区间,预制了模型和场景,让企业先用一两台将尝试跑起来。
除了落地价格,在基础大模型层面,虽然依然很卷,但已从百模大战,逐渐向几家收敛。这在全球已经发生,比如本周融了15亿美元的明星企业Inflection,一部分团队已加入微软。
更多人将开始卷应用,这将是今年竞争最为激烈的细分板块之一。大模型服务商和开发者都非常忙碌。
至于市场走向,一位服务商称,“不要对大模型落地有一点点疑惑了,无非是你的收入翻5倍、10倍还是20倍。”
忻舟则称自己持乐观但谨慎的态度。一方面,大模型整体市场属于蓄势待发的状态,“是涨5倍还是涨10倍,我觉得可能都估计的太少了,有可能是50倍、100倍甚至是1000倍的爆发式增长”。另一方面,整个市场就好比一杯刚从冰箱里拿出来的水,只要经过轻微的扰动就会变化,还是一个不稳定的状态,还要看业界的进一步动作和进展。
原文标题 : 九问百度:大模型落地走向何方?