CES破圈，AI大模型“狂飙”在2024

回顾 2014 年，从年初的热潮到年中的理性回归，再到年末的稳步前行，大模型产业经历了从狂热到理性的转变。这其中，AI 大模型不仅在技术上取得了显著进步，更在应用领域实现了广泛拓展，为各行各业带来了前所未有的机遇与挑战。

产业家特此总结了2024年AI大模型发展的十大趋势。以见证变化，见证产业 AGI 的到来。

作者|斗斗

编辑|皮爷

出品|产业家

2025年1月，全球科技界的目光再次聚焦于美国拉斯维加斯的CES大会。

在这场汇聚全球顶尖科技企业、创新产品与前沿技术的盛会上，AI 无疑成为了最耀眼的明星，尤其是大模型技术，以一系列令人惊叹的落地应用，全方位展示了其强大的实力与广阔的应用前景。

这不仅为2024年 AI 大模型的“狂飙”之年画上了圆满的句号，也预示着 AI 技术将在新的一年里继续引领科技发展的新风潮。

从去年 3 月份，政府工作报告中首次将“人工智能+”纳入其中，到大模型服务价格的飞速下降，使得更多企业能够以较低的成本获取到强大的AI能力，推动了大模型在各行各业的广泛应用。

与此同时，国内开源大模型的奋起直追，打破了国外大模型在市场上的垄断地位，为国内 AI 技术的自主创新和发展提供了有力支撑。

2024 年无疑是AI大模型充满变革与突破的一年。

年初，随着大模型技术的不断突破和应用场景的拓展，市场对大模型的热情达到了顶峰，众多企业和资本纷纷涌入这一领域，希望能够借助大模型的力量实现业务的转型升级和创新发展。

然而，随着市场的不断深入和竞争的加剧，人们逐渐意识到大模型并非万能，其在实际应用中还面临着诸多挑战和局限性，如高昂的训练成本、数据隐私和安全问题、模型的可解释性和可靠性等。

这使得市场对大模型的期望逐渐回归理性，开始更加注重其在特定场景下的实际应用效果和商业价值，而非盲目追求模型的规模和性能。

产业家特此总结了过去一年AI大模型发展的十大趋势。以见证变化，见证产业 AGI 的到来。

一、大模型“祛魅”在 2024

2024 年，大模型领域经历了显著的变化。

融资方面，根据桔子IT的数据，2024 年 1 月 1 日至 12 月 5 日，国内 AI 领域共发生 439 起融资案例，总融资额超过 564 亿元人民币，约为去年的 80%。月均融资金额不足 50 亿元，显示出市场对AI投资的谨慎态度。

清科研究中心的统计也显示，今年上半年国内早期投资、风险投资（VC）、私募股权投资（PE）机构数量同比分别减少了 23.9%、19.2% 和 25.2%，反映出投资者在面对AI领域的高投入和不确定回报时变得更加谨慎和理性。

技术应用方面，2023 年众多大模型厂商主要专注于优化模型参数、提升模型性能、争夺榜单排名等，渴望成为中国的OpenAI。

然而，进入 2024 年后，行业参与者变得更加务实，开始更加关注 AI 技术的落地场景和商业化应用。市场对大模型的“祛魅”过程使得其在实际应用中的局限性逐渐显现，投资者也更加关注AI技术的实际应用效果和商业价值，而非单纯的技术指标和排名。

这种趋势促使 AI 企业更加注重产品的实用性和市场适应性，推动AI技术在各个领域的深入应用。

市场竞争方面，大模型的价格战贯穿了整个 2024 年，每百万 token 的价格从百元直降至几厘。这种价格战不仅降低了大模型的使用门槛，也对企业的盈利模式提出了新的挑战。

总体来看，2024 年 AI 行业的发展呈现出更加务实和理性的特点，市场对AI技术的关注点从单纯的技术指标转向了实际应用和商业价值，企业也更加注重产品的实用性和市场适应性，同时市场竞争的加剧也促使企业不断调整盈利模式。

二、创新 AI 架构，不断涌现

在 2024 年，AI 领域涌现出许多创新架构，这些架构在性能上与传统的 Transformer 模型相媲美，同时在内存效率和可扩展性方面也表现出显著优势。

Transformer 架构自推出以来，凭借其自注意力机制（Self-Attention, SA）在自然语言处理、图像生成等任务中取得了巨大成功。

然而，随着模型参数的不断增加，Transformer的算力需求和计算复杂性呈指数级增长，这在大规模任务中逐渐成为瓶颈。

为了应对这一挑战，全球范围内的学者和研究人员从多个角度积极探索新的架构设计。

例如，Meta Platforms推出的“记忆层”技术，通过引入高效的查询机制，显著降低了模型在存储和检索数据时的计算成本。这种技术在参数数量仅为1.3亿的基础模型上，添加了128亿的记忆参数，使得模型的性能与更大规模的模型相当，但计算所需的算力却大幅减少。

此外，混合专家模型（MoE）也逐渐受到关注。MoE架构通过将模型分解为多个专家子模型，每个子模型只在特定任务中被激活，从而大幅提高了模型的算力效率。

除了这些架构创新，元始智能的RWKV架构也引起了广泛关注。RWKV通过将Transformer的高效并行训练与RNN的高效推理能力相结合，实现了在效率和语言建模能力上的突破。尽管RNN在过去被认为能力弱于Transformer，但RWKV通过引入强化学习方法，使得模型能够在必要时重新阅读前文，从而提升了其记忆能力和整体性能。

这些新架构的涌现，不仅在技术上为AI的发展提供了新的可能性，也为解决算力开销问题提供了有效的解决方案。随着这些创新架构的不断成熟和应用，未来的AI系统将能够更好地平衡性能与资源消耗，推动AI技术在更广泛的领域中实现突破和应用。

图片来源：量子位《2024年度AI十大趋势报告》

三、模型训练成本降低

随着人工智能技术的快速发展，AI模型训练成本一直是业界关注的重点。2024年，通过算法优化、硬件升级和云计算服务的普及，这一成本显著降低。

算法优化是降低训练成本的关键因素之一。例如，DeepSeek v3模型通过采用先进的算法优化技术，仅以557万美元的训练成本，便达到了与Claude 3.5 Sonnet等顶级模型相媲美的性能。

硬件的升级也为成本降低提供了坚实基础。随着GPU等硬件性能的不断提升，单位计算能力的成本逐渐下降。DeepSeek v3在训练过程中使用了2048个H800 GPU，仅用了不到2个月的时间就完成了训练，这种硬件进步使得大规模模型的训练变得更加经济高效。

云计算服务的普及为降低训练成本提供了另一重要途径。云服务提供商通过优化资源分配和管理，使企业可以根据实际需求灵活租用计算资源，降低了初始投资和运营成本。此外，云平台还提供了强大的数据存储和处理能力，进一步支持了AI模型的训练和部署。

算法优化、硬件升级和云计算服务的普及共同作用，大幅降低了AI模型训练成本，使得AI技术更加经济且提高了模型性能。这使得更多企业和研究机构能够负担得起AI模型的开发和应用，推动了人工智能技术的广泛应用和创新。

总之，2024 年 AI 模型训练成本的显著降低，为人工智能的发展带来了新的机遇和挑战。随着技术的进一步进步，AI模型训练成本将继续下降，将推动AI技术在更多领域的应用和突破。

四、RAG，从“万能钥匙”到专攻“小而难”

2024年，RAG（检索增强生成）技术经历了显著的架构变化和市场趋势的转变。

RAG由检索和大模型生成两部分组成，其核心优势在于能够避开大模型上下文窗口长度的限制、更好地管理和利用客户专有的本地资料文件以及控制幻觉。

然而，随着大模型上下文窗口长度的增加，RAG在解决上下文窗口限制方面的优势逐渐减弱，但其在管理和利用专属知识文件以及控制幻觉方面的能力变得更加重要。

在2024年上半年，市场对AI的期望是“无所不能，大而全”，RAG技术被视为解决复杂问题的万能钥匙。

然而，随着技术的深入应用和实际落地，行业逐渐回归理性，开始更加注重“小而难”的问题解决。企业开始将大模型技术引入业务中，要求高、需求刚、付费爽快，这使得RAG在业务流程中的“白盒流程多”、“易控”等特点受到企业客户和开发者的青睐。

一个数据显示，RAG架构在企业级AI设计模式中的采用率从31%上升至51%，成为主流趋势。

这一变化反映了RAG技术在实际应用中的价值逐渐显现，尤其是在企业知识管理系统、在线问答系统和情报检索系统等领域。RAG技术的应用不仅提高了信息检索的准确性和效率，还为企业提供了更加个性化和精准的解决方案。

在技术层面，RAG的架构也在不断优化和深化应用。

例如，通过提高检索效率、扩展上下文长度和增强系统鲁棒性等措施，RAG技术能够更好地处理复杂的信息检索任务。此外，多模态RAG的出现将RAG的能力拓展到了文本之外的更广阔领域，如图像、视频等，实现了文本和视觉数据之间的无缝交互。

展望未来，RAG的价值将更加体现在实际应用中，成为推动AI落地的核心引擎。随着技术的不断发展和市场需求的不断变化，RAG技术将继续在企业级AI应用中发挥重要作用，帮助企业更好地管理和利用知识资源，提升业务效率和竞争力。

五、Agent，引领一波新变革

今年下半年，AI Agent（人工智能代理）成为了科技界的热门话题。

全球科技巨头如微软、苹果、谷歌、OpenAI和Anthropic等纷纷公布了相关进展。在国内市场，百度、阿里、腾讯等企业也相继推出了各自的智能体平台。

一个数据显示，智能体架构已经成功支撑了12%的实施项目。

这表明AI驱动的解决方案将通过软件完全操作，从而提升效率和灵活性。随着技术的不断进步，越来越多的企业开始采纳AI Agent技术，以实现更高的自动化水平和更高效的运营方式。

例如，在零售领域，AI Agent可以作为购物助手，为用户提供个性化的购物体验。在医疗领域，Agent技术能够帮助管理和分析医疗记录，提高医疗服务的效率。

然而，尽管AI Agent技术备受期待，其可信度问题也引发了广泛的关注。

大型语言模型（LLM）容易受到虚假信息的影响，这可能导致AI Agent在执行任务时出现错误。为了解决这一问题，研究人员正在探索多种方法来提高Agent的可信度。

例如，通过引入检索增强生成（RAG）技术，结合外部知识库来指导文本生成，从而提高模型的准确性和可靠性。此外，透明的运行过程和灵活的纠正机制也是构建可信Agent的重要基础。

六、多模型策略盛行

在2024年，企业界出现了一个显著的趋势：不再依赖单一的大模型，而是采取务实的多模型策略。这种策略的核心在于根据不同的使用场景和业务需求，选择合适的模型进行部署。这种转变不仅提高了模型的灵活性和适应性，还能够更好地满足企业多样化的业务需求。

数据显示，OpenAI的市场份额从50%下降至34%，这表明其先发优势有所减弱。

与此同时，Anthropic的市场份额从12%翻倍至24%，成为主要受益者。Anthropic的Claude系列模型，尤其是最新的Claude 3.5 Sonnet，在多学科综合推理方面的能力显著提升，吸引了许多企业从GPT-4转向Claude。

这种市场变化反映了企业在选择AI供应商时，更加注重模型的安全性、价格、性能和扩展功能。

多模型策略的兴起，使得企业在面对复杂的业务场景时，能够更加灵活地选择和组合不同的模型。

例如，在金融服务领域，企业可能需要一个能够处理复杂数据和严格法规的模型，而在媒体和娱乐领域，则需要一个能够生成高质量内容的模型。通过多模型策略，企业可以在不同的业务部门和应用场景中，选择最适合的模型来提高效率和效果。

此外，多模型策略还促进了企业内部的技术创新和协作。企业可以根据自身的业务需求，开发和优化特定的模型，从而在竞争中获得优势。例如，一些企业通过大模型与小模型的协同工作，实现了更高效的业务流程和更好的用户体验。

总体来看，多模型策略的盛行不仅改变了AI市场的竞争格局，也为企业的数字化转型提供了新的思路和方法。随着技术的不断进步和应用的深入，这种策略将继续推动企业创新和发展，为企业创造更多的商业价值。

七、具身智能，站上C位

2024年，具身智能作为人工智能领域的一个重要分支，逐渐成为研究和应用的热点。

在日常生活中，具身智能的应用已经初露端倪。

例如，智能扫地机器人能够通过感知周围环境，自动规划清洁路径，避免碰撞障碍物，高效完成清洁任务。自动驾驶汽车在实际道路测试中也展现出与人类驾驶员相似的驾驶能力，能够识别交通信号、行人和车辆，做出实时的驾驶决策。

人形机器人也被认为是实现具身智能的理想平台之一。

具体来看，其不仅能够模仿人类的外观，还能通过集成先进的传感器和算法，执行更加复杂的任务。

随着技术的不断进步，具身智能在多个领域展现出其独特的价值和潜力。在工业领域，具身智能机器人可以提高生产效率和安全性，执行复杂的装配、搬运和检测任务。在服务业，它们可以提供更加高效和个性化的服务，如酒店前台接待、餐厅服务等。

此外，具身智能还在探索新的应用场景，如在灾害救援中代替人类进入危险区域进行搜救。

尽管具身智能在技术上取得了显著进展，但仍面临一些挑战。

例如，硬件的稳定性和成本问题、多模态数据的整合与处理、以及在复杂环境中的适应能力等。然而，随着研究的深入和技术的突破，这些问题有望逐步得到解决，具身智能将在更多领域实现商业化应用。

总之，具身智能作为人工智能与机器人技术的结合体，正逐步改变人们的生活和工作方式。它不仅为人类提供了更加智能和便捷的服务，也为各行各业的发展带来了新的机遇和挑战。

八、向量数据库逐渐“替代”传统数据库

向量数据库作为一种新兴的数据库技术，近年来在人工智能领域迅速崛起，逐渐成为传统数据库的重要补充甚至替代者。

与传统数据库不同，向量数据库通过将数据转化为向量形式，能够更精确地表示数据的特征或类别，从而实现高效的相似性搜索和范围查询。

随着人工智能技术的飞速发展，特别是大模型的广泛应用，向量数据库的需求也在不断增加。大模型通常需要处理大量的高维数据，向量数据库能够有效地支持这些数据的存储和检索。

例如，生成式AI和检索增强生成（RAG）架构等应用，都需要向量数据库来存储和检索大量的知识库嵌入。

一组数据显示，2024年，全球数据库市场规模首次突破千亿美金，达到约1010亿美元，其中中国数据库市场规模为74.1亿美元，占全球的7.34%。

这一数据表明，向量数据库作为新兴技术，正在逐渐成为数据库市场的重要组成部分。

目前，全球数据库供应商数量为167家，产品数量达到269款。随着技术的不断发展和市场需求的增加，预计向量数据库的市场份额将继续扩大。

向量数据库的市场趋势也显示出其巨大的发展潜力。一方面，向量数据库与传统数据库的融合正在不断加深，许多传统数据库厂商也开始逐步集成向量检索的能力。另一方面，向量数据库的成本也在逐渐下降，预计未来几年将出现3-5倍的成本下降。这将进一步推动向量数据库在各个行业的应用和普及。

总之，向量数据库凭借其在处理高维数据和非结构化数据方面的独特优势，正在逐渐改变传统数据库市场的格局。随着人工智能技术的不断发展，向量数据库的应用前景将更加广阔，有望在更多领域发挥重要作用。

九、多模态模型成为2024赛点

2024年，多模态能力已成为AI大模型的基本标配。几乎所有主要的模型供应商都发布了多模态模型，能够处理图像、音频和视频输入。

例如，字节跳动在2024年推出了 PixelDance 和 Seaweed 两款视频生成模型，这些模型在视频生成的质量和效率上都有显著提升。

腾讯的混元大模型也在2024年升级为混合专家模型（MoE）架构，参数规模达万亿，擅长处理复杂场景和多任务场景。

智象未来科技有限公司在2024年12月发布了智象多模态生成大模型3.0版，该模型在图像和视频生成能力上实现了全面升级。

科大讯飞的讯飞星火大模型4.0 Turbo也在多模态应用中表现出色，支持多语种语音识别和高度拟人化的语音合成能力。

这些多模态模型的发布不仅推动了技术的进步，还为实际应用带来了新的可能性。

例如，多模态模型可以用于更复杂的场景理解，如通过图像和音频的结合来更好地理解用户的需求和意图。此外，多模态生成能力的提升也使得生成高质量的图像和视频内容变得更加容易。

随着多模态模型的普及，其应用场景也在不断扩展。在教育领域，多模态模型可以用于开发更具互动性的学习工具，通过图像和音频的结合来提高学习效果。在医疗领域，多模态模型可以帮助医生更好地分析医学影像和患者数据。在娱乐和创意产业，多模态生成模型可以用于创作新的艺术作品和影视内容。

十、从大到小，从通用到垂直

2024年，小模型在特定领域展现出了显著的优势。

这些小模型因其较低的计算复杂度和资源消耗而备受青睐，尤其是在资源受限的环境中，如移动设备和边缘计算节点。它们不仅能够高效运行，而且往往针对特定任务进行了优化，使得在某些应用场景下，它们的表现甚至能与大型模型相媲美，有时还能超越。

此外，小模型的可解释性更强，更易于用户理解和接受。以 OpenAI 的 GPT-4o mini 为例，尽管成本降低，但其性能却得到了提升，这得益于数据集和训练方法的改进。

在特定领域，垂直模型也展现出了超越通用模型的能力。

例如，在法律咨询、化工研究和医疗服务等领域，定制化的AI模型能够更深入地理解和处理专业知识，提供更准确和有针对性的服务。

这些专业模型不仅有助于解决行业内特有的问题，还促进了相关行业的快速发展。随着各行业对AI技术需求的增长，预计未来将有更多垂直模型出现，进一步推动各行业的智能化转型。

这些模型的出现，标志着AI技术正朝着更精细化、专业化的方向发展，为各行各业带来更高效的解决方案。

写在最后：

从市场对大模型的“祛魅”到创新AI架构的涌现，再到模型训练成本的降低，2024这一年，见证了AI技术的快速发展和应用场景的扩展。

RAG技术从“万能钥匙”转变为专注于解决“小而难”的问题，而AI Agent（智能体）技术则引领了一波新的变革。

多模型策略的盛行和具身智能的关注度提升，进一步推动了AI技术在各个领域的应用。

向量数据库的兴起和多模态模型的普及，标志着AI技术在处理非结构化数据和多模态信息方面的能力增强。

最后，从小模型在特定领域的显著优势到垂直模型的超越通用模型的能力，AI技术正朝着更精细化、专业化的方向发展，为各行各业带来更高效的解决方案。

这一年的发展不仅展示了AI技术的潜力，也为未来的智能化转型奠定了坚实的基础。

原文标题 : CES破圈，AI大模型“狂飙”在2024｜产业深度

CES破圈，AI大模型“狂飙”在2024

相关推荐