大厂纷纷入局，百度、阿里、字节抢夺Agent话语权

今年大厂们冲刺Agent成了共识，字节扣子“大战”心响、夸克，但Agent还未到“GPT时刻”。

原创科技新知 AI新科技组

作者丨樱木编辑丨江篱

2025年5月，红杉资本AI峰会在旧金山落下帷幕，在这场包含Open AI创始人山姆·奥特曼以及谷歌首席科学家Jeff Dean等150位全球顶尖AI公司创始人、科学家以及投资人的大会中，一个共识逐渐被确立下来——即下一轮 AI，卖的不是工具，而是收益。这句看起来有些跳跃的话，红杉给出了一个模式性的解释，即未来AI将从卖工具到卖协作，最终走向卖成果（Software as an Outcome）。如何从卖工具到卖结果，这场红杉的峰会更具落地的意义，也许在于强调了Agent的价值。随后，硅谷大厂开启了第一波加速，微软CEO纳德拉在主题演讲中宣布：“我们已经进入了AI Agent时代，正在见证AI系统如何以全新方式帮助我们解决问题。”Open AI CEO山姆·奥特曼宣布，推出面向开发者的新Codex 智能体，称“这可能是编程史上最大的变革。”

而在大洋这一端的国内市场，已经蠢蠢欲动的大厂们，似乎也有了相同的判断，从字节、百度、阿里的动作来看，头部互联网大厂纷纷加速布局Agent应用。据内部人士透露，字节已经有7个团队在竞速Agent，而百度在前不久的create大会中直接拿出了心响，声称其为直接可用的Agent。而在阿里一侧，夸克内部已经自我定位为“超级Agent”。而除了通用Agent之外，各个大厂在垂类Agent方面也在不断加速。阿里飞猪问一问，百度旗下的法行宝等也在不断扩张。 Agent作为大模型之后的第二波确定性浪潮，已经开启了加速争夺，而最后影响战局的变量，除了各家的生态厚度，还有对于心智、用户习惯的占领。这也就意味着最终能够参战的，也许只剩下阿里与百度、字节、腾讯等少数玩家，而率先出牌的百度与阿里，能否抢得先机，值得一番拆解。

Agent爆发年，也是冲刺年

第一个叫醒大厂的，显然是Manus，这家由真格基金投资的国产Agent团队，在2025年3月初突然上线了Manus，从开启内测伊始，就赢得了全世界的关注。“10万元抢一内测码”、“一码难求”等热词刺激着人们的神经。主流观点第一次意识到，基于主流大模型的Agent居然能够实现如此强大的实操型功能应用与用户体验。而大厂的动作，似乎从那时起，就开启了加速。字节是饱和攻击的代表。在晚点的报道之中，3月初，智能体应用Manus出圈前后，字节已有至少5个团队在开发不同智能体产品，其中有些是对内工具。而这一数字在4月底时，已经达到了7个团队。4月底，字节的flow团队拿出定位为 “用户与AIAgent协同办公的最佳场所”的扣子空间并开启内测，扣子基于自研的豆包大模型（如豆包1.5Pro）构建，支持 MCP（模型上下文协议）协议，可调用飞书多维表格、高德地图、图像工具等组件。

而百度的动作，也可以从李彦宏的发言中看出端倪。在4月的百度create大会之中，李彦宏直接表明“AI的终极价值在于应用落地，而智能体是连接模型能力与用户需求的核心载体”，就在大会期间，百度一口气拿出了通用智能体心响，同时宣布mcp全兼容。

而另一方面，阿里也没有放松，基础模型的优势，以及对夸克、钉钉的加码，让其在tob和toc端都有了竞争的实力。从大模型的竞争，到Agent的竞争，大厂到底在角逐什么？简而言之，是技术加速后，交互方式的变化，对生态级别的入口争夺。一个典型的类比，就是在大模型时代，当DeepSeek出现之后，由于其技术的领先性，没有花费任何营销费用，就轻松获取了庞大的用户量，而腾讯凭借着元宝对DeepSeek的链接，直接抢夺到了大模型时代的入场券。今天的Agent也是一样的逻辑，技术的底层已经成型，谁家的产品可以快速的成型，就意味着对市场碾压级别的领先。

在红杉分享会中，一个特殊的方向也被提到，即企业级市场中，真正先跑出来的入口未必是通用大模型，而是Harvey（法律）、Open Evidence（医疗）这类垂直领域智能体 OS，因为它们能听懂行业语言，理解真实需求。而对于这两个Agent，其中open evidence大家较为熟悉，投资人朱啸虎在多次访谈中提及，作为专为医生设计的AI诊断辅助工具，通过精准的临床支持和创新的商业模式，迅速在美国医生群体中普及。所以可以看到的是，Agent的潜力不仅局限在某一两个应用上，更重要的则是生态级别的入口。而从这个角度来看，大厂无论是做智能体生态，垂直应用Agent，还是做通用Agent（心响、扣子，以及夸克）似乎都是必须要争夺的方向。

胜负手在哪儿？

“Manus能够成功，我们可以看到它用的是cloude3.5模型。”秘塔创始人在一档播客栏目中曾经评价到。从某种程度来说，这也意味着行业内的共识，最明显的例证来自于字节的扣子团队。在晚点的报道中“扣子是个开放的平台，如果国内有大模型效果比豆包好，我们也会积极使用。”扣子团队开发扣子空间时，豆包深度思考模型还没发布，他们曾考虑优先使用DeepSeek-R1，测试后发现它调用工具的能力不够。后来团队又对比六款国内大模型，使用了豆包1.5 Pro为主的多款模型。因为豆包在指令遵循、调用工具，以及多模态处理能力上表现最好，而且推理成本很低，能支撑大规模调用。

而这一观点，也被行业内广泛认同，拾象科技李广密曾在播客中坦言，预训练可能会重新变得重要，而大模型的能力也决定着Agent等能力。从这个角度来看，百度、阿里与字节几乎可以说不分伯仲。百度拿下了与苹果的合作，从某种程度来说，苹果作为智能手机行业最大的入口，承认了百度在模型能方向上的能力。而阿里则拥有qwen这个可能是最优秀的开源大模型。对于字节来说，基于豆包大模型的产品长期霸占着c端下载量，实力也非常出众。

而三方大量资源的倾注，让这场争夺愈发激烈。当然，从Agent应用的角度来看，生态的厚度也是考量胜负手的关键。Agent的本质上其实就是能够“让 AI 真正实现自主完成任务”，而相关能够调用的应用的能力也是其能否赢得战役的关键。这一点，几家大厂的选择似乎有所区别，百度开放了大模型和千帆开发平台兼容，地图、文库、网盘、Comate也开放了MCP Server。但字节则相对保守，更愿意自身成为全新的Agent工厂，阿里把所有都集合在夸克之中，超级框的概念，就是另一种能力上的调用。

而从行业从业者3月的一份数据来看，阿里的厚度优势明显。从该报告来看，国内调用较高的MCP Servers，包含了高德地图、notion、支付宝，以及minimax，而其中高德地图凭借着提供全场景覆盖的地图服务，包括地理编码、逆地理编码、IP定位、天气查询、骑行路径规划、步行路径规划、驾车路径规划成为被调用较高的APP。当然，评价生态的厚度的变量还有很多，但可以看出的是，阿里的领先优势正在扩大。从形态上来看，Agent仍然是一种社交，而从社交的视角来看，腾讯系则无疑占据着强大的优势。

腾讯总裁刘炽平回应道：“在微信生态系统内，我认为我们有机会创造一个非常独特的Agent，即AI与微信生态系统特有的内容相连接，包括社交、通信和社区能力以及内容生态系统，比如公众号和视频号，以及数以百万计的小程序。实际上你可以接入各种信息，以及许多不同垂直应用程序的交易和操作能力。”独一无二的社交生态，让腾讯特别是微信Agent也成为了不容忽视的力量。此外，成本也是Agent能否完成蜕变的另一重关键。3月18日，The Information报道，Manus现阶段的产品同时受制于其服务器容量和高昂的运营成本。据两位直接了解情况的人士透露，Manus使用人工智能公司Anthropic的模型，平均每完成一项任务需向Anthropic支付2美元。

总结来看，基础模型能力、生态厚度、成本等都在成为Agent能否突出重围的关键，而从当下来看，这些变量的发酵暂时难以区分明显的优劣。

Agent还未到“GPT时刻”

尽管大厂的竞速与Manus等爆款产品的出现让Agent赛道热度飙升，但可以确认的是，当前行业似乎远未达到类似GPT的颠覆性临界点。从技术成熟度、商业模式落地到用户心智占领，Agent仍需跨越多重鸿沟。一方面，当前Agent的核心能力仍高度依赖大模型，但模型本身存在显著局限性。CSDN博客指出，在处理多步骤任务时，大模型的规划能力容易崩溃，例如银行转账这类需十几步操作的流程，模型常因逻辑链断裂而失败。同时，尽管大厂纷纷推出Agent平台，但生态整合仍处于碎片化状态，“各自为战”的局面导致工具调用接口不统一。不同Agent对其功能的调用方式差异显著，开发者需重复适配。

红杉峰会提出的“Software as an Outcome”理念虽被广泛认同，但落地路径仍不清晰。当前Agent主要以订阅制或按调用次数收费，本质上仍是工具思维。例如，Manus的高成本导致其难以向中小企业普及，而百度心响虽宣称直接可用，但企业用户更关注其能否真正提升销售转化率或降低运营成本。此外，垂直领域的探索虽初现曙光，但规模化仍需时间。阿里飞猪问一问在旅游场景的表现可圈可点，百度法行宝在法律领域也积累了案例，但这些垂类Agent的行业渗透率仍然不高。用户对Agent的信任度尚未建立，尤其在涉及敏感数据的场景中，企业更倾向于保留人工审核环节。

当前Agent的用户体验呈现明显的两极分化。垂直场景如设计领域的Lovart，通过整合行业知识库和多模态输出，实现了“需求 - 交付”全闭环，设计师可直接基于其生成的分层文件进行迭代，效率提升数倍。但通用Agent如Manus，在处理复杂任务时仍显得笨拙——例如生成设计图时可能出现字体过小、元素堆砌等问题，用户需频繁手动调整。

更关键的是，用户对Agent的期待与实际能力存在落差。部分用户误认为Agent能完全替代人类，而实际上其在模糊指令解析、任务边界把控等方面仍需人工干预。Agent的爆发印证了AI从技术到应用的跃迁，但距离真正的“GPT 时刻”仍有漫长道路。当前的竞争本质上是生态卡位与场景定义权的争夺，大厂的角逐布局似乎都在为未来的生态战争铺路。而决定最终胜负的，不仅是技术迭代速度，更是对行业痛点的理解深度与商业模式的创新勇气。

当Agent能像水电煤一样融入日常生活，真正的变革才会到来。晚点latepost《字节AI再创业：独立组织、全链条的饱和攻击》新皮层newthings《掌权一年半来，吴泳铭是如何管理阿里巴巴的》腾讯科技《微软一晚上发了50个新东西，要建一个Agent互联的“伊甸园”》AI深度研究员《只谈生存：AI Agent倒计时 730 天，硅谷 3 位“异见者”给出 3 条活路》AI深度研究员《红杉 AI 峰会闭门 6 小时，150 位创始人共识浮现：AI 不再卖工具，而是卖收益》中国企业家《AI新战场，腾讯押注Agent》

原文标题 : 大厂纷纷入局，百度、阿里、字节抢夺Agent话语权

大厂纷纷入局，百度、阿里、字节抢夺Agent话语权

相关推荐