红透全网的Manus是什么？

Manus突然一夜走红，邀请码在闲鱼卖到了5万甚至10万。周五参加一个会议，厅级大佬们对Manus聊的头头是道。巧合的是，星空君在的AI聊天群里，很多小伙伴们已经拿到了邀请码，并在群里放出了测试效果。

其实这两天全网最火的是阿里的qwq，正在各个大模型网站屠榜，它的评测效果已经超过了DeepSeek。星空君跟很多软件行业的朋友们说，这个东西是真正的生产力。

国内Manus的火爆有一些其他因素在里头吧。

不过，从放出的演示效果以及拿到邀请码的朋友们的实测情况来看，依然还是非常惊艳的。

Manus最大的成绩是跑通了这条路线，和当年ChatGPT走大力出奇迹的路线有些类似。

从基本原理来看，主要有几个模块：

1. 虚拟机：一个 Linux 系统的虚拟机，安装有

• Chrome 浏览器，用来访问网页

• Python 运行环境，可以执行脚本分析数据，可以启动一个网页运行环境

2. 任务规划器：根据用户输入的任务请求，拆分成 ToDo List，我推测是 Claude 模型，因为这一步至关重要，必须要求模型有很强的推理能力，目前来说 Claude 3.7 Sonnet 应该是很经济实惠的选择

3. 任务执行调度器：根据 ToDo List 的任务清单，逐一执行，根据任务去选择最合适的 Agent。由于这一步重点是在 Agent 的选择，所以不需要能力太强的模型，可以用开源模型比如 Qwen 稍微微调一下就可以用了。

4. 各种执行不同类型任务的 Agents：Manus 内置了很多 Agent，比如最复杂的应该是类似于 OpenAI Operator 的网页浏览 Agent，比如根据特定 API 检索特定数据的 Agent，每个 Agent 在完成任务后都会把任务结果写到虚拟机。

5. 任务汇总生成器：当每个子任务执行完成后，任务执行调度器就会通知任务汇总生成器，任务汇总生成器就会去虚拟机读取 ToDo List 以及各个子任务的生成结果，把这些结果汇总整理生成最终结果，根据任务要求，可能是一份调研报告，可能是网页程序。由于这一步要求有极强的推理能力和语言能力，所以必然要求一个很强的模型，大概率是Claude 3.7 Sonnet。

在大模型真正能和人类无缝交流之前，Agent是最佳路线，甚至说，可能是唯一路线，因为大模型很可能做不到真正的无缝交流。

过去的Agent大多以prompt+知识库为主，主要应对效率类的需求，缺乏真正的“生产力”革命。

Manus能够自行去解决问题，这是非常重大的突破。

尽管如此，我还是认为Manus只是走的领先一些，但护城河不深，这个思路给了后来者很多启发，能够迅速跟进。

Manus团队之前是做壹伴助手的，这是个公众号的排版插件。

所以，团队是懂流量的。

在Manus火爆前一天，星空君正在和团队核心成员做一个AI Agent+RPA的Demo。而且跑通了，我们内部讨论这个东西的思路和Manus非常接近了。如果在我们的Demo基础上，能让AI再写个RPA，基本就是另一个Manus。

话音未落，第二天，MetaGPT 的几个年轻人，饭后 2 小时实现了 Manus 的核心功能，并将其开源，起名叫：OpenManus。

目前来说，真正的通用AI Agent是不存在的，当然当算力达到某种突破的时候有可能存在。

Manus用一种类似虚拟机的技术来操作，对算力要求很高。

而且Manus能做的，主要都是互联网应用，最难的就是订个票画个PPT。

工业领域呢？我的生产线流程要优化了，你能生成个ERP？

现阶段不现实。

哪天大模型能瞬间生成一个ERP/MES跑业务了，那通用大模型就真的来了。

如果真的到了那一天，世界需要的算力会达到一个离谱的数量级，黄皮衣要乐坏了。

原文标题 : 红透全网的Manus是什么？

相关推荐