Manus突然一夜走红,邀请码在闲鱼卖到了5万甚至10万。周五参加一个会议,厅级大佬们对Manus聊的头头是道。巧合的是,星空君在的AI聊天群里,很多小伙伴们已经拿到了邀请码,并在群里放出了测试效果。
其实这两天全网最火的是阿里的qwq,正在各个大模型网站屠榜,它的评测效果已经超过了DeepSeek。星空君跟很多软件行业的朋友们说,这个东西是真正的生产力。
国内Manus的火爆有一些其他因素在里头吧。
不过,从放出的演示效果以及拿到邀请码的朋友们的实测情况来看,依然还是非常惊艳的。
Manus最大的成绩是跑通了这条路线,和当年ChatGPT走大力出奇迹的路线有些类似。
从基本原理来看,主要有几个模块:
1. 虚拟机:一个 Linux 系统的虚拟机,安装有
• Chrome 浏览器,用来访问网页
• Python 运行环境,可以执行脚本分析数据,可以启动一个网页运行环境
2. 任务规划器:根据用户输入的任务请求,拆分成 ToDo List,我推测是 Claude 模型,因为这一步至关重要,必须要求模型有很强的推理能力,目前来说 Claude 3.7 Sonnet 应该是很经济实惠的选择
3. 任务执行调度器:根据 ToDo List 的任务清单,逐一执行,根据任务去选择最合适的 Agent。由于这一步重点是在 Agent 的选择,所以不需要能力太强的模型,可以用开源模型比如 Qwen 稍微微调一下就可以用了。
4. 各种执行不同类型任务的 Agents:Manus 内置了很多 Agent,比如最复杂的应该是类似于 OpenAI Operator 的网页浏览 Agent,比如根据特定 API 检索特定数据的 Agent,每个 Agent 在完成任务后都会把任务结果写到虚拟机。
5. 任务汇总生成器:当每个子任务执行完成后,任务执行调度器就会通知任务汇总生成器,任务汇总生成器就会去虚拟机读取 ToDo List 以及各个子任务的生成结果,把这些结果汇总整理生成最终结果,根据任务要求,可能是一份调研报告,可能是网页程序。由于这一步要求有极强的推理能力和语言能力,所以必然要求一个很强的模型,大概率是Claude 3.7 Sonnet。
在大模型真正能和人类无缝交流之前,Agent是最佳路线,甚至说,可能是唯一路线,因为大模型很可能做不到真正的无缝交流。
过去的Agent大多以prompt+知识库为主,主要应对效率类的需求,缺乏真正的“生产力”革命。
Manus能够自行去解决问题,这是非常重大的突破。
尽管如此,我还是认为Manus只是走的领先一些,但护城河不深,这个思路给了后来者很多启发,能够迅速跟进。
Manus团队之前是做壹伴助手的,这是个公众号的排版插件。
所以,团队是懂流量的。
在Manus火爆前一天,星空君正在和团队核心成员做一个AI Agent+RPA的Demo。而且跑通了,我们内部讨论这个东西的思路和Manus非常接近了。如果在我们的Demo基础上,能让AI再写个RPA,基本就是另一个Manus。
话音未落,第二天,MetaGPT 的几个年轻人,饭后 2 小时实现了 Manus 的核心功能,并将其开源,起名叫:OpenManus。
目前来说,真正的通用AI Agent是不存在的,当然当算力达到某种突破的时候有可能存在。
Manus用一种类似虚拟机的技术来操作,对算力要求很高。
而且Manus能做的,主要都是互联网应用,最难的就是订个票画个PPT。
工业领域呢?我的生产线流程要优化了,你能生成个ERP?
现阶段不现实。
哪天大模型能瞬间生成一个ERP/MES跑业务了,那通用大模型就真的来了。
如果真的到了那一天,世界需要的算力会达到一个离谱的数量级,黄皮衣要乐坏了。
原文标题 : 红透全网的Manus是什么?