红透全网的Manus是什么?

诗与星空
关注

Manus突然一夜走红,邀请码在闲鱼卖到了5万甚至10万。周五参加一个会议,厅级大佬们对Manus聊的头头是道。巧合的是,星空君在的AI聊天群里,很多小伙伴们已经拿到了邀请码,并在群里放出了测试效果。

其实这两天全网最火的是阿里的qwq,正在各个大模型网站屠榜,它的评测效果已经超过了DeepSeek。星空君跟很多软件行业的朋友们说,这个东西是真正的生产力。

国内Manus的火爆有一些其他因素在里头吧。

不过,从放出的演示效果以及拿到邀请码的朋友们的实测情况来看,依然还是非常惊艳的。

Manus最大的成绩是跑通了这条路线,和当年ChatGPT走大力出奇迹的路线有些类似。

从基本原理来看,主要有几个模块:

1. 虚拟机:一个 Linux 系统的虚拟机,安装有

• Chrome 浏览器,用来访问网页

• Python 运行环境,可以执行脚本分析数据,可以启动一个网页运行环境

2. 任务规划器:根据用户输入的任务请求,拆分成 ToDo List,我推测是 Claude 模型,因为这一步至关重要,必须要求模型有很强的推理能力,目前来说 Claude 3.7 Sonnet 应该是很经济实惠的选择

3. 任务执行调度器:根据 ToDo List 的任务清单,逐一执行,根据任务去选择最合适的 Agent。由于这一步重点是在 Agent 的选择,所以不需要能力太强的模型,可以用开源模型比如 Qwen 稍微微调一下就可以用了。

4. 各种执行不同类型任务的 Agents:Manus 内置了很多 Agent,比如最复杂的应该是类似于 OpenAI Operator 的网页浏览 Agent,比如根据特定 API 检索特定数据的 Agent,每个 Agent 在完成任务后都会把任务结果写到虚拟机。

5. 任务汇总生成器:当每个子任务执行完成后,任务执行调度器就会通知任务汇总生成器,任务汇总生成器就会去虚拟机读取 ToDo List 以及各个子任务的生成结果,把这些结果汇总整理生成最终结果,根据任务要求,可能是一份调研报告,可能是网页程序。由于这一步要求有极强的推理能力和语言能力,所以必然要求一个很强的模型,大概率是Claude 3.7 Sonnet。

在大模型真正能和人类无缝交流之前,Agent是最佳路线,甚至说,可能是唯一路线,因为大模型很可能做不到真正的无缝交流。

过去的Agent大多以prompt+知识库为主,主要应对效率类的需求,缺乏真正的“生产力”革命。

Manus能够自行去解决问题,这是非常重大的突破。

尽管如此,我还是认为Manus只是走的领先一些,但护城河不深,这个思路给了后来者很多启发,能够迅速跟进。

Manus团队之前是做壹伴助手的,这是个公众号的排版插件。

所以,团队是懂流量的。

在Manus火爆前一天,星空君正在和团队核心成员做一个AI Agent+RPA的Demo。而且跑通了,我们内部讨论这个东西的思路和Manus非常接近了。如果在我们的Demo基础上,能让AI再写个RPA,基本就是另一个Manus。

话音未落,第二天,MetaGPT 的几个年轻人,饭后 2 小时实现了 Manus 的核心功能,并将其开源,起名叫:OpenManus。

目前来说,真正的通用AI Agent是不存在的,当然当算力达到某种突破的时候有可能存在。

Manus用一种类似虚拟机的技术来操作,对算力要求很高。

而且Manus能做的,主要都是互联网应用,最难的就是订个票画个PPT。

工业领域呢?我的生产线流程要优化了,你能生成个ERP?

现阶段不现实。

哪天大模型能瞬间生成一个ERP/MES跑业务了,那通用大模型就真的来了。

如果真的到了那一天,世界需要的算力会达到一个离谱的数量级,黄皮衣要乐坏了。

       原文标题 : 红透全网的Manus是什么?

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存