Ai Agent的GPT时刻？Manus技术层面解读一....

主升作手老陈
2025-03-07 21:11:34

Ai Agent的GPT时刻？Manus技术层面解读
一. Manus产品特点Manus由中国初创公司Monica.im开发，是全球第一款通用型AI Agent产品，核心定位是自主执行复杂任务并交付成果。1.1 功能与优势（1）具有自主执行任务的能力，可直接交付成果，如进行深度研究、数据分析、合同审查等多类型任务。（2）有很强的跨领域工具调用能力，不仅能写代码，还能浏览网页、操作应用，用户离线时它仍可工作。（3）在GAIA基准测试中排名较高，综合能力超越OpenAI同类产品，达到业内SOTA水平。（4）多代理架构设计可通过独立信息运行N个子代理协作，保证任务执行的稳定和安全。 1.2 技术细节（1）异步处理与任务分解发送任务时，Manus会先将任务分解，有标记任务及完成情况，子Agent完成任务会修改列表。子Agent运行在独立窗口，借助云端容器管理，在容器内完成编程、数据分析、浏览网页、抓取数据等任务。（2）任务执行流程面对复杂任务，Manus通过用的大模型先理解任务并分解成子任务，每个子任务对应一个子Agent。

子Agent调用云端执行函数，输入任务的指令转化为工具调用参数传递给云端容器完成任务。二. Manus与其他产品对比（1）与OpenAI Agent对比OpenAI的Agent主要借助浏览器工作，任务多为网站操作，而Manus更聚焦完成具体任务，不局限于网页，但二者都主要进行API调用等操作。（2）与Copilot对比Copilot只能做编程任务，且无执行结果报告；而Manus可实现代码编写、运行并产生结果，还能进行报告可视化输出。三. 电话会议相关解答（1）基础模型与芯片Manus使用的基础大模型大概率有Claude、OpenAI，也有自己部署的DeepMind；推理芯片主要以H100为主，OpenAI部分直接调用API，无需采购芯片。（2）性能评价全球代理评价框架中，GALA Benchmark是较成熟的，OpenAI也使用该评价指标，Manus的表现是实际客观水平。（3）任务执行范围Manus执行任务主要针对公开网站和数据，对于非公开APP无法执行任务。（4）云端生态体系

Manus的解决方案对云计算利好，能增加云计算消耗量，但在执行特定平台任务时存在局限性；它是ChatGPT的agent在web使用上的更深入发展，更多依赖API完成操作。（5）是否为套壳产品从底层大部分由外部供应来看，可认为Manus是套壳模型，但从软件供应链管理角度，它是整合各模块的产品。从某种定义来看，Manus可被认为是套壳模型，并非有很高技术门槛，其底层约80%是外部供应的：如虚拟机容器用的是Docker解决方案，工具调用决策、报告生成用的也是外部大模型。换个角度，类似供应链管理，是整合各模块供应商产品，形成的一套工具流方法，只是在工程和产品上有一些创新，让执行更易用。（6）准确率与token消耗比例Manus通过编程大模型生成代码保证准确率，约能达到百分之八九十；其token消耗量比传统chatbot最少高十倍。