Ai Agent的GPT时刻?Manus技术层面解读一....
- 主升作手老陈
- 2025-03-07 21:11:34
Ai Agent的GPT时刻?Manus技术层面解读
一. Manus产品特点Manus由中国初创公司Monica.im开发,是全球第一款通用型AI Agent产品,核心定位是自主执行复杂任务并交付成果。1.1 功能与优势(1)具有自主执行任务的能力,可直接交付成果,如进行深度研究、数据分析、合同审查等多类型任务。(2)有很强的跨领域工具调用能力,不仅能写代码,还能浏览网页、操作应用,用户离线时它仍可工作。(3)在GAIA基准测试中排名较高,综合能力超越OpenAI同类产品,达到业内SOTA水平。(4)多代理架构设计可通过独立信息运行N个子代理协作,保证任务执行的稳定和安全。 1.2 技术细节(1)异步处理与任务分解发送任务时,Manus会先将任务分解,有标记任务及完成情况,子Agent完成任务会修改列表。子Agent运行在独立窗口,借助云端容器管理,在容器内完成编程、数据分析、浏览网页、抓取数据等任务。(2)任务执行流程面对复杂任务,Manus通过用的大模型先理解任务并分解成子任务,每个子任务对应一个子Agent。
子Agent调用云端执行函数,输入任务的指令转化为工具调用参数传递给云端容器完成任务。二. Manus与其他产品对比(1)与OpenAI Agent对比OpenAI的Agent主要借助浏览器工作,任务多为网站操作,而Manus更聚焦完成具体任务,不局限于网页,但二者都主要进行API调用等操作。(2)与Copilot对比Copilot只能做编程任务,且无执行结果报告;而Manus可实现代码编写、运行并产生结果,还能进行报告可视化输出。 三. 电话会议相关解答(1)基础模型与芯片Manus使用的基础大模型大概率有Claude、OpenAI,也有自己部署的DeepMind;推理芯片主要以H100为主,OpenAI部分直接调用API,无需采购芯片。(2)性能评价全球代理评价框架中,GALA Benchmark是较成熟的,OpenAI也使用该评价指标,Manus的表现是实际客观水平。(3)任务执行范围Manus执行任务主要针对公开网站和数据,对于非公开APP无法执行任务。(4)云端生态体系
Manus的解决方案对云计算利好,能增加云计算消耗量,但在执行特定平台任务时存在局限性;它是ChatGPT的agent在web使用上的更深入发展,更多依赖API完成操作。(5)是否为套壳产品从底层大部分由外部供应来看,可认为Manus是套壳模型,但从软件供应链管理角度,它是整合各模块的产品。从某种定义来看,Manus可被认为是套壳模型,并非有很高技术门槛,其底层约80%是外部供应的:如虚拟机容器用的是Docker解决方案,工具调用决策、报告生成用的也是外部大模型。换个角度,类似供应链管理,是整合各模块供应商产品,形成的一套工具流方法,只是在工程和产品上有一些创新,让执行更易用。(6)准确率与token消耗比例Manus通过编程大模型生成代码保证准确率,约能达到百分之八九十;其token消耗量比传统chatbot最少高十倍。
一. Manus产品特点Manus由中国初创公司Monica.im开发,是全球第一款通用型AI Agent产品,核心定位是自主执行复杂任务并交付成果。1.1 功能与优势(1)具有自主执行任务的能力,可直接交付成果,如进行深度研究、数据分析、合同审查等多类型任务。(2)有很强的跨领域工具调用能力,不仅能写代码,还能浏览网页、操作应用,用户离线时它仍可工作。(3)在GAIA基准测试中排名较高,综合能力超越OpenAI同类产品,达到业内SOTA水平。(4)多代理架构设计可通过独立信息运行N个子代理协作,保证任务执行的稳定和安全。 1.2 技术细节(1)异步处理与任务分解发送任务时,Manus会先将任务分解,有标记任务及完成情况,子Agent完成任务会修改列表。子Agent运行在独立窗口,借助云端容器管理,在容器内完成编程、数据分析、浏览网页、抓取数据等任务。(2)任务执行流程面对复杂任务,Manus通过用的大模型先理解任务并分解成子任务,每个子任务对应一个子Agent。
子Agent调用云端执行函数,输入任务的指令转化为工具调用参数传递给云端容器完成任务。二. Manus与其他产品对比(1)与OpenAI Agent对比OpenAI的Agent主要借助浏览器工作,任务多为网站操作,而Manus更聚焦完成具体任务,不局限于网页,但二者都主要进行API调用等操作。(2)与Copilot对比Copilot只能做编程任务,且无执行结果报告;而Manus可实现代码编写、运行并产生结果,还能进行报告可视化输出。 三. 电话会议相关解答(1)基础模型与芯片Manus使用的基础大模型大概率有Claude、OpenAI,也有自己部署的DeepMind;推理芯片主要以H100为主,OpenAI部分直接调用API,无需采购芯片。(2)性能评价全球代理评价框架中,GALA Benchmark是较成熟的,OpenAI也使用该评价指标,Manus的表现是实际客观水平。(3)任务执行范围Manus执行任务主要针对公开网站和数据,对于非公开APP无法执行任务。(4)云端生态体系
Manus的解决方案对云计算利好,能增加云计算消耗量,但在执行特定平台任务时存在局限性;它是ChatGPT的agent在web使用上的更深入发展,更多依赖API完成操作。(5)是否为套壳产品从底层大部分由外部供应来看,可认为Manus是套壳模型,但从软件供应链管理角度,它是整合各模块的产品。从某种定义来看,Manus可被认为是套壳模型,并非有很高技术门槛,其底层约80%是外部供应的:如虚拟机容器用的是Docker解决方案,工具调用决策、报告生成用的也是外部大模型。换个角度,类似供应链管理,是整合各模块供应商产品,形成的一套工具流方法,只是在工程和产品上有一些创新,让执行更易用。(6)准确率与token消耗比例Manus通过编程大模型生成代码保证准确率,约能达到百分之八九十;其token消耗量比传统chatbot最少高十倍。