共计 1503 个字符,预计需要花费 4 分钟才能阅读完成。
随着企业越来越多地部署 AI 代理来处理复杂的多步骤任务,管理和协调这些代理成为一个关键挑战。微软最近发布了一个名为 Magnetic-One 的新多代理基础设施,旨在解决这一问题。Magnetic-One 允许一个 AI 模型为多个辅助代理提供动力,这些代理共同完成不同场景中的复杂任务。微软将 Magnetic-One 称为通用代理系统,认为它能够“完全实现长期以来代理系统增强我们生产力、改变我们生活的愿景”。
Magnetic-One 框架概述
Magnetic-One 依赖于一个名为 Orchestrator 的代理,该代理负责指导其他四个代理,包括 Websurfer、FileSurfer、Coder 和 ComputerTerminal。这些代理各自承担不同的任务,共同完成复杂的多步骤任务。
- Orchestrator:负责管理和指导其他代理,制定任务计划并跟踪任务进度。Orchestrator 创建任务账本,跟踪工作流程,并构建进度账本,自我反思任务进度并检查任务是否完成。如果任务停滞不前,Orchestrator 可以重新规划任务。
- Websurfer:可以命令基于 Chromium 的浏览器,导航到网站或执行 Web 搜索,点击和输入,类似于 Anthropic 最近发布的 Computer Use,并总结内容。
- FileSurfer:读取本地文件列表,目录和文件夹。
- Coder:编写代码,分析来自其他代理的信息并创建新工件。
- ComputerTerminal:提供一个控制台,用于执行 Coder 代理的程序。
工作原理
Magnetic-One 的工作流程如下:
- 任务规划:Orchestrator 首先计划如何处理任务,创建任务账本,跟踪工作流程。
- 任务分配:Orchestrator 将任务分配给相应的代理,例如,Websurfer 可以用于 Web 搜索,FileSurfer 可以用于文件操作,Coder 可以用于编写代码。
- 任务执行:各个代理执行分配的任务,并将结果返回给 Orchestrator。
- 进度跟踪:Orchestrator 构建进度账本,自我反思任务进度并检查任务是否完成。
- 错误处理:如果任务停滞不前或出现错误,Orchestrator 可以重新规划任务或重新分配代理。
示例任务
微软提供的示例任务包括:
- 描述 S &P 500 的趋势
- 查找和导出缺失的引用
- 订购沙威玛
这些任务看似平凡,但涉及多个步骤和不同类型的操作,展示了 Magnetic-One 的灵活性和能力。
技术细节
- 模型选择:虽然微软使用 OpenAI 的 GPT-4o 开发了 Magnetic-One,但该框架对 LLM 不可知。开发人员可以为 Orchestrator 代理部署一个推理 LLM,并为其他代理部署其他 LLM 或小型语言模型的混合。
- 实验配置:微软的研究人员使用不同的 Magnetic-One 配置进行了实验,例如,使用 OpenAI 01-preview 作为 Orchestrator 的外循环和 Coder,而其他代理继续使用 GPT-4o。

评估工具
与 Magnetic-One 的发布相结合,微软还发布了一个名为 AutoGenBench 的开源代理评估工具,用于测试代理系统。AutoGenBench 构建在其之前发布的用于多代理通信和协作的 Autogen 框架之上,帮助研究人员和开发人员评估代理系统的性能和可靠性。

未来展望
随着 AI 代理的普及,管理这些代理的工作流程变得越来越重要。Magnetic-One 提供了一个强大的多代理基础设施,有助于企业和个人更高效地完成复杂任务。然而,AI 代理的部署仍然处于早期阶段,确定最佳的多代理框架将继续是一个持续的实验。微软的这一创新为未来的发展奠定了基础,但仍有很大的改进空间。(来源)
相关文章
相关文章
正文完
关注公众号获取最新教程

发表至: 大语言模型
2024-11-06