微软发布多代理基础设施Magnetic-One

文章目录[隐藏]

Magnetic-One框架概述
工作原理
示例任务
技术细节
评估工具
未来展望

随着企业越来越多地部署AI代理来处理复杂的多步骤任务，管理和协调这些代理成为一个关键挑战。微软最近发布了一个名为Magnetic-One的新多代理基础设施，旨在解决这一问题。Magnetic-One允许一个AI模型为多个辅助代理提供动力，这些代理共同完成不同场景中的复杂任务。微软将Magnetic-One称为通用代理系统，认为它能够“完全实现长期以来代理系统增强我们生产力、改变我们生活的愿景”。

Magnetic-One框架概述

Magnetic-One依赖于一个名为Orchestrator的代理，该代理负责指导其他四个代理，包括Websurfer、FileSurfer、Coder和ComputerTerminal。这些代理各自承担不同的任务，共同完成复杂的多步骤任务。

Orchestrator：负责管理和指导其他代理，制定任务计划并跟踪任务进度。Orchestrator创建任务账本，跟踪工作流程，并构建进度账本，自我反思任务进度并检查任务是否完成。如果任务停滞不前，Orchestrator可以重新规划任务。
Websurfer：可以命令基于Chromium的浏览器，导航到网站或执行Web搜索，点击和输入，类似于Anthropic最近发布的Computer Use，并总结内容。
FileSurfer：读取本地文件列表，目录和文件夹。
Coder：编写代码，分析来自其他代理的信息并创建新工件。
ComputerTerminal：提供一个控制台，用于执行Coder代理的程序。

工作原理

Magnetic-One的工作流程如下：

任务规划：Orchestrator首先计划如何处理任务，创建任务账本，跟踪工作流程。
任务分配：Orchestrator将任务分配给相应的代理，例如，Websurfer可以用于Web搜索，FileSurfer可以用于文件操作，Coder可以用于编写代码。
任务执行：各个代理执行分配的任务，并将结果返回给Orchestrator。
进度跟踪：Orchestrator构建进度账本，自我反思任务进度并检查任务是否完成。
错误处理：如果任务停滞不前或出现错误，Orchestrator可以重新规划任务或重新分配代理。

示例任务

微软提供的示例任务包括：

描述S&P 500的趋势
查找和导出缺失的引用
订购沙威玛

这些任务看似平凡，但涉及多个步骤和不同类型的操作，展示了Magnetic-One的灵活性和能力。

技术细节

模型选择：虽然微软使用OpenAI的GPT-4o开发了Magnetic-One，但该框架对LLM不可知。开发人员可以为Orchestrator代理部署一个推理LLM，并为其他代理部署其他LLM或小型语言模型的混合。
实验配置：微软的研究人员使用不同的Magnetic-One配置进行了实验，例如，使用OpenAI 01-preview作为Orchestrator的外循环和Coder，而其他代理继续使用GPT-4o。

评估工具

与Magnetic-One的发布相结合，微软还发布了一个名为AutoGenBench的开源代理评估工具，用于测试代理系统。AutoGenBench构建在其之前发布的用于多代理通信和协作的Autogen框架之上，帮助研究人员和开发人员评估代理系统的性能和可靠性。

未来展望

随着AI代理的普及，管理这些代理的工作流程变得越来越重要。Magnetic-One提供了一个强大的多代理基础设施，有助于企业和个人更高效地完成复杂任务。然而，AI代理的部署仍然处于早期阶段，确定最佳的多代理框架将继续是一个持续的实验。微软的这一创新为未来的发展奠定了基础，但仍有很大的改进空间。（来源）

AI PC装机指南