微软发布多代理基础设施Magnetic-One

浏览:225次阅读
没有评论

共计 1503 个字符,预计需要花费 4 分钟才能阅读完成。

随着企业越来越多地部署 AI 代理来处理复杂的多步骤任务,管理和协调这些代理成为一个关键挑战。微软最近发布了一个名为 Magnetic-One 的新多代理基础设施,旨在解决这一问题。Magnetic-One 允许一个 AI 模型为多个辅助代理提供动力,这些代理共同完成不同场景中的复杂任务。微软将 Magnetic-One 称为通用代理系统,认为它能够“完全实现长期以来代理系统增强我们生产力、改变我们生活的愿景”。

Magnetic-One 框架概述

Magnetic-One 依赖于一个名为 Orchestrator 的代理,该代理负责指导其他四个代理,包括 Websurfer、FileSurfer、Coder 和 ComputerTerminal。这些代理各自承担不同的任务,共同完成复杂的多步骤任务。

  1. Orchestrator:负责管理和指导其他代理,制定任务计划并跟踪任务进度。Orchestrator 创建任务账本,跟踪工作流程,并构建进度账本,自我反思任务进度并检查任务是否完成。如果任务停滞不前,Orchestrator 可以重新规划任务。
  2. Websurfer:可以命令基于 Chromium 的浏览器,导航到网站或执行 Web 搜索,点击和输入,类似于 Anthropic 最近发布的 Computer Use,并总结内容。
  3. FileSurfer:读取本地文件列表,目录和文件夹。
  4. Coder:编写代码,分析来自其他代理的信息并创建新工件。
  5. ComputerTerminal:提供一个控制台,用于执行 Coder 代理的程序。

工作原理

Magnetic-One 的工作流程如下:

  1. 任务规划:Orchestrator 首先计划如何处理任务,创建任务账本,跟踪工作流程。
  2. 任务分配:Orchestrator 将任务分配给相应的代理,例如,Websurfer 可以用于 Web 搜索,FileSurfer 可以用于文件操作,Coder 可以用于编写代码。
  3. 任务执行:各个代理执行分配的任务,并将结果返回给 Orchestrator。
  4. 进度跟踪:Orchestrator 构建进度账本,自我反思任务进度并检查任务是否完成。
  5. 错误处理:如果任务停滞不前或出现错误,Orchestrator 可以重新规划任务或重新分配代理。

示例任务

微软提供的示例任务包括:

  • 描述 S &P 500 的趋势
  • 查找和导出缺失的引用
  • 订购沙威玛

这些任务看似平凡,但涉及多个步骤和不同类型的操作,展示了 Magnetic-One 的灵活性和能力。

技术细节

  • 模型选择:虽然微软使用 OpenAI 的 GPT-4o 开发了 Magnetic-One,但该框架对 LLM 不可知。开发人员可以为 Orchestrator 代理部署一个推理 LLM,并为其他代理部署其他 LLM 或小型语言模型的混合。
  • 实验配置:微软的研究人员使用不同的 Magnetic-One 配置进行了实验,例如,使用 OpenAI 01-preview 作为 Orchestrator 的外循环和 Coder,而其他代理继续使用 GPT-4o。
微软发布多代理基础设施 Magnetic-One

评估工具

与 Magnetic-One 的发布相结合,微软还发布了一个名为 AutoGenBench 的开源代理评估工具,用于测试代理系统。AutoGenBench 构建在其之前发布的用于多代理通信和协作的 Autogen 框架之上,帮助研究人员和开发人员评估代理系统的性能和可靠性。

微软发布多代理基础设施 Magnetic-One

未来展望

随着 AI 代理的普及,管理这些代理的工作流程变得越来越重要。Magnetic-One 提供了一个强大的多代理基础设施,有助于企业和个人更高效地完成复杂任务。然而,AI 代理的部署仍然处于早期阶段,确定最佳的多代理框架将继续是一个持续的实验。微软的这一创新为未来的发展奠定了基础,但仍有很大的改进空间。(来源

正文完
关注公众号获取最新教程
post-qrcode
 0
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 于2024-11-06发表,共计1503字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。