微软发布面向数据中心的全新 Maia 200 AI 加速器

微软今日发布了第二代 Maia 200,这是一款专为数据中心设计、针对推理优化的 AI 加速处理器。

"Maia 200 是一款突破性的推理加速器,旨在显著提升 AI Token 生成的经济效益,"微软执行副总裁 Scott Guthrie 解释道。"Maia 200 是一个 AI 推理的强大引擎。它是一款基于台积电 3 纳米工艺 打造的加速器,具备原生 FP8/FP4 张量核心、重新设计的内存系统(配备 216GB HBM3e,带宽达 7 TB/s)以及 272MB 片上 SRAM,再加上数据移动引擎,能够快速、高效地为大规模模型提供数据。"

微软宣称其 Maia 200 是目前所有超大规模云服务商中性能最强的自研芯片。其 4 位浮点性能是第三代亚马逊 Trainium 的三倍,并且在 8 位浮点性能上超越了谷歌第七代 TPU。微软指出,Maia 200 也是其部署过的最高效的推理系统,其每美元性能比当前数据中心的最新一代硬件高出 30%

微软表示,Maia 200 将为其异构 AI 基础设施中的多种模型提供服务,包括最新的 OpenAI GPT-5.2 模型,这将为 Microsoft Foundry 和 Microsoft 365 Copilot 带来"每美元性能优势"。此外,微软超级智能团队将使用 Maia 200 进行合成数据生成强化学习,以改进其下一代内部模型。

Maia 200 目前已部署在微软的爱荷华州数据中心,位于亚利桑那州凤凰城附近的 美国西部 3 数据中心区域 及其他区域将陆续跟进部署。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注