OpenAI发布o3-mini:推理能力升级,助力AI发展

浏览:246次阅读
没有评论

共计 1472 个字符,预计需要花费 4 分钟才能阅读完成。

两周前,OpenAI 执行长 Sam Altman 曾放出预告,而上周,OpenAI 正式宣布推出具备推理能力的小型 AI 模型——OpenAI o3-mini。目前,该模型已成功部署到 ChatGPT 及 API 中,并向付费方案用户及开发人员开放使用。

o3-mini 的诞生背景

在去年 12 月,OpenAI 曾密集发布一系列新消息,其中就包括了最新一代具备推理能力的旗舰模型 o3。当时,OpenAI 还预告了 o3-mini 将作为该系列中首个推出的模型。

o3-mini 的特点与优势

o3-mini 继承了 OpenAI o1-mini 的低成本和低延迟特性,同时在小模型的效能和速度上进行了显著提升。它在 STEM(科学、数学和编程)领域表现尤为出色,为需要精准和快速处理的 STEM 任务提供了新的选择。尽管 o1 仍然是 OpenAI 最主要的通用知识推理模型,但在特定领域,o3-mini 凭借其优势,成为了一个有力的补充。

OpenAI 发布 o3-mini:推理能力升级,助力 AI 发展

在 ChatGPT 中,o3-mini 被设置为中等推理能力,以平衡速度和答案的准确性。对于开发人员而言,o3-mini 是 OpenAI 首个提供高呼声开发功能的小型模型,支持函数调用、结构化输入以及开发人员信息等功能。与 o1-mini 一样,o3-mini 也支持流式传输。开发人员可以根据不同的使用场景,选择低、中、高三种推理能力,这种灵活性使得 o3-mini 在处理复杂任务时能够更积极地思考,或者在考虑延迟性时优化速度。

o3-mini 的性能表现

根据 OpenAI 提供的数据,在 AIME 2024 数学基准测试中,o3-mini-high 推理能力等级模型得分达到 87.3,优于 o1-preview 的 56.7 和 o1-mini 的 63.6。在科学解题的 GPQA Diamond 测试中,o3-mini-high(79.7)也高于 o1-preview(78.3)和 o1-mini(60.0)。在编程竞赛测试(Codeforces)和软件工程(SWE-bench Verified)测试中,o3-mini-high 同样超过了其他两个前代模型。

OpenAI 发布 o3-mini:推理能力升级,助力 AI 发展

此外,o3-mini 现在还整合了搜索功能,能够提供实时网页答案及链接。OpenAI 表示,他们致力于将搜索功能整合到所有推理模型中,而 o3-mini 目前是这一方向的早期原型。不过,目前 o3 并不支持视觉功能,需要该功能的用户仍需继续使用 o1-mini。

o3-mini 的部署与使用

目前,o3-mini 已经部署到 ChatGPT 和 API 中。在 API 方面,从即日起,o3-mini 已经部署到 API 使用层级 3 到 5 的特定开发人员的 Chat Completions API、Assistants API 和 Batch API 中。

在 ChatGPT 方面,Plus、Team 和 Pro 用户现在可以访问 o3-mini,企业方案用户则可以从 2 月开始使用。在模型选择器中,o1-mini 将被 o3-mini 取代,后者提供更高的速度限制和更低的延迟。Plus 和 Team 用户的每日互动消息数量也从 o1-mini 的 50 条提高到 o3-mini 的 150 条。所有付费用户都可以在模型选择器中选择响应时间较长的 o3-mini-high,而 Pro 用户则可以无限制地选择 o3-mini 和 o3-mini-high。

免费方案用户也可以试用 o3-mini,方法是选择消息输入栏中的“Reason”图标。o3-mini 也是第一个提供给免费 ChatGPT 用户的推理模型。

未来展望

OpenAI 表示,随着模型数理推理能力的持续提升,与 GPT- 4 相比,目前 OpenAI 的模型每词使用价格已降低了 95%。未来,该公司将继续朝着这一方向发展。

正文完
关注公众号获取最新教程
post-qrcode
 0
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 于2025-02-04发表,共计1472字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。