OpenAI发布o3-mini：推理能力升级，助力AI发展

文章目录[隐藏]

o3-mini的诞生背景
o3-mini的特点与优势
o3-mini的性能表现
o3-mini的部署与使用
未来展望

两周前，OpenAI执行长Sam Altman曾放出预告，而上周，OpenAI正式宣布推出具备推理能力的小型AI模型——OpenAI o3-mini。目前，该模型已成功部署到ChatGPT及API中，并向付费方案用户及开发人员开放使用。

o3-mini的诞生背景

在去年12月，OpenAI曾密集发布一系列新消息，其中就包括了最新一代具备推理能力的旗舰模型o3。当时，OpenAI还预告了o3-mini将作为该系列中首个推出的模型。

o3-mini的特点与优势

o3-mini继承了OpenAI o1-mini的低成本和低延迟特性，同时在小模型的效能和速度上进行了显著提升。它在STEM（科学、数学和编程）领域表现尤为出色，为需要精准和快速处理的STEM任务提供了新的选择。尽管o1仍然是OpenAI最主要的通用知识推理模型，但在特定领域，o3-mini凭借其优势，成为了一个有力的补充。

在ChatGPT中，o3-mini被设置为中等推理能力，以平衡速度和答案的准确性。对于开发人员而言，o3-mini是OpenAI首个提供高呼声开发功能的小型模型，支持函数调用、结构化输入以及开发人员信息等功能。与o1-mini一样，o3-mini也支持流式传输。开发人员可以根据不同的使用场景，选择低、中、高三种推理能力，这种灵活性使得o3-mini在处理复杂任务时能够更积极地思考，或者在考虑延迟性时优化速度。

o3-mini的性能表现

根据OpenAI提供的数据，在AIME 2024数学基准测试中，o3-mini-high推理能力等级模型得分达到87.3，优于o1-preview的56.7和o1-mini的63.6。在科学解题的GPQA Diamond测试中，o3-mini-high（79.7）也高于o1-preview（78.3）和o1-mini（60.0）。在编程竞赛测试（Codeforces）和软件工程（SWE-bench Verified）测试中，o3-mini-high同样超过了其他两个前代模型。

此外，o3-mini现在还整合了搜索功能，能够提供实时网页答案及链接。OpenAI表示，他们致力于将搜索功能整合到所有推理模型中，而o3-mini目前是这一方向的早期原型。不过，目前o3并不支持视觉功能，需要该功能的用户仍需继续使用o1-mini。

o3-mini的部署与使用

目前，o3-mini已经部署到ChatGPT和API中。在API方面，从即日起，o3-mini已经部署到API使用层级3到5的特定开发人员的Chat Completions API、Assistants API和Batch API中。

在ChatGPT方面，Plus、Team和Pro用户现在可以访问o3-mini，企业方案用户则可以从2月开始使用。在模型选择器中，o1-mini将被o3-mini取代，后者提供更高的速度限制和更低的延迟。Plus和Team用户的每日互动消息数量也从o1-mini的50条提高到o3-mini的150条。所有付费用户都可以在模型选择器中选择响应时间较长的o3-mini-high，而Pro用户则可以无限制地选择o3-mini和o3-mini-high。

免费方案用户也可以试用o3-mini，方法是选择消息输入栏中的“Reason”图标。o3-mini也是第一个提供给免费ChatGPT用户的推理模型。

未来展望

OpenAI表示，随着模型数理推理能力的持续提升，与GPT-4相比，目前OpenAI的模型每词使用价格已降低了95%。未来，该公司将继续朝着这一方向发展。

AI PC装机指南