OpenAI发布o3-mini:推理能力升级,助力AI发展

两周前,OpenAI执行长Sam Altman曾放出预告,而上周,OpenAI正式宣布推出具备推理能力的小型AI模型——OpenAI o3-mini。目前,该模型已成功部署到ChatGPT及API中,并向付费方案用户及开发人员开放使用。

o3-mini的诞生背景

在去年12月,OpenAI曾密集发布一系列新消息,其中就包括了最新一代具备推理能力的旗舰模型o3。当时,OpenAI还预告了o3-mini将作为该系列中首个推出的模型。

o3-mini的特点与优势

o3-mini继承了OpenAI o1-mini的低成本和低延迟特性,同时在小模型的效能和速度上进行了显著提升。它在STEM(科学、数学和编程)领域表现尤为出色,为需要精准和快速处理的STEM任务提供了新的选择。尽管o1仍然是OpenAI最主要的通用知识推理模型,但在特定领域,o3-mini凭借其优势,成为了一个有力的补充。

在ChatGPT中,o3-mini被设置为中等推理能力,以平衡速度和答案的准确性。对于开发人员而言,o3-mini是OpenAI首个提供高呼声开发功能的小型模型,支持函数调用、结构化输入以及开发人员信息等功能。与o1-mini一样,o3-mini也支持流式传输。开发人员可以根据不同的使用场景,选择低、中、高三种推理能力,这种灵活性使得o3-mini在处理复杂任务时能够更积极地思考,或者在考虑延迟性时优化速度。

o3-mini的性能表现

根据OpenAI提供的数据,在AIME 2024数学基准测试中,o3-mini-high推理能力等级模型得分达到87.3,优于o1-preview的56.7和o1-mini的63.6。在科学解题的GPQA Diamond测试中,o3-mini-high(79.7)也高于o1-preview(78.3)和o1-mini(60.0)。在编程竞赛测试(Codeforces)和软件工程(SWE-bench Verified)测试中,o3-mini-high同样超过了其他两个前代模型。

此外,o3-mini现在还整合了搜索功能,能够提供实时网页答案及链接。OpenAI表示,他们致力于将搜索功能整合到所有推理模型中,而o3-mini目前是这一方向的早期原型。不过,目前o3并不支持视觉功能,需要该功能的用户仍需继续使用o1-mini。

o3-mini的部署与使用

目前,o3-mini已经部署到ChatGPT和API中。在API方面,从即日起,o3-mini已经部署到API使用层级3到5的特定开发人员的Chat Completions API、Assistants API和Batch API中。

在ChatGPT方面,Plus、Team和Pro用户现在可以访问o3-mini,企业方案用户则可以从2月开始使用。在模型选择器中,o1-mini将被o3-mini取代,后者提供更高的速度限制和更低的延迟。Plus和Team用户的每日互动消息数量也从o1-mini的50条提高到o3-mini的150条。所有付费用户都可以在模型选择器中选择响应时间较长的o3-mini-high,而Pro用户则可以无限制地选择o3-mini和o3-mini-high。

免费方案用户也可以试用o3-mini,方法是选择消息输入栏中的“Reason”图标。o3-mini也是第一个提供给免费ChatGPT用户的推理模型。

未来展望

OpenAI表示,随着模型数理推理能力的持续提升,与GPT-4相比,目前OpenAI的模型每词使用价格已降低了95%。未来,该公司将继续朝着这一方向发展。