共计 1533 个字符,预计需要花费 4 分钟才能阅读完成。
在 OpenAI 假日主题产品发布活动“12 天 OpenAI”的第 9 天,OpenAI 通过其应用程序编程接口(API)向第三方开发者推出了其最先进的模型 o1。这一举措为希望构建新的高级 AI 应用程序或将最先进 OpenAI 技术集成到现有应用程序和工作流程中的开发者提供了重大进展,无论是面向企业还是消费者。
o1 系列模型概述
o1 系列模型是在 2024 年 9 月宣布的,作为 ChatGPT 公司新“家族”模型中的第一个成员,它超越了 GPT 家族系列的大型语言模型(LLMs),引入了“推理”能力。具体来说,o1 系列模型——包括 o1 和 o1 mini——不仅能够对用户的提示进行回答,而且在形成答案时会自我检查以确保正确性,从而减少幻觉现象。OpenAI 表示,o1 可以处理更复杂的、博士水平的问题,并且这一点已经在真实世界中得到了用户的证实。
通过 API 发布的完整 o1 模型
尽管开发者之前可以访问 o1 的预览版本并用于构建自己的应用程序(如博士顾问或实验室助理),但通过 API 发布的完整 o1 模型生产版本带来了显著的改进:
- 性能提升:提高了准确性、效率和灵活性。
- 更低延迟:响应时间更快,适合实时应用。
- 新特性:增加了结构化输出、函数调用、视觉输入处理等功能。
- 微调参数:引入了
reasoning_effort
参数,允许开发者根据任务需求调整模型的推理强度,平衡性能和响应时间。
主要更新和特性
- 性能提升
- 编码任务:在 SWE-bench Verified 上的编码结果从 41.3 提高到 48.9。
- 数学任务:在 AIME 测试中的表现从 42 跃升至 79.2。
- 视觉推理:能够处理用户上传的图像和文件,适用于制造、科学和编码等领域。
- 结构化输出
- 响应可以可靠地匹配自定义格式(如 JSON 架构),确保与外部系统交互时的一致性。
- 函数调用
- 简化了将 o1 连接到 API 和数据库的过程,增强了与其他系统的集成能力。
- 视觉输入处理
- 支持处理用户上传的图像和文件,适用于制造、科学和编码等领域的复杂任务。
- 微调参数
reasoning_effort
参数允许开发者控制模型在任务上花费的时间,以平衡性能和响应时间。
- Realtime API 更新
- WebRTC 集成:简化了基于语音的应用程序的构建,支持音频流、噪声抑制和拥塞控制。
- 降价:GPT-4o 音频的成本降低了 60%,每 100 万输入令牌的价格为 40 美元,每 100 万输出令牌的价格为 80 美元;缓存音频输入的成本降低了 87.5%,现在每 100 万输入令牌的价格为 2.50 美元。
- 并发带外响应:允许后台任务(如内容审核)在不中断用户体验的情况下运行。
- 自定义输入上下文:开发者可以关注对话的特定部分,并控制何时触发语音响应,实现更准确和无缝的交互。
- 偏好微调
- 基于成对比较的方法,教模型哪些响应是首选的,特别适用于主观任务(如摘要、创意写作或语气和风格重要的场景)。
- 早期测试显示,偏好微调帮助模型更好地处理复杂、非分布式的查询,任务准确率提高了 5% 以上。
- 新的开发 SDKs
- OpenAI 扩展了其官方 SDK 产品,发布了 Go 和 Java 的测试版,加入了现有的 Python、Node.js 和.NET 库,使得开发者能够更容易地在更多编程环境中与 OpenAI 的模型互动。
- Go SDK 特别适用于构建可扩展的后端系统,而 Java SDK 则适用于依赖强类型和健壮生态系统的企业级应用程序。
通过这些更新,OpenAI 为开发者提供了一个扩展的工具包,以构建高级、可定制的 AI 驱动应用程序。o1 模型的改进推理能力和 Realtime API 的增强,结合新的微调选项和开发 SDKs,旨在为推动 AI 集成的企业提供更高的性能和成本效益。无论是构建简化客户支持、优化物流的工具,还是解决具有挑战性的分析问题,o1 模型都为开发者提供了强大的支持,帮助他们在 AI 领域取得更大的突破。
相关文章
相关文章
正文完
关注公众号获取最新教程
