更新日志
找到
已发布 工作负载身份联合。受信任的工作负载无需存储长期有效的 API 密钥,即可将外部颁发的身份令牌兑换为短期 OpenAI 访问令牌。
新增了 管理 API 功能,用于管理支出提醒、模型允许列表、数据保留设置和托管工具权限,以及查询详细的账单明细项目。
已发布 安全 MCP 隧道 面向企业客户。安全 MCP 隧道让受支持的 OpenAI 产品(包括 ChatGPT 网页版、Codex、Responses API 和 AgentKit)能够通过客户托管的 tunnel-client 连接到私有或本地 MCP 服务器,而无需将这些服务器暴露在公共互联网上。
初始正式版采用客户经理主导的方式,而非自助服务。
您现在可以管理多个 IP 允许列表,并将每个列表应用于项目级别或整个组织。要进行配置,请前往“ 设置 > 安全 > IP 允许列表”.
废弃了 DALL·E 模型快照和 Realtime API Beta。
DALL·E 模型快照 dall-e-2 and dall-e-3 已于 2026 年 5 月 12 日废弃并从 API 中移除。我们建议使用 gpt-image-2, gpt-image-1, or gpt-image-1-mini instead.
Realtime API Beta 已于 2026 年 5 月 12 日废弃并从 API 中移除。如果您仍在使用测试版接口,请迁移至已正式发布的 Realtime API。详见 the migration guide and the full 废弃说明页.
新增了 return_token_budget for the Responses API 网页搜索工具。使用它可以在高投入的研究和评估工作负载中,选择加入更长时间的 GPT-5+ 推理网页搜索运行。
已发布 Realtime 2,这是一个用于端到端语音智能体的全新实时语音模型,具有可配置的推理能力,同时还推出了 Realtime Translate 用于流式语音翻译,以及 Realtime Whisper for streaming speech-to-text.
更新了 Realtime 和音频指南,增加了专用的 Realtime 翻译指南,刷新了 实时转录 用于流式转录,并将实时提示指南移至 使用实时模型.
发布了 OpenAI Developers Codex 插件。这有助于您在 Codex 中构建 AI 应用和智能体,并获得 OpenAI Platform 访问权限及 OpenAI API 设置指南。
更新后的 Agents SDK 现已在 TypeScript 中可用,支持沙箱代理并内置了开源测试工具。了解更多 此处.
Admin APIs 现已在 OpenAI SDK 的 Node、Python、Go、Ruby 和 Java 版本中受到支持。请参阅 Admin APIs 指南 获取设置说明和示例。
2026 年 4 月
已发布 GPT-5.5,这是一个用于复杂专业任务的全新前沿模型,已添加至 Chat Completions 和 Responses API,并发布了 GPT-5.5 pro 用于 Responses API 请求,以处理那些需要更多计算量的复杂问题。
GPT-5.5 支持 1M token 上下文窗口、图像输入、结构化输出、函数调用、提示词缓存、Batch、工具搜索、内置计算机使用、托管 Shell、应用补丁、技能、MCP 和网页搜索。主要更新包括:
已发布 GPT Image 2,这是一个用于图像生成和编辑的尖端图像生成模型。GPT Image 2 支持灵活的图像尺寸、高保真图像输入、基于 Token 的图像定价,以及带有 50% 折扣的 Batch API 支持。
更新了 Apps SDK with new capabilities, including:
- 在受控沙盒中运行代理;
- 检查和自定义开源工具;以及
- 控制记忆的创建时间和存储位置。
2026年3月
已发布 GPT-5.4 mini and GPT-5.4 nano 中引入了 Chat Completions 和 Responses API。GPT-5.4 mini 将 GPT-5.4 级别的能力引入了一个更快、更高效的模型,适用于高并发工作负载;而 GPT-5.4 nano 则针对简单的高并发任务进行了优化,在这些任务中速度和成本最为重要。
GPT-5.4 mini 支持 工具搜索,内置 计算机使用,且 压缩。GPT-5.4 nano 支持 compaction,但不支持工具搜索或计算机使用。
更新了 gpt-5.3-chat-latest slug 以指向当前 ChatGPT 中使用的最新模型。
更新了我们的图像编码器,以修复 GPT-5.4 中 input_image 输入的一个小问题。某些图像理解用例的质量现在可能会有所提升。无需任何操作。
扩展了 Sora API,新增了可重用的角色参考,支持生成长达 20 秒, 1080p 输出 sora-2-pro、视频扩展以及 Batch API 支持,适用于 POST /v1/videos. 1080p 生成 sora-2-pro 按 $0.70 每秒计费。了解更多 此处.
新增了 POST /v1/videos/edits 用于编辑现有视频。这将替换 POST /v1/videos/{video_id}/remix,该端点将在 6 个月。了解更多 此处.
已发布 GPT-5.4,我们用于专业工作的最新前沿模型,引入了 Chat Completions 和 Responses API,并发布了 GPT-5.4 pro 到 Responses API,用于处理需要更多计算量的复杂问题。
同期发布:
已发布 gpt-5.3-chat-latest 到 Chat Completions 和 Responses API。该模型指向 ChatGPT 当前使用的 GPT-5.3 Instant 快照。阅读更多 此处.
2026年2月
扩展了 input_file 支持,以接受更多文档、演示文稿、电子表格、代码和文本文件类型。了解更多 此处.
已发布 phase 到 Responses API。它将助手消息标记为中间注释(commentary)或最终答案(final_answer)。阅读更多 此处.
已发布 gpt-5.3-codex 到 Responses API。阅读更多 此处.
推出了 Responses API 的 WebSocket 模式。了解更多 此处.
Batch API 现已支持 GPT 图像模型: gpt-image-1.5, chatgpt-image-latest, gpt-image-1,且 gpt-image-1-mini.
更新了 gpt-5.2-chat-latest slug 以指向当前 ChatGPT 中使用的最新模型。
已推出 服务端压缩 in the Responses API.
已推出对 技能 的支持(在 Responses API 中)。我们支持跨本地执行和托管容器执行两种方式的技能。
推出了全新的 托管 Shell 工具,并支持容器中的网络功能。
新增支持 application/json 请求(针对 /v1/images/edits 的 GPT 图像模型)。JSON 请求使用 images (以及可选的 mask)配合 image_url or file_id 引用,而非 multipart 上传。
我们优化了面向 API 客户端的推理技术栈, GPT-5.2 and GPT-5.2-Codex 目前运行速度提升约 40%。模型及模型权重未作更改。
2026年1月
发布了 开放响应: 一个用于构建多提供商、可互操作的 LLM 接口的开源规范,构建于原始 OpenAI Responses API 之上。
已发布 gpt-5.2-codex 至 Responses API。GPT-5.2-Codex 是 GPT-5.2 的一个版本,专门针对 Codex 或类似环境中的智能体编码任务进行了优化。了解更多 此处.
新增了 Realtime API 的专用 SIP IP 范围。 sip.api.openai.com 执行 GeoIP 路由,并将 SIP 流量引导至最近的区域。 了解更多.
更新了 gpt-realtime-mini and gpt-audio-mini 别名现在指向 2025-12-15 快照。如果您需要之前的模型快照,请使用 gpt-realtime-mini-2025-10-06 and gpt-audio-mini-2025-10-06.
更新了 sora-2 别名以指向 sora-2-2025-12-08。如果你需要之前的模型快照,请使用 sora-2-2025-10-06.
更新了 gpt-4o-mini-tts and gpt-4o-mini-transcribe 别名现在指向 2025-12-15 快照。如果您需要之前的模型快照,请使用 gpt-4o-mini-tts-2025-03-20 and gpt-4o-mini-transcribe-2025-03-20。我们目前建议使用 gpt-4o-mini-transcribe 优于 gpt-4o-transcribe for the best results.
修复了以下问题:通过 gpt-image-1.5 and chatgpt-image-latest 进行图像编辑时错误地使用了高保真度, /v1/images/edits,即使在 fidelity 被显式设置为 low (默认值)。
2025年12月
新增了 gpt-image-1.5 and chatgpt-image-latest 至 Responses API 图像生成工具。
已发布 gpt-image-1.5 and chatgpt-image-latest,这是我们最新、最先进的图像生成模型。了解更多 此处.
已发布 GPT-5.2,GPT-5 模型系列中最新的旗舰模型。GPT-5.2 相比之前的 GPT-5.1 有以下提升:
- 通用智能
- 指令遵循
- 准确性与 Token 效率
- 多模态——尤其是视觉
- 代码生成——尤其是前端 UI 创建
- API 中的工具调用与上下文管理
- 电子表格的理解与创建。
5.2 版本的新增功能:全新的 xhigh 推理努力级别、简洁的推理摘要,以及使用压缩技术的全新上下文管理。
已发布 客户端压缩。对于使用 Responses API 进行的长时间对话,你可以使用 /responses/compact 接口,用于缩减每次对话发送的上下文。
已发布 gpt-5.1-codex-max 至 Responses API。GPT-5.1-Codex 是我们最智能的编程模型,专为长期的智能体编程任务进行了优化。了解更多 此处.
2025年11月
Realtime API 现已支持 DTMF 按键事件。您现在可以在使用 Realtime 侧带连接时接收 DTMF 事件。参见 此处文档 for more information.
已发布 GPT-5.1,GPT-5 模型系列中最新的旗舰模型。GPT-5.1 经过专门训练,在以下方面尤为擅长:
- 在无需深度思考时可提供更强的可操控性与更快的响应速度
- 代码生成与编程用例
- 智能体工作流
请注意,GPT-5.1 默认采用了新的 none 推理设置,以便在无需深度思考时提供更快的响应速度——这与 GPT-5 中先前的 medium 默认设置不同。
已发布 增强的基于角色的访问控制 (RBAC)。基于角色的访问控制 (RBAC) 允许你决定在整个组织和项目中谁可以执行哪些操作——包括通过 API 和在 Dashboard 中。
已发布 gpt-5.1-codex and gpt-5.1-codex-mini 至 Responses API。GPT-5.1-Codex 是 GPT-5.1 的一个版本,针对 Codex 或类似环境中的智能体编程任务进行了优化。了解更多 此处.
已发布 延长提示词缓存保留时间。扩展的提示缓存保留功能可使缓存前缀保持更长时间的活跃状态,最长可达 24 小时。扩展提示缓存的工作原理是:当内存已满时,将键/值张量卸载到 GPU 本地存储中,从而显著增加可用于缓存的存储容量。
2025年10月
gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 是基于 gpt-oss 构建的安全推理模型。了解更多 此处.
已发布 企业密钥管理 (EKM)。企业密钥管理 (EKM) 允许你使用由你自己的外部密钥管理系统 (KMS) 管理的密钥,对 OpenAI 上的客户内容进行加密。
已发布 英国数据驻留.
已发布 gpt-5-pro,一个版本的 GPT-5 上发布了多项新功能,该功能会消耗更多算力进行深度思考,从而持续提供更佳的答案。
已发布 gpt-realtime-mini and gpt-audio-mini 以实现更高性价比的语音转语音性能。
已发布 gpt-image-1-mini 以实现更高性价比的图像生成和编辑。
已推出 v1/videos 以使用我们最新的模型,实现丰富、详细且充满动感的视频生成和混剪 Sora 2 and Sora 2 专业版 models.
已推出 智能体构建器 用于可视化地创建自定义的多智能体工作流。
已推出 ChatKit,一个用于部署智能体的可嵌入聊天界面。
已发布 Trace 评估、数据集和提示词优化工具.
评估: 支持发布第三方模型。
已推出 服务健康仪表板.
已发布 IP 允许列表. IP 允许列表将 API 访问限制为您指定的 IP 地址或范围。
2025年9月
新增了对图像和文件作为 工具调用输出 in Responses API.
发布专用模型 gpt-5-codex, 专门为 Codex CLI.
2025年8月
OpenAI Realtime API 现已正式发布。了解更多信息,请参阅 我们的 Realtime API 指南.
新增支持 连接器 到 Responses API。连接器是由 OpenAI 维护的 MCP 封装器,适用于 Google apps、Dropbox 等热门服务,可用于授予模型对这些服务中存储数据的读取权限。
发布了 Conversations API,允许您使用 Responses API 创建和管理长时间运行的对话。请参阅 迁移指南 以查看并排对比,并了解如何从 Assistants API 集成迁移至 Responses 和 Conversations。
在 API 中发布了 GPT-5 系列模型,包括 gpt-5, gpt-5-mini,且 gpt-5-nano.
发布了 minimal 推理力度 用于优化 GPT-5 模型(支持推理)快速响应的值。
引入于 custom 工具调用 类型,允许在工具调用时向模型进行自由的输入和输出。
2025 年 6 月
已推出对 优先处理。与标准处理相比,优先级处理可显著降低延迟并保持更稳定的一致性,同时保留按需付费的灵活性。
已发布 o3-deep-research and o4-mini-deep-research,这是我们 o 系列推理模型的深度研究变体,专为深度分析和研究任务而优化。如需了解更多信息,请参阅 深度研究指南.
新的可复用提示词 现已在控制台和 Responses API。通过 API,您现在可以通过以下方式引用在控制面板中创建的模板: prompt 参数(使用一个提示词 id,可选 version)并提供动态 variables 可以包含字符串、图像或文件输入。可复用提示词在 Chat Completions 中不可用。 了解更多.
已发布 o3-pro,这是 o3 推理模型,使用更多算力以更强的推理能力和一致性来解答难题。 o3 模型的价格也已降低 适用于所有 API 请求,包括批处理和弹性处理。
新增了微调支持,使用 直接偏好优化 for the models gpt-4.1-2025-04-14, gpt-4.1-mini-2025-04-14,且 gpt-4.1-nano-2025-04-14.
新模型快照可用于 gpt-4o-audio-preview and gpt-4o-realtime-preview的版本。发布 Agents SDK for TypeScript.
2025 年 5 月
新增了对 Responses API 中新内置工具的支持,包括 远程 MCP 服务器 and 代码解释器. 了解更多关于工具的信息.
新增了对使用的支持 strict 在使用非微调模型进行并行工具调用时,工具 schema 采用该模式。新增了 schema 特性,包括针对 email 以及其他模式,并支持指定数字和数组的范围。
已推出 codex-mini-latest 在 API 中,针对 Codex CLI.
已推出对 强化微调的字符串验证。了解可用的 进行了优化,微调方法. gpt-4.1-nano 现可用于微调。
2025 年 4 月
已推出对 增强的 API 预算警报与自动充值限制.
新增了图像生成模型, gpt-image-1。该模型在图像生成方面树立了新的标杆,提升了质量并优化了指令遵循能力。
更新了图像生成和编辑端点,以支持特定于 gpt-image-1 model.
新增了两个 o 系列推理模型, o3 and o4-mini。它们在数学、科学、编码、视觉推理任务和技术写作方面树立了新的标准。
推出了 Codex,我们的代码生成命令行工具。
新增了 gpt-4.1, gpt-4.1-mini,且 gpt-4.1-nano 模型到 API。这些新模型具有改进的指令遵循能力、编码能力以及更大的上下文窗口(高达 1M token)。 gpt-4.1 and gpt-4.1-mini 可用于有监督微调。宣布弃用 gpt-4.5-preview.
2025 年 3 月
新增了 gpt-4o-mini-tts, gpt-4o-transcribe, gpt-4o-mini-transcribe,且 whisper-1 模型到 Audio API。
发布了多款新模型、新工具,以及用于智能体工作流的新 API:
- 发布了 Responses API,这是一个用于创建和使用智能体与工具的新 API。
- 为 Responses API 发布了一系列内置工具: 网络搜索, 文件搜索,且 计算机使用.
- 发布了 Apps SDK,这是一个用于设计、构建和部署智能体的编排框架。
- 发布了新模型:
gpt-4o-search-preview,gpt-4o-mini-search-preview,computer-use-preview. - 宣布计划将所有 Assistants API 功能引入更易用的 Responses API,Assistants 预计将在 2026 年停用(在实现完整功能对等之后)。
新增了 metadata 为微调任务提供该字段支持。
2025年2月
发布了以下内容的研究预览版 GPT-4.5——这是我们迄今为止最大、最强大的聊天模型。GPT-4.5极高的“EQ”和对用户意图的理解,使其在创意任务和智能体规划方面表现更出色。
推出了 API 使用情况仪表盘更新。此次更新回应了用户对于增加数据过滤器的需求,例如项目选择、日期选择器以及更精细的时间间隔。同时也更好地支持了跨不同产品和服务层级查看使用情况。
推出欧洲区域数据驻留。阅读详情 此处.
2025年1月
已推出 o3-mini,这是一个全新的小型推理模型,专为科学、数学和编码任务而优化。
扩大了以下项的访问范围 o1 模型。o1 系列模型通过强化学习进行训练,以执行复杂的推理。
2024年12月
已推出 Admin API 密钥轮换,使客户能够以编程方式轮换其管理员 API 密钥。
更新了 Admin API 邀请,使客户能够在将用户邀请到组织的同时,以编程方式将其邀请到项目中。
新增了以下模型: o1, gpt-4o-realtime, gpt-4o-audio and 更多.
为以下产品新增了 WebRTC 连接方式: Realtime API.
新增了 reasoning_effort 参数 for o1 models.
新增了 developer 消息角色 ,适用于 o1 模型。请注意,o1-preview 和 o1-mini 不支持系统或开发者消息。
使用以下技术推出了偏好微调: 直接偏好优化 (DPO).
推出了 Go 和 Java 的 Beta 版 SDK。 了解更多.
新增了 Realtime API 中的支持 Python SDK.
已推出 Usage API,使客户能够以编程方式查询 OpenAI API 的活动和支出。
2024年11月
已发布 gpt-4o-2024-11-20,这是 gpt-4o 系列的最新模型。
已发布 预测输出,该功能极大降低了在大部分回复内容已知的情况下模型响应的延迟。这在重新生成仅做了少量更改的文档和代码文件内容时最为常见。
2024 年 10 月
在 Realtime API and Chat Completions API.
已发布 新增 gpt-4o-audio-preview 模型 用于聊天补全,支持音频输入和输出。使用与 Realtime API.
Realtime API:使用 WebSockets 接口在您的应用中构建快速的语音到语音体验。
模型蒸馏:使用来自大型前沿模型的输出结果来微调高性价比模型的平台。
图像微调:使用图像和文本微调 GPT-4o,以增强视觉能力。
评估:创建并运行自定义评估,以衡量模型在特定任务上的表现。
提示缓存:为近期见过的输入 Token 提供折扣和更快的处理速度。
在 playground 中生成:在 Playground 中使用“生成”按钮,轻松生成提示词、函数定义和结构化输出模式。
2024 年 9 月
已发布 新增 omni-moderation-latest 审核模型,它同时支持图像和文本(针对部分类别),支持两种全新的纯文本有害内容类别,并且评分更加准确。
已发布 o1-preview 和 o1-mini,即经过强化学习训练的全新大型语言模型,用于执行复杂的推理任务。
2024 年 8 月
Assistants API 现已支持 包括文件搜索工具使用的文件搜索结果,以及自定义排序行为.
正式发布 gpt-4o-2024-08-06 微调——所有 API 用户现在都可以微调最新的 GPT-4o 模型。
已发布 动态模型 chatgpt-4o-latest——该模型将指向 ChatGPT 使用的最新 GPT-4o 模型。
已推出 结构化输出——模型输出现在能够可靠地遵循开发者提供的 JSON Schema。
已发布 gpt-4o-2024-08-06,这是 gpt-4o 系列的最新模型。
已推出 管理员和审计日志 API,允许客户通过审计日志以编程方式管理其组织并监控变更。必须在以下环境中启用审计日志记录: 设置.
2024 年 7 月
已推出 自助 SSO 配置,允许使用自定义和无限制账单的企业客户针对其所需的 IDP 设置身份验证。
已推出 GPT-4o mini 微调,在特定用例下实现更高的性能。
已发布 GPT-4o mini,这是我们经济实惠且智能的小型模型,适合快速、轻量的任务。
已发布 上传 以分多个部分上传大文件。
2024 年 5 月
已发布 GPT-4o 在 API 中。GPT-4o 是我们最快且最实惠的旗舰模型。
新增支持 将微调模型接入 Batch API .
新增了 stream_options: {"include_usage": true} 参数添加到了 Chat Completions 和 Completions API。设置此参数使开发者在使用流式传输时能够获取使用统计信息。
新增了 a new endpoint 以在 Assistants API 中删除线程中的消息。
2024 年 4 月
新增了 函数调用选项 tool_choice: "required" 针对 Chat Completions 和 Assistants API。
新增了 Batch API 指南 以及 Batch API 对 嵌入模型
引入了 针对 Assistants API 的系列更新 ,包括一个允许每个 assistant 最多 10,000 个文件的全新文件搜索工具、新的令牌控制,以及对工具选择的支持。
已发布 Batch API
已发布 带视觉功能的 GPT-4 Turbo 在 API 中正式可用
新增支持 seed in the fine-tuning API
新增支持 检查点 in the fine-tuning API
新增支持 创建 Run 时添加 Messages in the Assistants API
新增支持 按 run_id 筛选 Messages in the Assistants API
2024 年 3 月
新增支持 temperature and Assistant 消息创建 in the Assistants API
新增支持 如果您没有使用 in the Assistants API
2024 年 1 月
发布了 embedding V3 模型和一个更新的 GPT-4 Turbo 预览版
新增了 dimensions 参数 to the Embeddings API
2023 年 12 月
新增了 additional_instructions 参数 至 Assistants API 中的 Run 创建
新增了 logprobs and top_logprobs parameters 至 Chat Completions API
已更改 函数参数 工具调用上的参数为可选
2023 年 11 月
已发布 OpenAI Deno SDK
已发布 GPT-4 Turbo 预览版, 更新的 GPT-3.5 Turbo, 带视觉功能的 GPT-4 Turbo, Assistants API, API 中的 DALL·E 3,且 文本转语音 API
弃用了 Chat Completions functions 参数 in favor of tools
2023 年 10 月
新增了 encoding_format 参数 to the Embeddings API
新增了 max_tokens to the 审核模型
新增了 函数调用支持 to the Fine-tuning API