English
主导航

旧版 API

评估外部模型

了解如何对非 OpenAI 模型运行评估。

模型选择是帮助构建者改进其 AI 应用程序的重要手段。在 OpenAI 平台上使用评估功能时,除了可以评估 OpenAI 的原生模型外,您还可以评估各种外部模型。

我们支持访问 第三方模型 (无需 API 密钥)以及访问 自定义端点 (需要 API 密钥)。

第三方模型

要使用第三方模型,必须满足以下条件:

  • 您的 OpenAI 组织必须处于 使用层级 1 or higher.
  • OpenAI 组织的管理员必须通过以下路径启用此功能: Settings > Organization > General。要启用此功能,管理员必须接受显示的使用免责声明。

对外部模型的调用会将数据传递给第三方,并且与对 OpenAI 模型的调用相比,受不同的条款约束,安全性保障也较弱。

计费和使用限制

OpenAI 目前承担第三方模型上的推理成本,但需受限于基于您组织使用层级的以下月度限制。

使用层级每月支出限额(USD)
层级 1$5
层级 2$25
层级 3$50
层级 4$100
等级 5$200

我们通过合作伙伴 OpenRouter 提供这些模型。未来,第三方模型将按标准计入您常规的 OpenAI 计费周期,费率为 OpenRouter 价格列表.

可用的第三方模型

我们提供对以下外部模型提供商的访问:

  • Google
  • Anthropic(托管于 AWS Bedrock)
  • Together
  • Fireworks

自定义端点

您可以配置完全自定义的模型端点,并在 OpenAI 平台上针对它运行评估。这通常是我们原生不支持的提供商、您自行托管的模型,或者是您用来进行推理调用的自定义代理。

要使用此功能,您的 OpenAI 组织的管理员必须通过以下方式启用“为评估启用自定义提供商”设置: Settings > Organization > General。要启用此功能,管理员必须接受显示的使用免责声明。请注意,对外部模型发起的调用会将数据传输给第三方,并且其遵循的条款和安全性保障有别于对 OpenAI 模型的调用。

一旦您有资格使用自定义提供商,您可以在 评估 选项卡下的 设置。请注意,自定义提供商是基于各个项目进行配置的。要连接您的自定义端点,您需要:

命名您的端点,提供端点 URL,并指定您的 API 密钥。我们要求您使用 https:// 端点,并且我们会出于安全考虑对您的密钥进行加密。指定您希望评估的任何模型名称(别名)。您可以点击 验证 按钮以确保您的模型已正确设置。这将向您的每个模型别名发起包含最少量输入的测试调用,并会提示任何失败。

使用外部模型运行评估

配置外部模型后,您可以在评估中通过从模型选择器中选择它来用于 数据集 or your 评估。请注意,目前不支持工具调用。

模型类型数据集评估
第三方
自定义

后续步骤

获取更多灵感,请访问 OpenAI Cookbook,其中包含示例代码和第三方资源链接,或者了解更多关于我们的评估工具的信息:

评估入门

使用数据集快速构建评估并迭代提示词。

使用评估

针对外部模型进行评估、通过 API 与评估进行交互等。