English
主导航

旧版 API

提示优化器

使用您的数据集自动改进您的提示。

The prompt 优化器 是控制面板中的一个聊天界面,您可以在其中输入 prompt,我们会根据当前的最佳实践对其进行优化,然后再返回给您。将 prompt 优化器与 数据集 结合使用,是实现 prompt 自动化改进的强大方法。

准备数据

  1. 设置一个 数据集 ,其中包含您想要优化的 prompt 和一个评估数据集。
  2. 在您的数据集中至少创建三行包含回复的数据。
  3. 对于每一行,至少创建一个评分器结果或人工标注。

prompt 优化器可以使用您数据集中的以下内容来改进您的 prompt:

  • 标注(好/坏以及您添加的额外自定义标注列)
  • 以文本形式编写的批评建议 output_feedback
  • 评分器结果

为了获得有效的结果,请添加包含好/坏评级的标注以及 and 详细、具体的批评建议。创建 评分器 ,以精准捕捉您期望 prompt 具备的特性。

优化您的 prompt

准备好数据集后,创建一个优化任务。

  1. 在 prompt 面板的底部,点击 优化。这将为优化结果创建一个新标签页,并开始在后台运行的优化过程。
  2. 当优化后的 prompt 准备就绪时,查看并测试新的 prompt。
  3. 重复此过程。虽然单次优化运行可能就能达到您期望的结果,但建议尝试对新的 prompt 重复此优化过程——生成输出、标注输出、运行评分器和优化。

prompt 优化的效果取决于评分器的质量。如果您的 prompt 在某些期望的输出特性上表现不佳,我们建议针对这些特性分别构建定义严格的评分器。

在生产环境中使用优化后的 prompt 之前,请务必进行评估和人工审查。虽然 prompt 优化器通常能显著提升 prompt 的有效性,但优化后的 prompt 也有可能在某些特定输入上的表现不如您的原始 prompt。

后续步骤

获取更多灵感,请访问 OpenAI Cookbook,其中包含示例代码和第三方资源链接,或者了解更多关于我们的评估工具的信息:

指南:使用评估构建弹性提示

使用评估来运作一个持续改进的飞轮。

使用评估

针对外部模型进行评估、通过 API 与评估进行交互等。

评分器

构建复杂的评分器,以提升你 eval 的有效性。

微调

提升模型生成针对您的用例量身定制响应的能力。