English ← MyDocs

文档索引

获取完整文档索引:https://code.claude.com/docs/llms.txt 使用此文件发现所有可用页面,然后再进一步探索。

使用快速模式加速响应

通过切换快速模式在 Claude Code 中获得更快的 Opus 响应。

Note

快速模式处于研究预览阶段。该功能、定价和可用性可能会根据反馈进行调整。

快速模式是 Claude Opus 的高速配置,使模型速度提高 2.5 倍,但每 token 成本更高。当您需要快速迭代或实时调试等交互式工作的速度时,使用 /fast 开启;当成本比延迟更重要时,将其关闭。

快速模式不是不同的模型。它使用 Claude Opus 配合不同的 API 配置,优先考虑速度而非成本效益。您获得相同的质量和功能,但响应更快。快速模式支持 Opus 4.7 和 Opus 4.6。不适用于 Sonnet、Haiku 或其他模型。

Note

快速模式需要 Claude Code v2.1.36 或更高版本。使用 claude --version 检查您的版本。

要点:

  • 使用 /fast 在 Claude Code CLI 中切换快速模式。也可在 Claude Code VS Code 扩展中通过 /fast 使用。
  • 快速模式定价在 Opus 4.7 和 Opus 4.6 上均为 $30/$150 MTok。
  • 适用于所有订阅计划(Pro/Max/Team/Enterprise)和 Claude Console 上的 Claude Code 用户。
  • 对于订阅计划(Pro/Max/Team/Enterprise)上的 Claude Code 用户,快速模式仅通过使用额度提供,不包含在订阅速率限制中。

本页涵盖如何切换快速模式、其成本权衡何时使用要求每会话启用速率限制行为

切换快速模式

通过以下任一方式切换快速模式:

  • 输入 /fast 并按 Tab 开启或关闭
  • 在您的用户设置文件中设置 "fastMode": true

默认情况下,快速模式在会话之间持续存在。管理员可以配置快速模式在每次会话时重置。详情请参阅要求每会话启用

为获得最佳成本效益,请在会话开始时启用快速模式,而不是在对话中途切换。详情请参阅了解成本权衡

当您启用快速模式时:

  • 如果您使用的是其他模型,Claude Code 会自动切换到 Opus
  • 您将看到确认消息:"Fast mode ON"
  • 快速模式激活时,提示旁边会出现一个小 图标
  • 随时再次运行 /fast 可检查快速模式是开启还是关闭

当您再次使用 /fast 禁用快速模式时,您仍停留在 Opus 上。模型不会恢复到之前的模型。要切换到不同的模型,请使用 /model

Opus 4.7 是 Claude Code v2.1.142 及更高版本的快速模式默认值。要将快速模式固定为 Opus 4.6,请设置 CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1

了解成本权衡

快速模式的每 token 定价高于标准 Opus:

模式输入(MTok)输出(MTok)
快速模式$30$150

快速模式定价在整个 1M token 上下文窗口中是统一的。

当您在对话中途切换到快速模式时,您需要为整个对话上下文支付完整的快速模式未缓存输入 token 价格。这比从一开始就启用快速模式花费更多。

确定何时使用快速模式

快速模式最适合响应延迟比成本更重要的交互式工作:

  • 快速迭代代码更改
  • 实时调试会话
  • 截止日期紧迫的时间敏感型工作

标准模式更适合:

  • 速度不太重要的长时间自主任务
  • 批处理或 CI/CD 流水线
  • 对成本敏感的工作负载

快速模式与努力级别

快速模式和努力级别都会影响响应速度,但方式不同:

设置效果
快速模式相同模型质量,更低延迟,更高成本
更低努力级别更少思考时间,更快响应,复杂任务质量可能降低

您可以将两者结合使用:在简单任务上使用快速模式配合更低的努力级别以获得最大速度。

要求

快速模式需要以下所有条件:

  • 不适用于第三方云提供商:快速模式不适用于 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry。快速模式可通过 Anthropic Console API 和使用 Claude 订阅计划的使用额度获得。
  • 启用使用额度:您的账户必须启用使用额度,这允许在计划包含的使用量之外进行计费。对于个人账户,在您的 Console 计费设置中开启。对于 Team 和 Enterprise,管理员必须为组织启用使用额度。
Note

快速模式使用量直接从使用额度中扣除,即使您的计划中还有剩余使用量。这意味着快速模式 token 不计入您计划的包含使用量,并从第一个 token 开始按快速模式费率计费。

  • Team 和 Enterprise 需要管理员启用:快速模式对 Team 和 Enterprise 组织默认禁用。管理员必须明确启用快速模式,用户才能访问它。
Note

如果您的管理员未为您的组织启用快速模式,/fast 命令将显示"Fast mode has been disabled by your organization."

为您的组织启用快速模式

管理员可以在以下位置启用快速模式:

另一个完全禁用快速模式的选项是设置 CLAUDE_CODE_DISABLE_FAST_MODE=1。请参阅环境变量

要求每会话启用

默认情况下,快速模式在会话之间持续存在:如果用户启用快速模式,它会在未来的会话中保持开启。TeamEnterprise 计划的管理员可以通过在托管设置服务器管理设置中将 fastModePerSessionOptIn 设置为 true 来防止这种情况。这会导致每个会话以快速模式关闭开始,需要用户使用 /fast 明确启用它。

{
  "fastModePerSessionOptIn": true
}

这对于控制用户运行多个并发会话的组织中的成本非常有用。用户仍可在需要速度时使用 /fast 启用快速模式,但它会在每个新会话开始时重置。用户的快速模式偏好仍会保存,因此移除此设置会恢复默认的持续行为。

处理速率限制

快速模式与标准 Opus 有独立的速率限制。Opus 4.7 和 Opus 4.6 的快速模式共享相同的速率限制池:在任一模型上的使用量都从相同的限制中扣除。当您达到快速模式速率限制或用完使用额度时:

  1. 快速模式自动回退到标准速度
  2. 图标变为灰色表示冷却
  3. 您继续以标准速度和定价工作
  4. 冷却到期后,快速模式自动重新启用

要手动禁用快速模式而非等待冷却,请再次运行 /fast

研究预览

快速模式是研究预览功能。这意味着:

  • 该功能可能会根据反馈进行调整
  • 可用性和定价可能会发生变化
  • 底层 API 配置可能会演进

通过您常用的 Anthropic 支持渠道报告问题或反馈。

另请参阅