文档索引
获取完整文档索引:https://code.claude.com/docs/llms.txt 使用此文件发现所有可用页面,然后再进一步探索。
使用快速模式加速响应
通过切换快速模式在 Claude Code 中获得更快的 Opus 响应。
快速模式处于研究预览阶段。该功能、定价和可用性可能会根据反馈进行调整。
快速模式是 Claude Opus 的高速配置,使模型速度提高 2.5 倍,但每 token 成本更高。当您需要快速迭代或实时调试等交互式工作的速度时,使用 /fast 开启;当成本比延迟更重要时,将其关闭。
快速模式不是不同的模型。它使用 Claude Opus 配合不同的 API 配置,优先考虑速度而非成本效益。您获得相同的质量和功能,但响应更快。快速模式支持 Opus 4.7 和 Opus 4.6。不适用于 Sonnet、Haiku 或其他模型。
快速模式需要 Claude Code v2.1.36 或更高版本。使用 claude --version 检查您的版本。
要点:
- 使用
/fast在 Claude Code CLI 中切换快速模式。也可在 Claude Code VS Code 扩展中通过/fast使用。 - 快速模式定价在 Opus 4.7 和 Opus 4.6 上均为 $30/$150 MTok。
- 适用于所有订阅计划(Pro/Max/Team/Enterprise)和 Claude Console 上的 Claude Code 用户。
- 对于订阅计划(Pro/Max/Team/Enterprise)上的 Claude Code 用户,快速模式仅通过使用额度提供,不包含在订阅速率限制中。
本页涵盖如何切换快速模式、其成本权衡、何时使用、要求、每会话启用和速率限制行为。
切换快速模式
通过以下任一方式切换快速模式:
- 输入
/fast并按 Tab 开启或关闭 - 在您的用户设置文件中设置
"fastMode": true
默认情况下,快速模式在会话之间持续存在。管理员可以配置快速模式在每次会话时重置。详情请参阅要求每会话启用。
为获得最佳成本效益,请在会话开始时启用快速模式,而不是在对话中途切换。详情请参阅了解成本权衡。
当您启用快速模式时:
- 如果您使用的是其他模型,Claude Code 会自动切换到 Opus
- 您将看到确认消息:"Fast mode ON"
- 快速模式激活时,提示旁边会出现一个小
↯图标 - 随时再次运行
/fast可检查快速模式是开启还是关闭
当您再次使用 /fast 禁用快速模式时,您仍停留在 Opus 上。模型不会恢复到之前的模型。要切换到不同的模型,请使用 /model。
Opus 4.7 是 Claude Code v2.1.142 及更高版本的快速模式默认值。要将快速模式固定为 Opus 4.6,请设置 CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1。
了解成本权衡
快速模式的每 token 定价高于标准 Opus:
| 模式 | 输入(MTok) | 输出(MTok) |
|---|---|---|
| 快速模式 | $30 | $150 |
快速模式定价在整个 1M token 上下文窗口中是统一的。
当您在对话中途切换到快速模式时,您需要为整个对话上下文支付完整的快速模式未缓存输入 token 价格。这比从一开始就启用快速模式花费更多。
确定何时使用快速模式
快速模式最适合响应延迟比成本更重要的交互式工作:
- 快速迭代代码更改
- 实时调试会话
- 截止日期紧迫的时间敏感型工作
标准模式更适合:
- 速度不太重要的长时间自主任务
- 批处理或 CI/CD 流水线
- 对成本敏感的工作负载
快速模式与努力级别
快速模式和努力级别都会影响响应速度,但方式不同:
| 设置 | 效果 |
|---|---|
| 快速模式 | 相同模型质量,更低延迟,更高成本 |
| 更低努力级别 | 更少思考时间,更快响应,复杂任务质量可能降低 |
您可以将两者结合使用:在简单任务上使用快速模式配合更低的努力级别以获得最大速度。
要求
快速模式需要以下所有条件:
- 不适用于第三方云提供商:快速模式不适用于 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry。快速模式可通过 Anthropic Console API 和使用 Claude 订阅计划的使用额度获得。
- 启用使用额度:您的账户必须启用使用额度,这允许在计划包含的使用量之外进行计费。对于个人账户,在您的 Console 计费设置中开启。对于 Team 和 Enterprise,管理员必须为组织启用使用额度。
快速模式使用量直接从使用额度中扣除,即使您的计划中还有剩余使用量。这意味着快速模式 token 不计入您计划的包含使用量,并从第一个 token 开始按快速模式费率计费。
- Team 和 Enterprise 需要管理员启用:快速模式对 Team 和 Enterprise 组织默认禁用。管理员必须明确启用快速模式,用户才能访问它。
如果您的管理员未为您的组织启用快速模式,/fast 命令将显示"Fast mode has been disabled by your organization."
为您的组织启用快速模式
管理员可以在以下位置启用快速模式:
- Console(API 客户端):Claude Code 偏好设置
- Claude AI(Team 和 Enterprise):管理员设置 > Claude Code
另一个完全禁用快速模式的选项是设置 CLAUDE_CODE_DISABLE_FAST_MODE=1。请参阅环境变量。
要求每会话启用
默认情况下,快速模式在会话之间持续存在:如果用户启用快速模式,它会在未来的会话中保持开启。Team 或 Enterprise 计划的管理员可以通过在托管设置或服务器管理设置中将 fastModePerSessionOptIn 设置为 true 来防止这种情况。这会导致每个会话以快速模式关闭开始,需要用户使用 /fast 明确启用它。
{
"fastModePerSessionOptIn": true
}
这对于控制用户运行多个并发会话的组织中的成本非常有用。用户仍可在需要速度时使用 /fast 启用快速模式,但它会在每个新会话开始时重置。用户的快速模式偏好仍会保存,因此移除此设置会恢复默认的持续行为。
处理速率限制
快速模式与标准 Opus 有独立的速率限制。Opus 4.7 和 Opus 4.6 的快速模式共享相同的速率限制池:在任一模型上的使用量都从相同的限制中扣除。当您达到快速模式速率限制或用完使用额度时:
- 快速模式自动回退到标准速度
↯图标变为灰色表示冷却- 您继续以标准速度和定价工作
- 冷却到期后,快速模式自动重新启用
要手动禁用快速模式而非等待冷却,请再次运行 /fast。
研究预览
快速模式是研究预览功能。这意味着:
- 该功能可能会根据反馈进行调整
- 可用性和定价可能会发生变化
- 底层 API 配置可能会演进
通过您常用的 Anthropic 支持渠道报告问题或反馈。