{/* TRANSLATED — 已翻译为中文 */}

> ## 文档索引
> 获取完整文档索引：https://code.claude.com/docs/llms.txt
> 使用此文件发现所有可用页面，然后再进一步探索。

# 使用快速模式加速响应

> 通过切换快速模式在 Claude Code 中获得更快的 Opus 响应。

<Note>
  快速模式处于[研究预览](#研究预览)阶段。该功能、定价和可用性可能会根据反馈进行调整。
</Note>

快速模式是 Claude Opus 的高速配置，使模型速度提高 2.5 倍，但每 token 成本更高。当您需要快速迭代或实时调试等交互式工作的速度时，使用 `/fast` 开启；当成本比延迟更重要时，将其关闭。

快速模式不是不同的模型。它使用 Claude Opus 配合不同的 API 配置，优先考虑速度而非成本效益。您获得相同的质量和功能，但响应更快。快速模式支持 Opus 4.7 和 Opus 4.6。不适用于 Sonnet、Haiku 或其他模型。

<Note>
  快速模式需要 Claude Code v2.1.36 或更高版本。使用 `claude --version` 检查您的版本。
</Note>

要点：

* 使用 `/fast` 在 Claude Code CLI 中切换快速模式。也可在 Claude Code VS Code 扩展中通过 `/fast` 使用。
* 快速模式定价在 Opus 4.7 和 Opus 4.6 上均为 \$30/\$150 MTok。
* 适用于所有订阅计划（Pro/Max/Team/Enterprise）和 Claude Console 上的 Claude Code 用户。
* 对于订阅计划（Pro/Max/Team/Enterprise）上的 Claude Code 用户，快速模式仅通过使用额度提供，不包含在订阅速率限制中。

本页涵盖如何[切换快速模式](#切换快速模式)、其[成本权衡](#了解成本权衡)、[何时使用](#确定何时使用快速模式)、[要求](#要求)、[每会话启用](#要求每会话启用)和[速率限制行为](#处理速率限制)。

## 切换快速模式

通过以下任一方式切换快速模式：

* 输入 `/fast` 并按 Tab 开启或关闭
* 在您的[用户设置文件](/en/settings)中设置 `"fastMode": true`

默认情况下，快速模式在会话之间持续存在。管理员可以配置快速模式在每次会话时重置。详情请参阅[要求每会话启用](#要求每会话启用)。

为获得最佳成本效益，请在会话开始时启用快速模式，而不是在对话中途切换。详情请参阅[了解成本权衡](#了解成本权衡)。

当您启用快速模式时：

* 如果您使用的是其他模型，Claude Code 会自动切换到 Opus
* 您将看到确认消息："Fast mode ON"
* 快速模式激活时，提示旁边会出现一个小 `↯` 图标
* 随时再次运行 `/fast` 可检查快速模式是开启还是关闭

当您再次使用 `/fast` 禁用快速模式时，您仍停留在 Opus 上。模型不会恢复到之前的模型。要切换到不同的模型，请使用 `/model`。

Opus 4.7 是 Claude Code v2.1.142 及更高版本的快速模式默认值。要将快速模式固定为 Opus 4.6，请设置 `CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1`。

## 了解成本权衡

快速模式的每 token 定价高于标准 Opus：

| 模式 | 输入（MTok） | 输出（MTok） |
| --- | --- | --- |
| 快速模式 | \$30 | \$150 |

快速模式定价在整个 1M token 上下文窗口中是统一的。

当您在对话中途切换到快速模式时，您需要为整个对话上下文支付完整的快速模式未缓存输入 token 价格。这比从一开始就启用快速模式花费更多。

## 确定何时使用快速模式

快速模式最适合响应延迟比成本更重要的交互式工作：

* 快速迭代代码更改
* 实时调试会话
* 截止日期紧迫的时间敏感型工作

标准模式更适合：

* 速度不太重要的长时间自主任务
* 批处理或 CI/CD 流水线
* 对成本敏感的工作负载

### 快速模式与努力级别

快速模式和努力级别都会影响响应速度，但方式不同：

| 设置 | 效果 |
| --- | --- |
| **快速模式** | 相同模型质量，更低延迟，更高成本 |
| **更低努力级别** | 更少思考时间，更快响应，复杂任务质量可能降低 |

您可以将两者结合使用：在简单任务上使用快速模式配合更低的[努力级别](/en/model-config#adjust-effort-level)以获得最大速度。

## 要求

快速模式需要以下所有条件：

* **不适用于第三方云提供商**：快速模式不适用于 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry。快速模式可通过 Anthropic Console API 和使用 Claude 订阅计划的使用额度获得。
* **启用使用额度**：您的账户必须启用使用额度，这允许在计划包含的使用量之外进行计费。对于个人账户，在您的 [Console 计费设置](https://platform.claude.com/settings/organization/billing)中开启。对于 Team 和 Enterprise，管理员必须为组织启用使用额度。

<Note>
  快速模式使用量直接从使用额度中扣除，即使您的计划中还有剩余使用量。这意味着快速模式 token 不计入您计划的包含使用量，并从第一个 token 开始按快速模式费率计费。
</Note>

* **Team 和 Enterprise 需要管理员启用**：快速模式对 Team 和 Enterprise 组织默认禁用。管理员必须明确[启用快速模式](#为您的组织启用快速模式)，用户才能访问它。

<Note>
  如果您的管理员未为您的组织启用快速模式，`/fast` 命令将显示"Fast mode has been disabled by your organization."
</Note>

### 为您的组织启用快速模式

管理员可以在以下位置启用快速模式：

* **Console**（API 客户端）：[Claude Code 偏好设置](https://platform.claude.com/claude-code/preferences)
* **Claude AI**（Team 和 Enterprise）：[管理员设置 > Claude Code](https://claude.ai/admin-settings/claude-code)

另一个完全禁用快速模式的选项是设置 `CLAUDE_CODE_DISABLE_FAST_MODE=1`。请参阅[环境变量](/en/env-vars)。

### 要求每会话启用

默认情况下，快速模式在会话之间持续存在：如果用户启用快速模式，它会在未来的会话中保持开启。[Team](https://claude.com/pricing?utm_source=claude_code\&utm_medium=docs\&utm_content=fast_mode_teams#team-&-enterprise) 或 [Enterprise](https://anthropic.com/contact-sales?utm_source=claude_code\&utm_medium=docs\&utm_content=fast_mode_enterprise) 计划的管理员可以通过在[托管设置](/en/settings#settings-files)或[服务器管理设置](/en/server-managed-settings)中将 `fastModePerSessionOptIn` 设置为 `true` 来防止这种情况。这会导致每个会话以快速模式关闭开始，需要用户使用 `/fast` 明确启用它。

```json theme={null}
{
  "fastModePerSessionOptIn": true
}
```

这对于控制用户运行多个并发会话的组织中的成本非常有用。用户仍可在需要速度时使用 `/fast` 启用快速模式，但它会在每个新会话开始时重置。用户的快速模式偏好仍会保存，因此移除此设置会恢复默认的持续行为。

## 处理速率限制

快速模式与标准 Opus 有独立的速率限制。Opus 4.7 和 Opus 4.6 的快速模式共享相同的速率限制池：在任一模型上的使用量都从相同的限制中扣除。当您达到快速模式速率限制或用完使用额度时：

1. 快速模式自动回退到标准速度
2. `↯` 图标变为灰色表示冷却
3. 您继续以标准速度和定价工作
4. 冷却到期后，快速模式自动重新启用

要手动禁用快速模式而非等待冷却，请再次运行 `/fast`。

## 研究预览

快速模式是研究预览功能。这意味着：

* 该功能可能会根据反馈进行调整
* 可用性和定价可能会发生变化
* 底层 API 配置可能会演进

通过您常用的 Anthropic 支持渠道报告问题或反馈。

## 另请参阅

* [模型配置](/en/model-config)：切换模型和调整努力级别
* [有效管理成本](/en/costs)：跟踪 token 使用量和降低成本
* [状态行配置](/en/statusline)：显示模型和上下文信息