Claude Code/Codex省Token实战:立省80%的硬核技巧

说实话,用 Claude Code 或者 Codex 写代码,那 Token 烧的速度……真的比印钞机还快。Input 占了 70%–90% 的消耗,这才是真正的“吞金兽”。别急着抱怨贵,优化输入源,立省 80% 不是梦。

Token 消耗的核心逻辑

计费公式其实特简单:总费用 = Input Tokens × 单价 + Output Tokens × 单价

但坑在哪?项目文件自动读取,一次交互就能吃掉 80% 的 Input。 这就是为什么你明明只问了一句话,账单却吓人一跳……对吧?

三大平台省 Token 硬核指南

1. Claude Code:配置 .claudeignore 是关键

我觉得这是优化空间最大的平台。核心动作就一个:建立 .claudeignore 文件,把无关文件统统踢出去。

直接复制这个模板,能过滤掉 60% 以上的无效 Token:

# 依赖与构建(最大黑洞)
node_modules/
dist/
build/
.next/
__pycache__/
# 锁文件/日志
*.lock
package-lock.json
*.log
# 版本控制/IDE
.git/
.idea/
.vscode/
# 资源/缓存
*.png
*.jpg
*.svg
*.ico
.cache/
coverage/

记得建个 CLAUDE.md,把技术栈、目录结构和开发命令写清楚。让 AI 一眼看懂项目,少问点废话,是不是?

2. Codex (GitHub Copilot):限制上下文

Codex 主要靠 IDE 插件干活。它的痛点嘛,就是上下文容易无限膨胀。

解决办法:去 IDE 设置里,把“最大上下文文件数”给限制了。别让它扫描整个项目,只让它看当前文件和相关依赖。话说回来,这样做真的有用吗?至少对省 Token 来说,有用。

3. OpenCode:开源自托管,灵活配置

如果你在用 OpenCode,那配置 config.json 就是省钱的核心。

设置 input_limit,别太保守,按模型能力设满。比如 DeepSeek V3,设 128k 上下文,减少自动截断和重复请求,能省 30%+。你看,细节决定成败。


{
  "model": {
    "name": "deepseek-v3",
    "input_limit": 128000,
    "output_limit": 80000
  }
}

还有,定期用 /clear 清理历史,不同功能开新会话。别把多任务混在一起,历史膨胀是 Token 杀手……这点很重要。

三平台省 Token 对比表

优化维度 Claude Code Codex (Copilot) OpenCode 节省效果
文件过滤 .claudeignore IDE 配置限制 .opencodeignore 60%–80%
上下文压缩 /compact 无内置 /clear 50%–88%
文档驱动 CLAUDE.md 靠注释 自定义 README 30%–50%
记忆固化 /memory 手动复制 配置文件 40%–60%
核心优势 工具最全 IDE 集成好 开源成本低

10 步实战清单(照做就行)

  1. 根目录建 .claudeignore.opencodeignore,复制模板。这步最关键。
  2. CLAUDE.md,写清技术栈和命令。
  3. 开启自动压缩(Claude: /config → Auto-compact)。
  4. 长对话手动 /compact,阶段性清理。
  5. /memory 存项目规范,不重复输入。
  6. 复杂任务用 Plan Mode(Shift+Tab),先计划再执行。
  7. 按任务切换模型:简单用 Haiku,复杂用 Sonnet。
  8. 关闭不必要的自动功能(如全项目扫描)。
  9. 分会话开发,不堆积多任务历史。
  10. 定期看 /usage,定位 Token 黑洞。

FAQ

如何彻底避免 Token 浪费?

核心是严控 Input。优先优化文件读取(使用 ignore 文件)和上下文管理(定期清理),Input 占了 70%–90% 的消耗,搞定这两点就省了一大半。你猜怎么着?就是这么简单。

Claude Code 和 Codex 哪个更省 Token?

我觉得 Claude Code 优化空间更大,因为它提供了 .claudeignore/compact 等原生工具,能更精细地控制上下文。Codex 主要依赖 IDE 配置,灵活性稍弱。不过这也看个人习惯。

OpenCode 适合个人开发者吗?

很适合。OpenCode 开源且可自托管,支持自定义 config.json 精准设置上下文上限,成本极低,适合喜欢折腾和定制的技术博主。是不是?