把钱花在刀刃上:我的 Claude Code 省钱指南
本文目录
RefID: 5pys5paH6JGX5L2c5p2D5b2S5L2c6ICFIEhhdCdzIExhbmQg5bi95LmL5bKbIOaJgOacie+8jOi9rOi9veivt+azqOaYjuWMheWQq+WOn+aWh+i2hemTvuaOpeeahOadpea6kOS/oeaBr+OAggoK5L2c6ICF77yaSGF0J3MgTGFuZArmlofnq6DmupDmoIfpopjvvJrjgIrmiorpkrHoirHlnKjliIDliIPkuIrvvJrmiJHnmoQgQ2xhdWRlIENvZGUg55yB6ZKx5oqA5ben44CLCuWOn+aWh+mTvuaOpe+8mmh0dHBzOi8vd3d3LmhhdHMtbGFuZC5jb20vYXJjaGl2ZXMvc2tpbGxzLzIwMjUtY2xhdWRlLWNvZGUtdXNhZ2UtZ3VpZGUuaHRtbA==
⚠️ 中立声明
本文并非 Kimi 或阿里 Qwen 的商单/软广,文中也没有任何包含返利的推荐链接,请各位读者放心阅读。
如果你最近在关注 Vibe Coding 新闻,那么你一定听说过 Anthropic 推出的 CLI 工具——Claude Code,它凭借 Claude 系列模型拥有的强大代码理解和生成能力、出色的 CLI 交互体验,正在改变我们 vibe code 的方式 (从 IDE 转战 CLI 战场)。
但强大的能力也伴随着不菲的成本,无论是 Pro 订阅还是 Max 套餐,如何最大化投入产出比,成为了我们每个 Claude Code 用户必须思考的问题。
经过几个月的深度使用,我总结了一套行之有效的省钱技巧和高效的 Prompt 工程策略,在此分享给各位读者,供大家参考。
1. 彻底理解 Claude Code 的计费模型
想省钱,必先知钱花何处。与市面上很多按 “会话次数” 或 “请求数” 计费的工具(点名 Cursor、Windsurf 等平台)不同,Claude Code 的计费核心在于 输出 Token 数量,而不是 “会话次数”。
这意味着:
- 输入几乎免费:你可以放心地给它喂养海量的上下文,官方 API 对输入 Token 有近乎 -90% 的折扣,四舍五入等于不要钱。
- 按劳分配,童叟无欺:实际产出越多,花费才越高。一个简单的 bug fix 和一个完整的项目重构,成本天差地别。这比某些工具无论问题大小都消耗一次 “Premium Request” 要公平、合理得多。
核心技巧:大胆提供充足的上下文!不要吝啬 package.json
、相关模块代码、甚至是整个项目的 tree
结构。充足的上下文能显著提高 AI 的理解准确率,减少因误解而产生的无效输出,从而从根本上节省成本。
省钱秘籍:利用固定区块的特性!如果你在 00:00 - 05:00
这个区块的末尾(比如 04:30)开始一个长时间任务,你将能“借用”下一个区块(05:00 - 10:00
)的配额,相当于短时间内获得了双倍的速率限制。
2. 用好工具设备,干活事半功倍
口说无凭,数据为王。要精细化管理成本,你需要一个强大的仪表盘。这里我强烈推荐一个第三方神级工具:ccusage
。
“它能做什么?”
a) 查看月度开销报告: 只需一行命令,就能将你当月的使用情况可视化,并估算出等效的 API 费用。看着这个数字,你就能直观地感受到自己薅了多少羊毛。
bunx ccusage monthly
b) 实时监控速率限制: Claude Code 的速率限制并非传统的“滑动窗口”,而是以 5 小时为一个固定区块。ccusage
的实时监控模式可以让你清楚地看到当前区块的用量和剩余时间。
bunx ccusage blocks --live
3. 全局 CLAUDE.md 规则
Claude Code 允许你用户主目录下创建一个 ~/.claude/CLAUDE.md
文件,作为全局的系统指令。
以下是我自用的全局规则,分享给各位读者参考 (建议根据自身项目需求进行调整):
## 基本原则
- 无论我使用什么语言,请始终使用「简体中文」回答我的问题, 包括 Todo 和思考内容。
- 开始输出代码前最好联网搜索一下其最佳实践 (Best Practices)。
- 联网搜索的时候切忌采用 csdn.net、阿里云/腾讯云/华为云社区等内容农场 (Content Farm) 的信息,这些信息往往过时且质量低劣。
## Code Style 偏好
- 无论是 JS 还是 TS, 请尽可能偏向使用 ESM (import/export) 而不是 CJS (require)。
- 为了减少不必要的开支,请尽可能使用 `import { xxx } from 'xxx'` 而不是默认导入 (Node.js 项目无需遵守此规则)。
- 对于编写复杂的 GitHub Workflow 时,请尽可能使用 Python/Node.JS 等流行脚本语言,而不是 Bash。
## 依赖库偏好
- 编写 GitHub Workflow 时推荐使用流行、活跃的 Action 库,除非迫不得已,否则尽可能少造轮子。
- npm 依赖库偏好:我喜欢更流行、更新更热、活跃更新的 npm 库。例如, `yaml` 而不是 `js-yaml`。
- Golang 依赖库偏好:一般情况下最好使用标准库,其次才是由 Golang 官方维护的非标准库。
- 安装依赖可以使用 pnpm, 要用 bun add / bun install 时请追加 --no-cache 参数。
## 其他偏好
- 我讨厌在 JS/TS 中使用 class 写法,因为其代码可读性非常差。
- 条件允许的情况下,对于输出的 TypeScript 代码最好可以过一遍 linter 自动化检查并修复格式问题。
- 确保任务完成后,请尽可能完成项目中的 linter/formatter 自动化检查,随后再进行任务总结。
这份规则能确保 Claude Code 的输出风格与你的偏好保持高度一致,减少后期手动修改的麻烦,变相节省时间成本。
4. 利用 “Magic Words” 控制思考预算
这是个通过逆向 Claude Code 客户端得来的隐藏技巧,虽然看起来很 “Magic”, 但确实具有实用价值。
Claude Code 通过从输入 Prompt 中匹配特定的 英文关键词,可以动态调整它的 “思考预算” (Thinking Budget),即在生成最终答案前内部思考和迭代所消耗的 Token 数量。
从使用的思考预算来看,think
< think hard
< think harder (ultrathink)
。
- 基础思考 (
think
): 将消耗约 4K Tokens 预算用于思考,适用于大部分常规任务。 - 深度思考 (
think hard
): 将消耗约 10K Tokens 预算用于思考,当你需要它进行更复杂的逻辑推理或重构时使用。 - 极限思考 (
ultrathink
): 将消耗约 32K Tokens 预算用于思考,用于攻克极其复杂、需要多步骤规划的难题。
使用示例:
"帮我规划一个从 Vue 2 到 Vue 3 的多步骤迁移,每一个步骤都请 ultrathink。"
"重构这个组件,并注意 think hard 性能问题。"
"请修复这个 bug,可以适当 think 并检查一下可能存在的性能瓶颈。"
通过合理利用这些咒语,可以避免在简单问题上浪费算力、在复杂问题上浪费时间。
完整逆向代码参考
逆向代码参考自 Claude Code: Best practices for agentic coding,并经过适当润色。
let prompt = W.message.content.toLowerCase();
// 极限思考
if (
prompt.includes("think harder") ||
prompt.includes("think intensely") ||
prompt.includes("think longer") ||
prompt.includes("think really hard") ||
prompt.includes("think super hard") ||
prompt.includes("think very hard") ||
prompt.includes("ultrathink")
) {
return workflow("tengu_thinking", { tokenCount: 31999, messageId: Z, provider: G }), 31999;
}
// 深度思考
if (
prompt.includes("think about it") ||
prompt.includes("think a lot") ||
prompt.includes("think deeply") ||
prompt.includes("think hard") ||
prompt.includes("think more") ||
prompt.includes("megathink")
) {
return workflow("tengu_thinking", { tokenCount: 10000, messageId: Z, provider: G }), 10000;
}
// 基础思考
if (prompt.includes("think")) {
return workflow("tengu_thinking", { tokenCount: 4000, messageId: Z, provider: G }), 4000;
}
RefID: Q29weXJpZ2h0OiBIYXQncyBMYW5kICYgaHR0cHM6Ly93d3cuaGF0cy1sYW5kLmNvbS9hcmNoaXZlcy9za2lsbHMvMjAyNS1jbGF1ZGUtY29kZS11c2FnZS1ndWlkZS5odG1s
5. 低价平替与注意事项
对于预算有限的朋友,社区也提供了解决方案。你可以使用 claude-code-router 这类工具,将阿里云百炼、魔搭社区等平台的 API 代理成 Claude Code 兼容的接口。
目前来说,社区中比较流行的平替方案有:
- Kimi K2 (官方宣传稿)
一句话总结: 采用 1 万亿 (1T) 参数量 + 32B 激活 MoE 规模,于 2025 年 7 月 11 日发布,目标是对标 Claude 4 Sonnet (不开启 Thinking 的条件下),并支持 提示词缓存
特性。
- Qwen3-Coder (官方宣传稿)
一句话总结: 采用 405B 参数量 + 35B 激活 MoE 规模,于 2025 年 7 月 23 日发布,虽然比 Kimi K2 的总参数量少了整整一半,但能力更强、上下文更高 (原生 256K, 可扩展至 1M)。
Qwen3-Coder 定价
RefID: Q29weXJpZ2h0OiBIYXQncyBMYW5kICYgaHR0cHM6Ly93d3cuaGF0cy1sYW5kLmNvbS9hcmNoaXZlcy9za2lsbHMvMjAyNS1jbGF1ZGUtY29kZS11c2FnZS1ndWlkZS5odG1s
⚠️ 注意
阿里云百炼平台的 Qwen3-Coder 不支持 提示词缓存
特性,会导致费用飙升,请谨慎使用!!!
上下文长度 | Input 定价 (元/M Tokens) | Output 定价 (元/M Tokens) |
---|---|---|
0-32K | 4 | 16 |
32K-128K | 6 | 24 |
128K-256K | 10 | 40 |
256K-1M | 20 | 200 |
RefID: Q29weXJpZ2h0OiBIYXQncyBMYW5kICYgaHR0cHM6Ly93d3cuaGF0cy1sYW5kLmNvbS9hcmNoaXZlcy9za2lsbHMvMjAyNS1jbGF1ZGUtY29kZS11c2FnZS1ndWlkZS5odG1s
Kimi K2 定价
💡 温馨提示
Kimi K2 的定价与 Qwen3-Coder 类似,但支持 提示词缓存
特性,并且没有充满套路的 “阶梯计费”,可放心使用。
计费单位 | 输入价格(缓存命中) | 输入价格(缓存未命中) | 输出价格 |
---|---|---|---|
1M tokens | ¥ 1.00 | ¥ 4.00 | ¥ 16.00 |
阿里魔搭社区
- 阿里魔搭社区:每天提供 1000 次免费调用,是绝佳的免费平替。
- 阿里云百炼:虽然提供了官方的 Claude Code 代理,但请务必警惕!
- 没有输入缓存:与官方 Claude 不同,百炼对输入 Token 全额计费,在上下文很长时费用会飙升。
- 阶梯计费:虽然百炼为 Qwen3-Coder 提供了高达 1M 的上下文长度,但代价就是上下文越大,单价越高 (最高可达 200 人民币/M (输出 Token))。
已经有大量用户反映在不知情的情况下被百炼 “背刺” 导致欠费。请优先使用魔搭社区,或者在使用百炼时密切关注你的账单。
总结
Claude Code 无疑是一款划时代的工具,通过 理解其计费模型、善用 ccusage
等工具、定制高效的全局 Prompt、掌握“魔法咒语”,你就能以最高的性价比,让它成为你手中最锋利的武器。
希望这些技巧能对你有所帮助。你还有哪些 Claude Code 的独门秘籍?欢迎在评论区分享!