Claude Code 输出太浪费 Token?试试这个,平均省 70-80%
作者:君哥(君哥聊编程)
来源:微信公众号
日期:2026年5月1日 10:01
标签:#AI工具 #Claude #Token优化 #编程效率
昨天分享了 Token压缩之王caveman,然后又发现了一个新的好东西 rtk-ai/rtk,给节假日解解乏,有用就点个赞。
截至 2026 年 4 月底,仓库约 38.6k stars,4月中还是25k,现在还在爆炸增长中。
RTK:让 AI 编程少吃点"噪声",多省点 Token
用 Claude Code、Cursor 这类 AI 编程工具写代码时,最烦的一件事就是命令输出太"啰嗦"。
git status、gradlew build、ls、git diff、npm test……这些命令的原始输出里,夹杂着大量进度条、时间戳、权限信息、重复日志、通过的测试用例等。几百行输出扔进 LLM 上下文,token 很快就没了,费用上去,模型的有效信息却被稀释,推理质量也容易下降。
RTK(Rust Token Killer) 就是专门解决这个问题的工具。它像一个智能过滤器,坐在 Shell 和 AI 之间,在命令输出进入 LLM 前进行针对性压缩和清理。项目用 Rust 编写,单个二进制文件,几乎零依赖,额外开销很小(通常 <10ms)。
它不是通用文本压缩工具,而是对开发者常用的 100+ 条命令做了深度优化:去掉噪声、合并同类项、只保留关键信息。实际使用下来,在中等规模的项目里,命令输出的 token 消耗能降低 60%-90%,平均在 70-85% 左右,具体看你跑什么命令。
一、它主要解决什么问题?
- Token 浪费严重:一次 30 分钟的 Claude Code 会话,单纯命令输出就可能吃掉十几万 token,大部分是无用噪声。
- 上下文被污染:模型看到太多无关信息,重点被淹没,容易出现分析不准或幻觉。
- 会话长度受限:噪声多,很快就把上下文窗口占满,长链思考容易中断。
- 成本上升:尤其是用 Claude Sonnet、Opus 这类较贵的模型时,费用累积明显。
RTK 的核心思路是:在输出到达 AI 前,就帮你把"能省的都省掉",同时尽量保留对调试和决策有用的关键部分。失败时还会把完整原始输出保存到本地文件(~/.local/share/rtk/tee/),方便你或 AI 随时查看,不会真正丢失信息。
二、如何安装和使用
安装(5 分钟内搞定)
推荐顺序:
- Homebrew(macOS / Linux 最方便):
bash brew install rtk rtk --version # 应该显示类似 0.38.02. 一键脚本(Linux/macOS):bash curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh rtk --version
默认装到 ~/.local/bin,记得把这个路径加到 $PATH(如果没生效)。
- Cargo 安装(有 Rust 环境):
bash cargo install --git https://github.com/rtk-ai/rtk rtk --version注意:不要直接cargo install rtk,crates.io 上有个同名但不同的包(Rust Type Kit),会冲突。 4. 手动安装(全平台):从 GitHub Releases 下载对应平台的预编译包 > Windows用户需要注意:下载下来的rtk.exe不要直接执行,而是把这个路径加入到PATH环境变量中,然后在任意地方打开cmd或powershell执行上述命令,出现表示安装成功 ### 使用方式 RTK 的核心价值就是不改用户的习惯,相当于一层代理层,AI 工具里敲git status,后台自动变成rtk git status执行,AI 只看到压缩后的输出。bash # Claude Code / GitHub Copilot 推荐 rtk init -g # Gemini CLI rtk init -g --gemini # Cursor rtk init -g --agent cursor
在terminal中输入y,它会做3件事:
1. 新增 ~/.claude/RTK.md,并在 CLAUDE.md 中 @RTK.md
2. 修改 ~/.claude/settings.json
3. 生成 ~/AppData/Roaming/rtk/filters.toml
安装完 重启你的 AI 编程工具,让 Hook 生效。
验证是否成功:
rtk init --show
Hook 生效后,你可以像平时一样使用命令:
- git status
- cargo test
- ls ./src
- git diff
- npm test
如果某些命令你觉得压缩得太狠,可以在 ~/.config/rtk/config.toml 里把对应命令加入 exclude 列表。
手动使用(不依赖 Hook 时):
rtk ls .
rtk git push
rtk cargo test
rtk read main.rs # 智能读取文件
rtk grep "error" ./src
查看节省效果:
rtk gain # 汇总节省 token 统计
rtk gain --history # 最近命令记录
rtk discover # 帮你找出还能优化的命令
三、实际效果对比
官方给出的一个参考(30 分钟 Claude Code 会话,中等 TS/Rust 项目): - 原始命令输出总计约 118,000 tokens - 使用 RTK 后约 23,900 tokens - 整体节省约 80%
实际跑下来,不同项目差异挺大: - 频繁跑测试、git 操作、日志查看的项目,收益更明显(可能 80%+) - 主要写业务逻辑、少跑命令的项目,节省会低一些(60-75% 也常见)
小建议(实操经验):
- 先在一个普通项目里装好 Hook,跑几个常用命令对比一下。
- 如果 Hook 没生效,检查 AI 工具是否重启了,或者试试手动
rtk xxx。 - Windows 用户推荐用 WSL,Hook 支持更完整。
- 命令失败时,记得去看 tee 保存的完整日志文件,别只看摘要。
- 配置里可以把
tee模式改成always或never,按需调整。
最后
RTK和caveman一样都是省token的工具,但是前者把"噪声"提前过滤掉,而后者是加上了Skills,让输出的内容更加整洁,算是2种不同方向的方案。
前者让 AI 看到的上下文更干净、成本更低、思考更专注。后者明确了大模型的输出对于每天重度使用 AI 编码的人来说,安装成本很低,回报却很实在。
2个加一起那就是左脚踩右脚,token节省90%,但是说实话,deepseek v4发布后,这类型的工具会越来越少,只有海外昂贵模型才有一定的适用场景。