Claude Code 输出太浪费 Token?试试这个,平均省 70-80%

作者:君哥(君哥聊编程)
来源:微信公众号
日期:2026年5月1日 10:01
标签:#AI工具 #Claude #Token优化 #编程效率


昨天分享了 Token压缩之王caveman,然后又发现了一个新的好东西 rtk-ai/rtk,给节假日解解乏,有用就点个赞。

截至 2026 年 4 月底,仓库约 38.6k stars,4月中还是25k,现在还在爆炸增长中。

RTK:让 AI 编程少吃点"噪声",多省点 Token

用 Claude Code、Cursor 这类 AI 编程工具写代码时,最烦的一件事就是命令输出太"啰嗦"。

git statusgradlew buildlsgit diffnpm test……这些命令的原始输出里,夹杂着大量进度条、时间戳、权限信息、重复日志、通过的测试用例等。几百行输出扔进 LLM 上下文,token 很快就没了,费用上去,模型的有效信息却被稀释,推理质量也容易下降。

RTK(Rust Token Killer) 就是专门解决这个问题的工具。它像一个智能过滤器,坐在 Shell 和 AI 之间,在命令输出进入 LLM 前进行针对性压缩和清理。项目用 Rust 编写,单个二进制文件,几乎零依赖,额外开销很小(通常 <10ms)。

它不是通用文本压缩工具,而是对开发者常用的 100+ 条命令做了深度优化:去掉噪声、合并同类项、只保留关键信息。实际使用下来,在中等规模的项目里,命令输出的 token 消耗能降低 60%-90%,平均在 70-85% 左右,具体看你跑什么命令。

一、它主要解决什么问题?

  1. Token 浪费严重:一次 30 分钟的 Claude Code 会话,单纯命令输出就可能吃掉十几万 token,大部分是无用噪声。
  2. 上下文被污染:模型看到太多无关信息,重点被淹没,容易出现分析不准或幻觉。
  3. 会话长度受限:噪声多,很快就把上下文窗口占满,长链思考容易中断。
  4. 成本上升:尤其是用 Claude Sonnet、Opus 这类较贵的模型时,费用累积明显。

RTK 的核心思路是:在输出到达 AI 前,就帮你把"能省的都省掉",同时尽量保留对调试和决策有用的关键部分。失败时还会把完整原始输出保存到本地文件(~/.local/share/rtk/tee/),方便你或 AI 随时查看,不会真正丢失信息。

二、如何安装和使用

安装(5 分钟内搞定)

推荐顺序:

  1. Homebrew(macOS / Linux 最方便): bash brew install rtk rtk --version # 应该显示类似 0.38.0 2. 一键脚本(Linux/macOS): bash curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh rtk --version

默认装到 ~/.local/bin,记得把这个路径加到 $PATH(如果没生效)。

  1. Cargo 安装(有 Rust 环境): bash cargo install --git https://github.com/rtk-ai/rtk rtk --version 注意:不要直接 cargo install rtk,crates.io 上有个同名但不同的包(Rust Type Kit),会冲突。 4. 手动安装(全平台):从 GitHub Releases 下载对应平台的预编译包 > Windows用户需要注意:下载下来的rtk.exe不要直接执行,而是把这个路径加入到PATH环境变量中,然后在任意地方打开cmd或powershell执行上述命令,出现表示安装成功 ### 使用方式 RTK 的核心价值就是不改用户的习惯,相当于一层代理层,AI 工具里敲 git status,后台自动变成 rtk git status 执行,AI 只看到压缩后的输出。 bash # Claude Code / GitHub Copilot 推荐 rtk init -g # Gemini CLI rtk init -g --gemini # Cursor rtk init -g --agent cursor

在terminal中输入y,它会做3件事: 1. 新增 ~/.claude/RTK.md,并在 CLAUDE.md@RTK.md 2. 修改 ~/.claude/settings.json 3. 生成 ~/AppData/Roaming/rtk/filters.toml

安装完 重启你的 AI 编程工具,让 Hook 生效。

验证是否成功:

rtk init --show

Hook 生效后,你可以像平时一样使用命令: - git status - cargo test - ls ./src - git diff - npm test

如果某些命令你觉得压缩得太狠,可以在 ~/.config/rtk/config.toml 里把对应命令加入 exclude 列表。

手动使用(不依赖 Hook 时):

rtk ls .
rtk git push
rtk cargo test
rtk read main.rs  # 智能读取文件
rtk grep "error" ./src

查看节省效果:

rtk gain    # 汇总节省 token 统计
rtk gain --history  # 最近命令记录
rtk discover  # 帮你找出还能优化的命令

三、实际效果对比

官方给出的一个参考(30 分钟 Claude Code 会话,中等 TS/Rust 项目): - 原始命令输出总计约 118,000 tokens - 使用 RTK 后约 23,900 tokens - 整体节省约 80%

实际跑下来,不同项目差异挺大: - 频繁跑测试、git 操作、日志查看的项目,收益更明显(可能 80%+) - 主要写业务逻辑、少跑命令的项目,节省会低一些(60-75% 也常见)

小建议(实操经验):

  • 先在一个普通项目里装好 Hook,跑几个常用命令对比一下。
  • 如果 Hook 没生效,检查 AI 工具是否重启了,或者试试手动 rtk xxx
  • Windows 用户推荐用 WSL,Hook 支持更完整。
  • 命令失败时,记得去看 tee 保存的完整日志文件,别只看摘要。
  • 配置里可以把 tee 模式改成 alwaysnever,按需调整。

最后

RTK和caveman一样都是省token的工具,但是前者把"噪声"提前过滤掉,而后者是加上了Skills,让输出的内容更加整洁,算是2种不同方向的方案。

前者让 AI 看到的上下文更干净、成本更低、思考更专注。后者明确了大模型的输出对于每天重度使用 AI 编码的人来说,安装成本很低,回报却很实在。

2个加一起那就是左脚踩右脚,token节省90%,但是说实话,deepseek v4发布后,这类型的工具会越来越少,只有海外昂贵模型才有一定的适用场景。