Claude Code 输出太浪费 Token？试试这个，平均省 70-80%

作者：君哥（君哥聊编程）
来源：微信公众号
日期：2026年5月1日 10:01
标签：#AI工具 #Claude #Token优化 #编程效率

昨天分享了 Token压缩之王caveman，然后又发现了一个新的好东西 rtk-ai/rtk，给节假日解解乏，有用就点个赞。

截至 2026 年 4 月底，仓库约 38.6k stars，4月中还是25k，现在还在爆炸增长中。

RTK：让 AI 编程少吃点"噪声"，多省点 Token

用 Claude Code、Cursor 这类 AI 编程工具写代码时，最烦的一件事就是命令输出太"啰嗦"。

git status、gradlew build、ls、git diff、npm test……这些命令的原始输出里，夹杂着大量进度条、时间戳、权限信息、重复日志、通过的测试用例等。几百行输出扔进 LLM 上下文，token 很快就没了，费用上去，模型的有效信息却被稀释，推理质量也容易下降。

RTK（Rust Token Killer） 就是专门解决这个问题的工具。它像一个智能过滤器，坐在 Shell 和 AI 之间，在命令输出进入 LLM 前进行针对性压缩和清理。项目用 Rust 编写，单个二进制文件，几乎零依赖，额外开销很小（通常 <10ms）。

它不是通用文本压缩工具，而是对开发者常用的 100+ 条命令做了深度优化：去掉噪声、合并同类项、只保留关键信息。实际使用下来，在中等规模的项目里，命令输出的 token 消耗能降低 60%-90%，平均在 70-85% 左右，具体看你跑什么命令。

一、它主要解决什么问题？

Token 浪费严重：一次 30 分钟的 Claude Code 会话，单纯命令输出就可能吃掉十几万 token，大部分是无用噪声。
上下文被污染：模型看到太多无关信息，重点被淹没，容易出现分析不准或幻觉。
会话长度受限：噪声多，很快就把上下文窗口占满，长链思考容易中断。
成本上升：尤其是用 Claude Sonnet、Opus 这类较贵的模型时，费用累积明显。

RTK 的核心思路是：在输出到达 AI 前，就帮你把"能省的都省掉"，同时尽量保留对调试和决策有用的关键部分。失败时还会把完整原始输出保存到本地文件（~/.local/share/rtk/tee/），方便你或 AI 随时查看，不会真正丢失信息。

二、如何安装和使用

安装（5 分钟内搞定）

推荐顺序：

Homebrew（macOS / Linux 最方便）： bash brew install rtk rtk --version # 应该显示类似 0.38.0 2. 一键脚本（Linux/macOS）： bash curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh rtk --version

默认装到 ~/.local/bin，记得把这个路径加到 $PATH（如果没生效）。

Cargo 安装（有 Rust 环境）： bash cargo install --git https://github.com/rtk-ai/rtk rtk --version 注意：不要直接 cargo install rtk，crates.io 上有个同名但不同的包（Rust Type Kit），会冲突。 4. 手动安装（全平台）：从 GitHub Releases 下载对应平台的预编译包 > Windows用户需要注意：下载下来的rtk.exe不要直接执行，而是把这个路径加入到PATH环境变量中，然后在任意地方打开cmd或powershell执行上述命令，出现表示安装成功 ### 使用方式 RTK 的核心价值就是不改用户的习惯，相当于一层代理层，AI 工具里敲 git status，后台自动变成 rtk git status 执行，AI 只看到压缩后的输出。 bash # Claude Code / GitHub Copilot 推荐 rtk init -g # Gemini CLI rtk init -g --gemini # Cursor rtk init -g --agent cursor

在terminal中输入y，它会做3件事： 1. 新增 ~/.claude/RTK.md，并在 CLAUDE.md 中 @RTK.md 2. 修改 ~/.claude/settings.json 3. 生成 ~/AppData/Roaming/rtk/filters.toml

安装完 重启你的 AI 编程工具，让 Hook 生效。

验证是否成功：

rtk init --show

Hook 生效后，你可以像平时一样使用命令： - git status - cargo test - ls ./src - git diff - npm test

如果某些命令你觉得压缩得太狠，可以在 ~/.config/rtk/config.toml 里把对应命令加入 exclude 列表。

手动使用（不依赖 Hook 时）：

rtk ls .
rtk git push
rtk cargo test
rtk read main.rs  # 智能读取文件
rtk grep "error" ./src

查看节省效果：

rtk gain    # 汇总节省 token 统计
rtk gain --history  # 最近命令记录
rtk discover  # 帮你找出还能优化的命令

三、实际效果对比

官方给出的一个参考（30 分钟 Claude Code 会话，中等 TS/Rust 项目）： - 原始命令输出总计约 118,000 tokens - 使用 RTK 后约 23,900 tokens - 整体节省约 80%

实际跑下来，不同项目差异挺大： - 频繁跑测试、git 操作、日志查看的项目，收益更明显（可能 80%+） - 主要写业务逻辑、少跑命令的项目，节省会低一些（60-75% 也常见）

小建议（实操经验）：

先在一个普通项目里装好 Hook，跑几个常用命令对比一下。
如果 Hook 没生效，检查 AI 工具是否重启了，或者试试手动 rtk xxx。
Windows 用户推荐用 WSL，Hook 支持更完整。
命令失败时，记得去看 tee 保存的完整日志文件，别只看摘要。
配置里可以把 tee 模式改成 always 或 never，按需调整。

最后

RTK和caveman一样都是省token的工具，但是前者把"噪声"提前过滤掉，而后者是加上了Skills，让输出的内容更加整洁，算是2种不同方向的方案。

前者让 AI 看到的上下文更干净、成本更低、思考更专注。后者明确了大模型的输出对于每天重度使用 AI 编码的人来说，安装成本很低，回报却很实在。

2个加一起那就是左脚踩右脚，token节省90%，但是说实话，deepseek v4发布后，这类型的工具会越来越少，只有海外昂贵模型才有一定的适用场景。

仓库地址：https://github.com/rtk-ai/rtk
官网文档：https://www.rtk-ai.app