5天2.2万Star！Ponytail让AI少写94%代码，治好我的代码焦虑

Q: 同类项目对比

让 AI Agent 更高效地写代码这件事，最近其实一堆项目都在搞。 Caveman，同样出自这个生态——走的是另一个极端，"像个原始人一样思考"，让 Agent 用最简单粗暴的方式搞定任务。Ponytail 更像"资深工程师的偷懒哲学"，Caveman 嘛，说白了就像刚学会敲键盘的实习生，只知道最基础的方法。 Headroom，29.4k Star 了——专注 token 压缩，代码搜索从 17,765 tokens 压到 1,408 tokens，压缩率 92%。如果你想同时省代码又省 token，这俩组合着用，效果应该不错。 Repo-slopscore 这个更有意思，它能检测你代码仓库里哪些 commit 是 AI 写的。装完 Ponytail 之后跑一下 repo-slopscore，看看你的 AI 有没有变"懒"——没变的话说明装错了，你猜怎么着？我试了一下还真灵。 项目地址：https://github.com/DietrichGebert/ponytail 写这篇文章的时候我一直在想一件事。 我们总在追求 AI 写更多、更快、更全——堆 GPUs、扩上下文窗口、拉更长的输出。但是，可能真正有价值的，是让 AI 学会"不写什么"。 编程这么多年，我最深的体会就是：好代码不是写出来的，是删出来的。 一个功能加了 50 行，回头一看，可能 49 行都是多余的。这真的有用吗？你问问任何一个干了几年的老工程师，他们都会告诉你——删代码比写代码难十倍。 Ponytail 做的不是什么颠覆性的创新，它就是教会了 AI 一个所有资深工程师都知道、但没有写在任何教科书上的道理—— 真正的高手，不是能写出多复杂的代码。而是知道哪些代码根本不用写。

ivye
免费干货
3小时前
13热度
0评论

你有没有被 AI 气笑过？

我最近做个日期选择器，跟 Claude 说"加个日期选择"，好家伙，它给我装了 flatpickr、写了个 wrapper 组件、还加了个 stylesheet，然后开始问我"时区怎么处理"。

我就想选个生日啊大哥，不是要发射火箭。

5 天前 GitHub 上冒出来个项目叫 Ponytail，现在已经 21.9k Star 了（大概 2.2 万）。

它干的事情简单到离谱——让 AI Agent 像公司里最懒的那个资深工程师一样写代码：啥也不说，写一行，跑通了。

代码量少了 80-94%，速度快了 3-6 倍，成本降了 47-77%。

这是他们跑了 10 轮基准测试拿到的中位数，Haiku、Sonnet、Opus 三个模型都测了。

说实话，第一次看到这数据我没啥感觉。直到我自己装了一遍。

装完以后同样的需求，AI 给我的代码从 50 行变成了 1 行。

那一刻我对着屏幕笑了大概半分钟。

我以前写的那些 datepicker 组件，十几层 div、各种 polyfill、时区适配……浏览器它自己就有啊。

这就是 Ponytail 的厉害之处——不是什么黑科技，它只是让 AI 在写代码之前先停下来想六个问题。

这六个问题，治好了我的代码内耗

Ponytail 核心就一套 6 步决策梯，AI 每次写代码之前按顺序过一遍，哪个台阶先满足了就停在那儿：

1. 这东西真的需要存在吗？  → 不需要？那直接跳过，不写了（YAGNI）
2. 标准库能搞定？           → 能，直接用
3. 浏览器/平台本身就有这功能？ → 那还写啥，直接用
4. 已经装的依赖里有没有能用的？ → 有就复用，别重复造轮子
5. 一行代码能搞定？          → 搞定
6. 以上全不行，才写最少能跑的版本

说实话，之前 AI 写代码那思路就是"能加的功能全给它加上"，而 Ponytail 反过来了——"能删的东西全删掉"。你看，是不是思路一变，整个味道就不一样了。

说到这儿我想起一件事。

我之前实习的时候带我的那个 senior，一老头儿，扎马尾辫戴圆框眼镜，在公司待的时间比版本控制软件还长。我写了五十行代码美滋滋拿过去给他看，他瞄了一眼，一句话没说，删了四十九行，留下一行。

然后走了。

我当时心里那个复杂啊……又觉得丢人又觉得牛逼，五味杂陈的。

Ponytail 说白了就是把这种思维硬塞进了 AI Agent 的脑子里。老实讲，有点东西。

对了，这项目的名字"Ponytail"就是这么来的，项目作者自己说的："你知道为什么叫这个。"

怎么装？没你想的那么麻烦

好，聊安装。说实话，这大概是你花在 Ponytail 上最大的一块精力了——但也真没多夸张。

支持 13 种 AI Agent：Claude Code、Codex、Copilot CLI、Cursor、Windsurf、Cline、Aider、Gemini CLI、Kiro……你知道的基本都齐了。

拿 Claude Code 举例吧：

/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail

就两句。搞定了。

原理大概是这样的——它靠两个特别轻量的 Node.js 生命周期钩子，在 Agent 每次生成代码之前把决策逻辑悄悄塞进去。具体怎么注入的？老实讲，这块我自己也没完全吃透，Node.js 的钩子系统比我想象中深多了。有懂的大佬欢迎评论区教教我。

Codex 也差不多啦：

codex plugin marketplace add DietrichGebert/ponytail
codex

然后打开插件面板，找到 Ponytail 点安装，完事。

装好之后默认就生效了，每次开 AI 会话自动跑起来。

用 Cursor 或者 Windsurf 的话更简单——把仓库里对应目录的规则文件拷到项目根目录，没了。

对了，有个挺逗的功能：它有个 /ponytail ultra 模式。

项目文档原话怎么说的来着——"当代码库对你造成严重伤害时使用"。笑死，装完插件还能复仇，这谁顶得住。

数字不会骗人

我前面说了 80-94% 更少代码，47-77% 更便宜，3-6 倍更快。这些数字不是拍脑袋编的。

项目里有个完整的 benchmark 目录，你用 npx promptfoo eval -c benchmarks/promptfooconfig.yaml 就能在本地自己跑一遍。别光信我说的话，跑一下看看。

他们测了五个日常任务——邮箱校验、防抖函数、CSV 求和、倒计时器、限流器——配上三个模型（Haiku、Sonnet、Opus），再来三个对照组（无技能、caveman 技能、ponytail），每个组合跑 10 轮取中位数。说实话，这个测法还挺扎实的。

每一轮，Ponytail 代码量都是最少的。每一轮，Ponytail 都是最快的。每一轮，Ponytail 都是最便宜的。

每一条 Ponytail 省掉的代码，文件里都有 ponytail: 注释标着"如果将来需要完整实现该怎么做"。懒是懒了点，但不赖。你看，这才是真正聪明的偷懒——留了后路，不是摆烂。

FAQ

Ponytail 支持哪些 AI 编程工具？

截至 2025 年，Ponytail 已经支持 13 种 AI Agent 了，Claude Code、Codex、Copilot CLI、Cursor、Windsurf、Cline、Aider、Gemini CLI、Kiro 这些主流工具都覆盖了。基本上你正在用的那把，大概率在里面。

Ponytail 能省多少代码和成本？

根据项目方 10 轮 benchmark 的中位数数据——减少 80-94% 的代码量，速度提升 3-6 倍，API 调用成本降低 47-77%。测试覆盖了 Haiku、Sonnet、Opus 三个模型，不是单一模型的特例。

Ponytail 和 Headroom 能一起用吗？

可以。Ponytail 管减少代码量，Headroom 管压缩 token（代码搜索从 17,765 tokens 压到 1,408 tokens，压缩率 92%），两个一起上，代码和 token 两头都省。话说回来，这种组合拳思路我觉得才是正道——单点优化天花板太低了。