5天2.2万Star!Ponytail让AI少写94%代码,治好我的代码焦虑
- 免费干货
- 3小时前
- 13热度
- 0评论
你有没有被 AI 气笑过?
我最近做个日期选择器,跟 Claude 说"加个日期选择",好家伙,它给我装了 flatpickr、写了个 wrapper 组件、还加了个 stylesheet,然后开始问我"时区怎么处理"。
我就想选个生日啊大哥,不是要发射火箭。
5 天前 GitHub 上冒出来个项目叫 Ponytail,现在已经 21.9k Star 了(大概 2.2 万)。
它干的事情简单到离谱——让 AI Agent 像公司里最懒的那个资深工程师一样写代码:啥也不说,写一行,跑通了。
代码量少了 80-94%,速度快了 3-6 倍,成本降了 47-77%。
这是他们跑了 10 轮基准测试拿到的中位数,Haiku、Sonnet、Opus 三个模型都测了。
说实话,第一次看到这数据我没啥感觉。直到我自己装了一遍。
装完以后同样的需求,AI 给我的代码从 50 行变成了 1 行。
那一刻我对着屏幕笑了大概半分钟。
我以前写的那些 datepicker 组件,十几层 div、各种 polyfill、时区适配……浏览器它自己就有啊。
这就是 Ponytail 的厉害之处——不是什么黑科技,它只是让 AI 在写代码之前先停下来想六个问题。
这六个问题,治好了我的代码内耗
Ponytail 核心就一套 6 步决策梯,AI 每次写代码之前按顺序过一遍,哪个台阶先满足了就停在那儿:
1. 这东西真的需要存在吗? → 不需要?那直接跳过,不写了(YAGNI)
2. 标准库能搞定? → 能,直接用
3. 浏览器/平台本身就有这功能? → 那还写啥,直接用
4. 已经装的依赖里有没有能用的? → 有就复用,别重复造轮子
5. 一行代码能搞定? → 搞定
6. 以上全不行,才写最少能跑的版本
说实话,之前 AI 写代码那思路就是"能加的功能全给它加上",而 Ponytail 反过来了——"能删的东西全删掉"。你看,是不是思路一变,整个味道就不一样了。
说到这儿我想起一件事。
我之前实习的时候带我的那个 senior,一老头儿,扎马尾辫戴圆框眼镜,在公司待的时间比版本控制软件还长。我写了五十行代码美滋滋拿过去给他看,他瞄了一眼,一句话没说,删了四十九行,留下一行。
然后走了。
我当时心里那个复杂啊……又觉得丢人又觉得牛逼,五味杂陈的。
Ponytail 说白了就是把这种思维硬塞进了 AI Agent 的脑子里。老实讲,有点东西。
对了,这项目的名字"Ponytail"就是这么来的,项目作者自己说的:"你知道为什么叫这个。"
怎么装?没你想的那么麻烦
好,聊安装。说实话,这大概是你花在 Ponytail 上最大的一块精力了——但也真没多夸张。
支持 13 种 AI Agent:Claude Code、Codex、Copilot CLI、Cursor、Windsurf、Cline、Aider、Gemini CLI、Kiro……你知道的基本都齐了。
拿 Claude Code 举例吧:
/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail
就两句。搞定了。
原理大概是这样的——它靠两个特别轻量的 Node.js 生命周期钩子,在 Agent 每次生成代码之前把决策逻辑悄悄塞进去。具体怎么注入的?老实讲,这块我自己也没完全吃透,Node.js 的钩子系统比我想象中深多了。有懂的大佬欢迎评论区教教我。
Codex 也差不多啦:
codex plugin marketplace add DietrichGebert/ponytail
codex
然后打开插件面板,找到 Ponytail 点安装,完事。
装好之后默认就生效了,每次开 AI 会话自动跑起来。
用 Cursor 或者 Windsurf 的话更简单——把仓库里对应目录的规则文件拷到项目根目录,没了。
对了,有个挺逗的功能:它有个 /ponytail ultra 模式。
项目文档原话怎么说的来着——"当代码库对你造成严重伤害时使用"。笑死,装完插件还能复仇,这谁顶得住。
数字不会骗人
我前面说了 80-94% 更少代码,47-77% 更便宜,3-6 倍更快。这些数字不是拍脑袋编的。
项目里有个完整的 benchmark 目录,你用 npx promptfoo eval -c benchmarks/promptfooconfig.yaml 就能在本地自己跑一遍。别光信我说的话,跑一下看看。
他们测了五个日常任务——邮箱校验、防抖函数、CSV 求和、倒计时器、限流器——配上三个模型(Haiku、Sonnet、Opus),再来三个对照组(无技能、caveman 技能、ponytail),每个组合跑 10 轮取中位数。说实话,这个测法还挺扎实的。
每一轮,Ponytail 代码量都是最少的。每一轮,Ponytail 都是最快的。每一轮,Ponytail 都是最便宜的。
每一条 Ponytail 省掉的代码,文件里都有 ponytail: 注释标着"如果将来需要完整实现该怎么做"。懒是懒了点,但不赖。你看,这才是真正聪明的偷懒——留了后路,不是摆烂。
同类项目对比
让 AI Agent 更高效地写代码这件事,最近其实一堆项目都在搞。
Caveman,同样出自这个生态——走的是另一个极端,"像个原始人一样思考",让 Agent 用最简单粗暴的方式搞定任务。Ponytail 更像"资深工程师的偷懒哲学",Caveman 嘛,说白了就像刚学会敲键盘的实习生,只知道最基础的方法。
Headroom,29.4k Star 了——专注 token 压缩,代码搜索从 17,765 tokens 压到 1,408 tokens,压缩率 92%。如果你想同时省代码又省 token,这俩组合着用,效果应该不错。
Repo-slopscore 这个更有意思,它能检测你代码仓库里哪些 commit 是 AI 写的。装完 Ponytail 之后跑一下 repo-slopscore,看看你的 AI 有没有变"懒"——没变的话说明装错了,你猜怎么着?我试了一下还真灵。
项目地址:https://github.com/DietrichGebert/ponytail
写这篇文章的时候我一直在想一件事。
我们总在追求 AI 写更多、更快、更全——堆 GPUs、扩上下文窗口、拉更长的输出。但是,可能真正有价值的,是让 AI 学会"不写什么"。
编程这么多年,我最深的体会就是:好代码不是写出来的,是删出来的。
一个功能加了 50 行,回头一看,可能 49 行都是多余的。这真的有用吗?你问问任何一个干了几年的老工程师,他们都会告诉你——删代码比写代码难十倍。
Ponytail 做的不是什么颠覆性的创新,它就是教会了 AI 一个所有资深工程师都知道、但没有写在任何教科书上的道理——
真正的高手,不是能写出多复杂的代码。而是知道哪些代码根本不用写。
FAQ
Ponytail 支持哪些 AI 编程工具?
截至 2025 年,Ponytail 已经支持 13 种 AI Agent 了,Claude Code、Codex、Copilot CLI、Cursor、Windsurf、Cline、Aider、Gemini CLI、Kiro 这些主流工具都覆盖了。基本上你正在用的那把,大概率在里面。
Ponytail 能省多少代码和成本?
根据项目方 10 轮 benchmark 的中位数数据——减少 80-94% 的代码量,速度提升 3-6 倍,API 调用成本降低 47-77%。测试覆盖了 Haiku、Sonnet、Opus 三个模型,不是单一模型的特例。
Ponytail 和 Headroom 能一起用吗?
可以。Ponytail 管减少代码量,Headroom 管压缩 token(代码搜索从 17,765 tokens 压到 1,408 tokens,压缩率 92%),两个一起上,代码和 token 两头都省。话说回来,这种组合拳思路我觉得才是正道——单点优化天花板太低了。