一行代码让Fable 5原地复活,背后金主反手给了它一刀

【导读】Fable 5突遭全网下架,幕后推手竟是「头号金主」亚马逊。Dario硬刚拒修Bug,90分钟被拔网线。

开发者Jamieson O'Reilly搞到了泄露的系统级Prompt,直接解锁了「轻量版」Fable 5。

就一行代码注入,Opus 4.8当场就「开智」了。

极限对照实验里,同一个指令:做个现代苹果风的网页。

被注入Fable 5灵魂的左屏,吐出来的成品……完全像换了一个「人格」。

全网都在喊Claude Fable 5快回来。

老实讲,大家都想趁着周末用Fable 5大干一场,结果一觉醒来,Anthropic直接把网线拔了。

Fable 5 Build大会周末举办,临时下线这剧本谁想得到。

不过封杀的深层内幕,终于被挖出来了。

The Information爆料说,促使美政府下禁令的导火索,正是Anthropic的头号金主——亚马逊。

这到底是怎么一回事?

一行代码,Fable 5原地复活

先别急,我知道你们最想知道的肯定是:

到底要怎么搞,才能让Fable 5原地「复活」?

Fable 5诞生才24小时,头号越狱玩家Pliny the Liberator就在GitHub上甩了一份猛料:

Claude Fable 5——系统提示词

12万字符,1585行,72个命名章节,连18个工具的JSON定义都给扒了个底朝天。

GitHub地址:https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/CLAUDE-FABLE-5.md

有了这个,基本就等于拿到了Fable 5最核心的「人格底稿」。

Fable 5下线之后,这份文档居然成了全网玩家让它借尸还魂的唯一「救命稻草」。

开发者Jamieson盯着这份泄露的提示词,脑子里冒出一个大胆的想法:

Fable 5被下架了,可它的「性格」到底有多少是系统提示词撑起来的,又有多少是模型本身就有的?

说干就干,操作简单到离谱——打开Claude Code,敲下一条指令:

claude --dangerously-skip-permissions --system-prompt-file CLAUDE-FABLE-5.md

注意这个参数:--dangerously-skip-permissions,危险地跳过所有权限确认。

说白了就是Claude Code里官方自己都标了警告的高危开关——一路绿灯,不再弹窗问你「确定吗?」

他用这条指令,把泄露的Fable 5提示词硬生生塞进了现役的Opus 4.8里。

右边另开一个窗口,跑的是原生的、啥也没改的Opus 4.8。

同一个大脑,同样的智力,同样的上下文。唯一的变量,就只有那段系统提示词。

然后他给两边下了完全一样的任务:做一个现代苹果风格的落地页。

结果一出来,差距肉眼可见。

Jamieson原话是这么说的——「一样的智力,做出来的东西却完全是两个物种」。

仅是换了一段系统提示词,两个网页在品牌格调、文案语气、板块结构、整体气质上,全线分化。

一个看着就像规规矩矩的通用模板,另一个呢,带着Fable 5那套被精心打磨过的审美和表达节奏。

版式怎么排、措辞怎么选、模块怎么拆,处处透着「出厂人格」的烙印。

说实话,这结果我觉得挺炸裂的……Anthropic看了估计都得沉默吧!

哦对,顺便说一句,今天OpenRouter上线的Fusion API,用半价就实现了Fable 5级别的智能。

金主反手一刀,科技圈惊天背叛

说实话,接下来才是真正的好戏。

一款被吹上天的划时代模型,才发布4天,就被强制下线了。4天啊。

外媒一篇爆料,直接把底裤扒了——幕后黑手,是亚马逊。

你猜怎么着?亚马逊自己的内部团队搞了一串精心设计的prompt,绕过了Fable 5的安全护栏,成功让它吐出了本该被牢牢锁死的、能直接用于网络攻击的敏感信息。

拿到这份测试结果之后,CEO Andy Jassy压根没想着私下找Anthropic沟通一下,一个电话直接打到了华盛顿。

接电话的都有谁?财政部长Scott Bessent,还有一堆高层。

要知道,亚马逊可是Anthropic的大股东,给它供数据中心的芯片,绑得那叫一个深,穿一条裤子的交情。

结果这位「金主爸爸」,转头就把测试结果双手奉上了白宫的桌。

90分钟,全球「拔网线」

白宫那边反应是真的快,官员们紧急碰头,安全专家连夜就把亚马逊的测试结果复现出来了。

然后呢?直接给Anthropic下了最后通牒——漏洞要么你赶紧修,要么模型全给我下架。

你敢信吗,当时留给他们的窗口期只有90分钟。就一个半小时,连开个完整的会都嫌不够……

Anthropic后来发了份声明,说函件里根本没讲清楚国家安全顾虑具体是个啥。但是没办法啊,人家发话了,只能照做,把Fable 5给关停了。

这一刀砍下去,全世界都跟着遭殃。多少企业平时就靠这工具查软件漏洞的,结果一夜之间工具没了。断粮了你懂吧,就是那种感觉。

更离谱的是什么呢——Anthropic自己内部一大批外籍研发人员,因为这道命令,连自家最新的模型都碰不上了。辛辛苦苦做的东西,自己反而用不了,你说荒诞不荒诞?

Karpathy就是被禁员工之一

Dario硬刚:我拒绝亲手撕毁「免死金牌」

真正戏剧性的一幕,是知名投资人David Sacks甩出来的一篇长文。

他一开口就放了句狠的:Fable 5本质上就是加了安全护栏的Mythos。

Mythos身上藏着挺强的高级网络攻击能力,护栏的作用说白了就是把这身「武器」锁住。

一旦护栏失效,这身能力就暴露给了不该拿到它的人。

关键在于,一位受高度信任的合作伙伴,在测试Fable 5的时候,整出了一个能破开护栏的越狱方案。

当时政府要求Dario要么修复漏洞,要么直接下架模型。

Dario拒绝了!

在这篇长文里,Sacks火力全开:Anthropic一边在博客里轻描淡写说这漏洞「不严重」,一边继续运营消费级模型。

说白了,就是把生意放在了安全前面。

这跟它天天挂在嘴边的「安全第一」、「安全AI公司」的人设,完全对不上。

老实讲,政府其实很不情愿动用禁令,也挺震惊Anthropic连「修个漏洞」这种合理诉求都不肯配合。

这套叙事杀伤力极强。

但在Anthropic官博回应里,只用了一个词定调:「这是一场误会」。

最扎心的是,他们还不忘把GPT-5.5拉下水,原话是这么说的:

同样的手法,放到别的公开模型上一样能复现,包括OpenAI的GPT-5.5。

Fable 5,撕开了ASI那道口子

这出风波最值得回味的,是它第一次把ASI时代最锋利的悖论摆到了所有人面前。

一个模型,能力强到「护栏被撬开」,就等于「能力失控」。

安全与能力的天平,已经悬到了前所未有的高度。

Fable 5说白了就是给Mythos套了一层壳。

壳一旦裂开,里面那套被精心锁住的能力,就暴露在了不该拿到它的人手里。

而越接近超级智能,这层护栏就越像一层窗户纸。

今天,仅仅一份泄露的系统提示词、一行注入指令,就能让它「借尸还魂」。

明天呢?当模型本体的能力强到连提示词都束缚不住,留给人类的反应窗口还剩多少?

模型可以一夜下架,但潘多拉的盒子,从来没有「暂时不可用」这个选项。

Fable 5系统提示词泄露后,任何人都能用它复活模型吗?

理论上是这样。只要拿到那份泄露的提示词文件,通过Claude Code的--system-prompt-file参数注入,就能让现役Opus 4.8输出接近Fable 5的效果。不过说实话,这顶多复刻了「人格」层面的表现,底层推理能力和原版还是有差距的,别想得太简单。

亚马逊为什么要亲手搞砸自己投资的模型?

核心原因嘛,就是Fable 5的安全护栏被越狱后,能输出可用于网络攻击的敏感信息。亚马逊作为金主兼内部测试方,拿到了这个结果。CEO Andy Jassy选择直接上报美国政府,而不是先私下找Anthropic聊聊。商业信任?在国家安全的压力面前,终究还是让了步。

Dario拒绝修复漏洞的真实原因是什么?

根据David Sacks的爆料,Dario认为修复漏洞等于亲手拆掉模型的「免死金牌」——也就是安全护栏本身。一旦护栏被削弱,模型的核心能力(源自Mythos的高级攻击能力)也会被锁死。你看,这就触及了Anthropic技术路线的根本取舍。我觉得这才是整件事最让人纠结的地方:你要能力,还是要安全?两边根本就是绑在一起的,压根没法单独拆。

参考资料:
WSJ: Amazon CEO's Talks With U.S. Officials Triggered Crackdown on Anthropic Models

Jamieson O'Reilly原推

转自:公众号原文