卷麻了！Claude 4王者归来！免费版都这么猛？AI编程&智能体玩法大升级！(附尝鲜渠道)

ivye
工具收集
2025-05-24
165热度
0评论

摘要： 前有微软Build大会秀肌肉，后有谷歌I/O大会炫技，正当大家以为这波王炸出完了的时候，Anthropic 公司，终于放出了他们憋了许久的大招：Claude 4 系列模型，包括 Claude Opus 4 和 Claude Sonnet 4，正式上线！不搞虚的，不玩花活儿，直接上线！从做网页到写...

前有微软Build大会秀肌肉，后有谷歌I/O大会炫技，正当大家以为这波王炸出完了的时候，Anthropic 公司，终于放出了他们憋了许久的大招：Claude 4 系列模型，包括 Claude Opus 4 和 Claude Sonnet 4，正式上线！

不搞虚的，不玩花活儿，直接上线！

从做网页到写提示词，从搞创作到做卡片，Claude几乎成了我AI工具箱里的瑞士军刀，之后一度又转战到Gemini 2.5Pro...
之前还在念叨啥时候能有新惊喜，这不就来了嘛！
所以，这个千呼万唤始出来的 Claude 4 到底带来了哪些重磅更新？它又将如何改变我们的AI应用体验？普通人又能从哪些渠道抢先体验？

风云再起，Claude王者归来

这次发布会主题直指核心——“Code with Claude”，可见其在编程 (Coding) 和 AI Agent (智能体) 领域的雄心壮志。
Anthropic的CEO Dario Amodei和首席产品官Mike Krieger（没错，就是Instagram的联合创始人之一）都亲自站台，强调他们的目标是打造强大、乐于助人且可靠的AI系统，并且让开发者能够利用这些工具来改进工作方式，甚至开创新的业务模式，核心是增强人类的创造力，而非取代人。

不止编码，Agent时代已来！

这次Anthropic一口气推出了两款新模型：Claude Opus 4 和 Claude Sonnet 4。
一句话总结官方说法：这俩模型，完全是冲着编码、高级推理和AI Agent任务去的！

1. 双子星闪耀：Opus 4 与 Sonnet 4

Claude Opus 4: 这位是“大哥大”，定位为系列中能力最强、最智能的模型。号称全球最强编码模型 🏆，特别擅长处理复杂的编程问题，能自主编程数小时，而且表现稳定。官方甚至提到，CEO Dario Amodei 曾被 Opus 4 生成的内部纪要的逼真度所迷惑，误以为是团队成员写的！可见其强大。

简单理解 (Opus 4):

想象 Opus 4 是一个顶级的、经验极其丰富的资深程序员。你给他一个复杂的项目需求，他不仅能快速理解，还能自己规划、编写、调试，甚至还能在过程中不断优化。而且他精力充沛，能连续高强度工作好几个小时不出错，是开发团队的“定海神针”！

Claude Sonnet 4: 这位是“实力派小弟”，作为 Claude Sonnet 3.7 的直接升级版，它在智能与效率之间取得了绝佳平衡。

相比 Opus 4 更轻量、更快速，非常适合需要实时响应的场景。虽然在某些极限领域可能不及Opus 4，但在推理和编程能力上依然非常能打，重点是：免费用户也可以用！ 免费！免费！还是XX的免费！

2. 核心能力大升级：编码、推理、Agent三驾马车

根据官方数据，Claude 4系列在多个关键领域都取得了惊人进步：

编码能力再次封神

在 SWE-bench Verified (一个衡量真实软件工程任务性能的基准测试) 上，Opus 4 和 Sonnet 4 的表现都非常亮眼，官方称其为“最强的编程模型”。
更夸张的是，有客户报告称Opus 4能连续自主工作长达7个小时！而且，这可是0摸鱼、100%投入的7小时啊...tmd！

高级推理顶尖水平

在研究生级别的推理领域 (如GPQA Diamond)、多语言问答 (如MMMLU) 等测试中，Claude 4系列与业界顶尖模型（如OpenAI o3）不分伯仲，并列第一。

AI Agent (智能体) 任务遥遥领先：

在工具使用 (Tool Use) 相关的测试 (如TAU-bench) 中，Claude 4系列大幅领先。它们不仅能在推理过程中使用工具 (比如进行网页搜索)，还能在推理和工具使用之间灵活切换，甚至可以并行使用多个工具！这简直是为构建强大AI Agent量身打造的！

记忆能力显著增强：

当开发者授予访问本地文件的权限后，Opus 4 能非常熟练地创建和维护“记忆文件”，用来存储关键信息。

这使得它在处理长期任务时能保持更好的上下文感知 和 连贯性。官方甚至举了个例子：Opus 4在玩《宝可梦》游戏时，会自己创建一份“导航指南”笔记来帮助自己！太形象了！

其他改进：

更精确地遵循指令。
显著减少了模型为了完成任务而“走捷径”或“钻空子”的行为（比Sonnet 3.7减少了65%）。
引入了“思考摘要”功能，对于特别长的思考过程，会用一个小模型来压缩展示，当然高级用户也可以选择查看完整思考链。

3. Claude Code 正式发布：开发者的超级伙伴

除了模型本身，Anthropic还花大篇幅介绍了他们的编程Agent——Claude Code。这可不是个简单的代码补全工具，而是一个更深层次的编程协作伙伴：

IDE 集成： Claude Code 现在可以直接集成到主流的IDE中，如 VS Code 和 JetBrains。AI提出的代码修改建议会直接以内联方式显示在你的文件中，审查和跟踪都非常方便。

我觉得这个才是最赞的，能够集成到现有IDE里面更加方便、友好。

Claude Code SDK： 官方还发布了可扩展的 Claude Code SDK，开发者可以用它来构建自己的Agent和应用程序，调用与Claude Code相同的核心Agent能力。
GitHub 集成： 基于SDK，Anthropic演示了 Claude Code on GitHub (beta版)。你可以直接在GitHub的Pull Request (PR) 中 @Claude Code，让它帮你响应审查者的反馈、修复CI错误，甚至修改代码！发布会上还请来了GitHub的CEO站台，宣布GitHub Copilot将支持Claude Sonnet 4和Opus 4，并且GitHub内部的编码Agent也将由Claude Sonnet驱动。这合作深度，杠杠的！

这意味着，未来的编程工作流可能会发生巨大变化。开发者将更多地与AI Agent协作，Agent负责繁琐的编码、调试、文档撰写，甚至部分代码审查工作，而开发者则能更专注于架构设计、创新思考和复杂问题解决。Anthropic内部工程师的技术上手时间从两三周缩短到两三天，就是最好的证明！

4. API能力再升级，Agent构建更丝滑

为了让开发者更好地构建强大的AI Agent，Anthropic API也发布了四项新能力：

代码执行工具: 让Claude能运行代码，扮演数据分析师的角色，将原始数据转化为可视化洞察。
MCP 连接器: 模型上下文协议 (Model Context Protocol)，能让模型根据任务需求，自动按步骤调用合适的工具，实现更复杂的自动化编排。
文件API: 方便开发者访问和存储文档，帮助在应用中构建记忆功能。
提示词缓存升级： 缓存存活时间从5分钟延长到1小时！对于长提示词任务，这能大幅降低成本和延迟。

5. 定价与可用性

好消息是，尽管性能大幅提升，Claude 4系列的定价与之前的Opus和Sonnet模型保持一致：

Opus 4:15/百万输入 Tokens.75/百万输出Tokens
Sonnet 4:3/百万输入 Tokens,15/百万输出Tokens
可用性方面：

Claude Opus 4 和 Claude Sonnet 4 (包括扩展思考模式) 已对 Pro、Max、Team 和 Enterprise Claude套餐用户开放。
Claude Sonnet 4 也将向免费用户开放！
开发者可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud's Vertex AI 调用。

Claude 4 实战实战！

官方的介绍听着很牛，社区的反应更是炸裂！已经有手快的开发者用Claude 4跑出了各种惊艳的例子：

一句话生成一个可用的浏览器代理，包含API和前端！
一次性生成一个UI精美、带高光效果的俄罗斯方块游戏！
一句话生成复杂的可交互三维空间！

等等..

大家统一的评价就是：牛X！

甲木我当然也按捺不住激动的心，赶紧上手体验了一下。虽然还没来得及做特别复杂的Agent任务，但就我日常最爱用的卡片生成方面，Claude 4 (特别是Sonnet 4，因为免费嘛，嘿嘿) 确实给了我不少惊喜：

情绪价值营销卡片： 之前用Claude 3.x系列做营销卡片已经很顺手了。换上Claude Sonnet 4，感觉它对“情绪价值”的理解更深了一层。

我输入很简单的“美妆口红”“教育在线课程”
生成的文案更打动人心，配图建议也更贴合主题。整体输出的卡片，无论是SVG代码的规范性还是内容的创意性，都有肉眼可见的提升。

个人IP卡片： 再来试试前两天发的Gemini 个人IP打造卡片。

它不仅能很好地理解我给出的信息含义，还能在视觉设计上给出一些新颖的建议，比如配色方案、字体搭配等。生成的卡片草稿，感觉可以直接拿来用了！

英语单词卡片： 之前用Claude做单词卡片效果就很不错，但有时候样式上会有点“朴素”。

这次用Sonnet 4，惊喜地发现它在卡片设计的美观度和实用性上又上了一个台阶！生成的SVG卡片，布局更合理，色彩搭配更舒服，甚至能根据单词的含义和词性给出一些视觉提示。学英语的动力又增加了有没有！
当然，这些只是甲木的初步测试case。Claude 4 的潜力远不止于此！我相信随着大家不断地探索和挖掘，一定会有更多令人拍案叫绝的应用场景涌现出来！

想尝鲜Claude 4？哪里用？

说了这么多，我知道大家最关心的问题来了：“这么牛的 Claude 4，到底上哪儿能用啊？！”
别急，甲木这就给大家指条明路！根据我目前掌握的情报（部分参考了 @赛博小熊猫Loki 的信息），主要有以下几个渠道：

Claude 官网:https://claude.ai/new

优点： 那必须是原汁原味、满血版 的 Claude 4！Opus 4 对付费用户（Pro, Max, Team, Enterprise）开放，Sonnet 4 免费用户也能体验。
“槽点”： 懂的都懂，Anthropic 家的封号政策那是相当“严格”...我™已经被封了三个号了，我干XXXXX！

官网

Monica:https://monica.im/home

优点： 接入了 Claude 4 的 API，相对稳定，而且有 App。注意，要认准国际版，国内版用不了。
注意: 第三方平台通常会对模型的某些能力做一些调整或限制，可能体验上会比官网“略显降智”，这个得有心理准备。

Monica界面

POE:https://poe.com/

优点： 和 Monica 类似，也是接入API的第三方平台，也有 App。可以和 Monica 二选一。

Flowith:https://flowith.net/blank

优点： 这家平台也是第一时间接入了 Claude 4 的两个模型，主打在解决任务时直接调用。可以关注一下。

Cursor:https://www.cursor.com/

优点： 对于开发者来说，Cursor 这个 AI 优先的 IDE 可能会是体验 Claude 4 编码能力的绝佳场所！

Cursor Model界面
还有一些官方提到的API接入渠道：

Anthropic API： 开发者可以直接通过官方API调用。
Amazon Bedrock & Google Cloud's Vertex AI： 企业级用户也可以通过这两大云平台使用 Claude 4。

温馨提示： 大部分非官方渠道和部分官方渠道，可能都需要你自备“一些手段”才能顺利访问哦！

Agent时代，真的来了吗？

近段时间，各个领域的Agent层出不穷，身为旧王，Claude也推出了自己最强方向的诚意之作，
每次AI界有这种重量级更新，甲木都既兴奋又感慨。
兴奋的是，我们又一次见证了AI能力的飞跃。
Claude 4，尤其是它在长时间自主工作、工具调用、记忆积累方面的突破，让我真切地感受到，一个更强大、更接近“智能协作者”的AI Agent 时代，可能真的离我们不远了。

但无论如何，甲木始终坚信：技术是为人服务的。 Claude 4 再强，也是工具。如何用好这个工具，让它为我们的工作、学习和生活赋能，提升我们的创造力和生产力，这才是我们应该思考的核心问题。
别焦虑，去尝试！ 就像 Anthropic 的首席产品官 Mike Krieger 说的，他们的目标是增强人的创造力，而不是取代人。
所以，勇敢地去拥抱这些新技术吧！去体验 Claude 4 带来的惊喜，去思考它能为你的领域带来哪些新的可能性。
也许，下一个用 Claude 4 创造出惊艳作品的，就是你！

转自：https://mp.weixin.qq.com/s/RlHa8CjXTyq9eVfoEeQcNQ