卷麻了!Claude 4王者归来!免费版都这么猛?AI编程&智能体玩法大升级!(附尝鲜渠道)
前有微软Build大会秀肌肉,后有谷歌I/O大会炫技,正当大家以为这波王炸出完了的时候,Anthropic 公司,终于放出了他们憋了许久的大招:Claude 4 系列模型,包括 Claude Opus 4 和 Claude Sonnet 4,正式上线!
不搞虚的,不玩花活儿,直接上线!
从做网页到写提示词,从搞创作到做卡片,Claude几乎成了我AI工具箱里的瑞士军刀,之后一度又转战到Gemini 2.5Pro...
之前还在念叨啥时候能有新惊喜,这不就来了嘛!
所以,这个千呼万唤始出来的 Claude 4 到底带来了哪些重磅更新?它又将如何改变我们的AI应用体验?普通人又能从哪些渠道抢先体验?
风云再起,Claude王者归来
这次发布会主题直指核心——“Code with Claude”,可见其在编程 (Coding) 和 AI Agent (智能体) 领域的雄心壮志。
Anthropic的CEO Dario Amodei和首席产品官Mike Krieger(没错,就是Instagram的联合创始人之一)都亲自站台,强调他们的目标是打造强大、乐于助人且可靠的AI系统,并且让开发者能够利用这些工具来改进工作方式,甚至开创新的业务模式,核心是增强人类的创造力,而非取代人。
不止编码,Agent时代已来!
这次Anthropic一口气推出了两款新模型:Claude Opus 4 和 Claude Sonnet 4。
一句话总结官方说法:这俩模型,完全是冲着编码、高级推理和AI Agent任务去的!
1. 双子星闪耀:Opus 4 与 Sonnet 4
Claude Opus 4: 这位是“大哥大”,定位为系列中能力最强、最智能的模型。号称全球最强编码模型 🏆,特别擅长处理复杂的编程问题,能自主编程数小时,而且表现稳定。官方甚至提到,CEO Dario Amodei 曾被 Opus 4 生成的内部纪要的逼真度所迷惑,误以为是团队成员写的!可见其强大。
简单理解 (Opus 4):
想象 Opus 4 是一个顶级的、经验极其丰富的资深程序员。你给他一个复杂的项目需求,他不仅能快速理解,还能自己规划、编写、调试,甚至还能在过程中不断优化。而且他精力充沛,能连续高强度工作好几个小时不出错,是开发团队的“定海神针”!
Claude Sonnet 4: 这位是“实力派小弟”,作为 Claude Sonnet 3.7 的直接升级版,它在智能与效率之间取得了绝佳平衡。
相比 Opus 4 更轻量、更快速,非常适合需要实时响应的场景。虽然在某些极限领域可能不及Opus 4,但在推理和编程能力上依然非常能打,重点是:免费用户也可以用! 免费!免费!还是XX的免费!
2. 核心能力大升级:编码、推理、Agent三驾马车
根据官方数据,Claude 4系列在多个关键领域都取得了惊人进步:
编码能力再次封神
在 SWE-bench Verified (一个衡量真实软件工程任务性能的基准测试) 上,Opus 4 和 Sonnet 4 的表现都非常亮眼,官方称其为“最强的编程模型”。
更夸张的是,有客户报告称Opus 4能连续自主工作长达7个小时!而且,这可是0摸鱼、100%投入的7小时啊...tmd!
高级推理顶尖水平
在研究生级别的推理领域 (如GPQA Diamond)、多语言问答 (如MMMLU) 等测试中,Claude 4系列与业界顶尖模型(如OpenAI o3)不分伯仲,并列第一。
AI Agent (智能体) 任务遥遥领先:
在工具使用 (Tool Use) 相关的测试 (如TAU-bench) 中,Claude 4系列大幅领先。它们不仅能在推理过程中使用工具 (比如进行网页搜索),还能在推理和工具使用之间灵活切换,甚至可以并行使用多个工具!这简直是为构建强大AI Agent量身打造的!
记忆能力显著增强:
当开发者授予访问本地文件的权限后,Opus 4 能非常熟练地创建和维护“记忆文件”,用来存储关键信息。
这使得它在处理长期任务时能保持更好的上下文感知 和 连贯性。官方甚至举了个例子:Opus 4在玩《宝可梦》游戏时,会自己创建一份“导航指南”笔记来帮助自己!太形象了!
其他改进:
更精确地遵循指令。
显著减少了模型为了完成任务而“走捷径”或“钻空子”的行为(比Sonnet 3.7减少了65%)。
引入了“思考摘要”功能,对于特别长的思考过程,会用一个小模型来压缩展示,当然高级用户也可以选择查看完整思考链。
3. Claude Code 正式发布:开发者的超级伙伴
除了模型本身,Anthropic还花大篇幅介绍了他们的编程Agent——Claude Code。这可不是个简单的代码补全工具,而是一个更深层次的编程协作伙伴:
IDE 集成: Claude Code 现在可以直接集成到主流的IDE中,如 VS Code 和 JetBrains。AI提出的代码修改建议会直接以内联方式显示在你的文件中,审查和跟踪都非常方便。
我觉得这个才是最赞的,能够集成到现有IDE里面更加方便、友好。
Claude Code SDK: 官方还发布了可扩展的 Claude Code SDK,开发者可以用它来构建自己的Agent和应用程序,调用与Claude Code相同的核心Agent能力。
GitHub 集成: 基于SDK,Anthropic演示了 Claude Code on GitHub (beta版)。你可以直接在GitHub的Pull Request (PR) 中 @Claude Code,让它帮你响应审查者的反馈、修复CI错误,甚至修改代码!发布会上还请来了GitHub的CEO站台,宣布GitHub Copilot将支持Claude Sonnet 4和Opus 4,并且GitHub内部的编码Agent也将由Claude Sonnet驱动。这合作深度,杠杠的!
这意味着,未来的编程工作流可能会发生巨大变化。开发者将更多地与AI Agent协作,Agent负责繁琐的编码、调试、文档撰写,甚至部分代码审查工作,而开发者则能更专注于架构设计、创新思考和复杂问题解决。Anthropic内部工程师的技术上手时间从两三周缩短到两三天,就是最好的证明!
4. API能力再升级,Agent构建更丝滑
为了让开发者更好地构建强大的AI Agent,Anthropic API也发布了四项新能力:
代码执行工具: 让Claude能运行代码,扮演数据分析师的角色,将原始数据转化为可视化洞察。
MCP 连接器: 模型上下文协议 (Model Context Protocol),能让模型根据任务需求,自动按步骤调用合适的工具,实现更复杂的自动化编排。
文件API: 方便开发者访问和存储文档,帮助在应用中构建记忆功能。
提示词缓存升级: 缓存存活时间从5分钟延长到1小时!对于长提示词任务,这能大幅降低成本和延迟。
5. 定价与可用性
好消息是,尽管性能大幅提升,Claude 4系列的定价与之前的Opus和Sonnet模型保持一致:
Opus 4:15/百万输入 Tokens.75/百万输出Tokens
Sonnet 4:3/百万输入 Tokens,15/百万输出Tokens
可用性方面:
Claude Opus 4 和 Claude Sonnet 4 (包括扩展思考模式) 已对 Pro、Max、Team 和 Enterprise Claude套餐用户开放。
Claude Sonnet 4 也将向免费用户开放!
开发者可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud's Vertex AI 调用。
Claude 4 实战实战!
官方的介绍听着很牛,社区的反应更是炸裂!已经有手快的开发者用Claude 4跑出了各种惊艳的例子:
一句话生成一个可用的浏览器代理,包含API和前端!
一次性生成一个UI精美、带高光效果的俄罗斯方块游戏!
一句话生成复杂的可交互三维空间!
等等..
大家统一的评价就是:牛X!
甲木我当然也按捺不住激动的心,赶紧上手体验了一下。虽然还没来得及做特别复杂的Agent任务,但就我日常最爱用的卡片生成方面,Claude 4 (特别是Sonnet 4,因为免费嘛,嘿嘿) 确实给了我不少惊喜:
情绪价值营销卡片: 之前用Claude 3.x系列做营销卡片已经很顺手了。换上Claude Sonnet 4,感觉它对“情绪价值”的理解更深了一层。
我输入很简单的“美妆 口红”“教育 在线课程”
生成的文案更打动人心,配图建议也更贴合主题。整体输出的卡片,无论是SVG代码的规范性还是内容的创意性,都有肉眼可见的提升。
个人IP卡片: 再来试试前两天发的Gemini 个人IP打造卡片。
它不仅能很好地理解我给出的信息含义,还能在视觉设计上给出一些新颖的建议,比如配色方案、字体搭配等。生成的卡片草稿,感觉可以直接拿来用了!
英语单词卡片: 之前用Claude做单词卡片效果就很不错,但有时候样式上会有点“朴素”。
这次用Sonnet 4,惊喜地发现它在卡片设计的美观度和实用性上又上了一个台阶!生成的SVG卡片,布局更合理,色彩搭配更舒服,甚至能根据单词的含义和词性给出一些视觉提示。学英语的动力又增加了有没有!
当然,这些只是甲木的初步测试case。Claude 4 的潜力远不止于此!我相信随着大家不断地探索和挖掘,一定会有更多令人拍案叫绝的应用场景涌现出来!
想尝鲜Claude 4?哪里用?
说了这么多,我知道大家最关心的问题来了:“这么牛的 Claude 4,到底上哪儿能用啊?!”
别急,甲木这就给大家指条明路!根据我目前掌握的情报(部分参考了 @赛博小熊猫Loki 的信息),主要有以下几个渠道:
Claude 官网:https://claude.ai/new
优点: 那必须是原汁原味、满血版 的 Claude 4!Opus 4 对付费用户(Pro, Max, Team, Enterprise)开放,Sonnet 4 免费用户也能体验。
“槽点”: 懂的都懂,Anthropic 家的封号政策那是相当“严格”...我™已经被封了三个号了,我干XXXXX!
官网
Monica:https://monica.im/home
优点: 接入了 Claude 4 的 API,相对稳定,而且有 App。注意,要认准国际版,国内版用不了。
注意: 第三方平台通常会对模型的某些能力做一些调整或限制,可能体验上会比官网“略显降智”,这个得有心理准备。
Monica界面
POE:https://poe.com/
优点: 和 Monica 类似,也是接入API的第三方平台,也有 App。可以和 Monica 二选一。
Flowith:https://flowith.net/blank
优点: 这家平台也是第一时间接入了 Claude 4 的两个模型,主打在解决任务时直接调用。可以关注一下。
Cursor:https://www.cursor.com/
优点: 对于开发者来说,Cursor 这个 AI 优先的 IDE 可能会是体验 Claude 4 编码能力的绝佳场所!
Cursor Model界面
还有一些官方提到的API接入渠道:
Anthropic API: 开发者可以直接通过官方API调用。
Amazon Bedrock & Google Cloud's Vertex AI: 企业级用户也可以通过这两大云平台使用 Claude 4。
温馨提示: 大部分非官方渠道和部分官方渠道,可能都需要你自备“一些手段”才能顺利访问哦!
Agent时代,真的来了吗?
近段时间,各个领域的Agent层出不穷,身为旧王,Claude也推出了自己最强方向的诚意之作,
每次AI界有这种重量级更新,甲木都既兴奋又感慨。
兴奋的是,我们又一次见证了AI能力的飞跃。
Claude 4,尤其是它在长时间自主工作、工具调用、记忆积累方面的突破,让我真切地感受到,一个更强大、更接近“智能协作者”的AI Agent 时代,可能真的离我们不远了。
但无论如何,甲木始终坚信:技术是为人服务的。 Claude 4 再强,也是工具。如何用好这个工具,让它为我们的工作、学习和生活赋能,提升我们的创造力和生产力,这才是我们应该思考的核心问题。
别焦虑,去尝试! 就像 Anthropic 的首席产品官 Mike Krieger 说的,他们的目标是增强人的创造力,而不是取代人。
所以,勇敢地去拥抱这些新技术吧!去体验 Claude 4 带来的惊喜,去思考它能为你的领域带来哪些新的可能性。
也许,下一个用 Claude 4 创造出惊艳作品的,就是你!
转自:https://mp.weixin.qq.com/s/RlHa8CjXTyq9eVfoEeQcNQ


共有 0 条评论