工具调用准确：说实话，Agentic Thinking 架构确实有点东西。调用 MCP 工具、执行多步骤任务时逻辑清晰，这点没得黑响应速度快：在硅基流动平台上延迟很低，体验流畅，基本是秒回中文能力强：毕竟是基于 Qwen3.5 后训练的，中文理解到位，这点我很满意免费真香：目前限时免费，白嫖的快乐你懂的，还要啥自行车？

复杂推理有差距：DeepSWE 等高难度任务上和 GPT-5.5 还有明显差距，老实讲，硬刚复杂逻辑还是差点意思创意任务一般：Agentic 能力强不等于创意好，写文章还是 GPT 系列更自然，这真的有用吗？权重未完全开放：虽然开源，但本地部署需要的显存门槛不低，普通人玩不起

代码助手 / Bug修复信息搜索与综合自动化工作流（Agent）需要调用工具的任务

Nex-N2-Pro开源模型实测：免费接入OpenClaw当Agent真香

Q: 1. Agentic Thinking —— 推理和行动，同一种思维

说实话，大多数模型的“思考”和“执行”完全是两码事，割裂感很强。但 Nex-N2-Pro 不一样，它把 搜索、编码、工具调用 全都塞进了同一个思维框架里，这点挺绝的。 官方那套说法是：目标分解 → 状态追踪 → 策略调整 → 自我校验。 咱们用人话翻译一下：遇到复杂任务时，它会自己把步骤拆好、记得住进度、撞墙了能换路子、做完还会回头自查。

Q: 2. Adaptive Thinking —— 自己决定要不要"深度思考"

我觉得这是 Nex-N2-Pro 最聪明的地方：它知道什么时候该“动脑”，什么时候该“偷懒”。它能自主判断任务难度，动态调控推理强度。 简单任务：直接回你，绝不浪费算力 复杂任务：自动开启深度推理模式，绝不糊弄 看实测数据，Adaptive Thinking 在保住任务完成率的token 消耗省了大概 20%。你猜怎么着？翻译成人话就是：同样的钱，能干更多的活。

Q: 3. 全场景统一推理构型

话说回来，Nex-N2-Pro 在三类任务上的表现还挺有意思，推理策略都不一样： 简单说：推理总是集中在最需要决策的环节，不浪费在无关紧要的地方。

Q: 编程能力（SWE相关）

说实话，看这表格有点意思。SWE-Bench Pro 上已经超越 GPT-5.5！ 这分数咬得挺紧，58.8% 对 58.6%，微弱的优势。Terminal-Bench 也超过了 Opus 4.7，这点倒是出乎意料。

Q: Agent能力

这组数据我觉得最值得关注。BrowseComp 上已经很接近 GPT-5.5（83.7% vs 84.4%），几乎就是同一个水平线。而且你看，超越 Opus 4.7 近4个百分点，这个差距在 Agent 任务里算是挺明显的了，对吧？

Q: ⚠️ 不足

复杂推理有差距：DeepSWE 等高难度任务上和 GPT-5.5 还有明显差距，老实讲，硬刚复杂逻辑还是差点意思 创意任务一般：Agentic 能力强不等于创意好，写文章还是 GPT 系列更自然，这真的有用吗？ 权重未完全开放：虽然开源，但本地部署需要的显存门槛不低，普通人玩不起

Q: 为什么推荐硅基流动？

🔥 免费模型多到离谱：不管是 OCR、生图还是嵌入，甚至一些小型模型，长期免费随便用，这点真的很香 💰 价格屠夫：说实话，大模型 API 的价格，它家基本是行业地板价，便宜得让人不敢信 🎁 羊毛薅不停：新用户送券、老用户拉新有奖励，活动一个接一个，感觉他们家运营很活跃 🇨🇳 国内直连：注册快得飞起，不用搞那些复杂的翻墙操作，合规又稳定，对咱们国内开发者太友好了

ivye
免费干货
3小时前
10热度
0评论

说实话，不是 GPT-5.5 用不起，而是 Nex-N2-Pro 这性价比……真的绝了。
关键还免费。

2026年6月初，Nex AGI（就是上海创智学院联合那帮机构搞的）把 Nex-N2-Pro 开源了。

我就一句话总结吧：

基于 Qwen3.5-397B-A17B 后训练，性能直接对标 GPT-5.5 和 Opus 4.7，而且限时免费。

这真的有用吗？
有的。

因为它压根就不是个“只会聊天”的玩具。
老实讲，它天生就是为 Agent（智能体）场景 准备的。

核心亮点：三大能力让它不一样

1. Agentic Thinking —— 推理和行动，同一种思维

说实话，大多数模型的“思考”和“执行”完全是两码事，割裂感很强。但 Nex-N2-Pro 不一样，它把 搜索、编码、工具调用 全都塞进了同一个思维框架里，这点挺绝的。

官方那套说法是：目标分解 → 状态追踪 → 策略调整 → 自我校验。

咱们用人话翻译一下：遇到复杂任务时，它会自己把步骤拆好、记得住进度、撞墙了能换路子、做完还会回头自查。

2. Adaptive Thinking —— 自己决定要不要"深度思考"

我觉得这是 Nex-N2-Pro 最聪明的地方：它知道什么时候该“动脑”，什么时候该“偷懒”。它能自主判断任务难度，动态调控推理强度。

简单任务：直接回你，绝不浪费算力
复杂任务：自动开启深度推理模式，绝不糊弄

看实测数据，Adaptive Thinking 在保住任务完成率的token 消耗省了大概 20%。你猜怎么着？翻译成人话就是：同样的钱，能干更多的活。

3. 全场景统一推理构型

话说回来，Nex-N2-Pro 在三类任务上的表现还挺有意思，推理策略都不一样：

任务类型	推理特点
搜索任务	前期拆解搜索策略，末段综合证据
SWE编程	定位bug阶段和验证修复阶段推理最密集
开放式长程任务	推理随任务推进逐步加深，收尾时达到峰值

简单说：推理总是集中在最需要决策的环节，不浪费在无关紧要的地方。

实测数据：和GPT-5.5差多少？

先说结论：部分场景已经持平甚至超越，部分还有差距。

编程能力（SWE相关）

基准	Nex-N2-Pro	GPT-5.5	Opus 4.7
SWE-Bench Verified	80.8%	82.9%	87.6%
SWE-Bench Pro	58.8%	58.6%	64.3%
Terminal-Bench 2.1	75.3%	83.4%	69.7%
DeepSWE	33.6%	70%	54%

说实话，看这表格有点意思。SWE-Bench Pro 上已经超越 GPT-5.5！ 这分数咬得挺紧，58.8% 对 58.6%，微弱的优势。Terminal-Bench 也超过了 Opus 4.7，这点倒是出乎意料。

Agent能力

基准	Nex-N2-Pro	GPT-5.5	Opus 4.7
BrowseComp	83.7%	84.4%	79.8%
GDPval	1585	1769	1753
Toolathlon	51.9%	55.6%	52.8%

这组数据我觉得最值得关注。BrowseComp 上已经很接近 GPT-5.5（83.7% vs 84.4%），几乎就是同一个水平线。而且你看，超越 Opus 4.7 近4个百分点，这个差距在 Agent 任务里算是挺明显的了，对吧？

通用推理

基准	Nex-N2-Pro	GPT-5.5	Opus 4.7
GPQA Diamond	90.7%	93.6%	94.2%
IFEval	94.0%	-	-

GPQA Diamond 90.7%，说实话，这个分数已经算进第一梯队了。虽然离顶尖的 Opus 4.7 还差一点点，但感觉差距在缩小…… 对吧？

实测体验：接入 OpenClaw 当 Agent

我自己把 Nex-N2-Pro 接入了 OpenClaw（AI Agent 框架），实际跑了一段时间，说说感受：

✅ 优点

工具调用准确：说实话，Agentic Thinking 架构确实有点东西。调用 MCP 工具、执行多步骤任务时逻辑清晰，这点没得黑
响应速度快：在硅基流动平台上延迟很低，体验流畅，基本是秒回
中文能力强：毕竟是基于 Qwen3.5 后训练的，中文理解到位，这点我很满意
免费真香：目前限时免费，白嫖的快乐你懂的，还要啥自行车？

⚠️ 不足

复杂推理有差距：DeepSWE 等高难度任务上和 GPT-5.5 还有明显差距，老实讲，硬刚复杂逻辑还是差点意思
创意任务一般：Agentic 能力强不等于创意好，写文章还是 GPT 系列更自然，这真的有用吗？
权重未完全开放：虽然开源，但本地部署需要的显存门槛不低，普通人玩不起

💡 适合场景

代码助手 / Bug修复
信息搜索与综合
自动化工作流（Agent）
需要调用工具的任务

完整生态：不只是一个模型

说实话，Nex AGI 这次开源的，真不只是一个冷冰冰的模型。它更像是在搭一个完整的 AI Agent 生态：

组件	说明
Nex-N2-Pro	核心模型（开源）
NexAU	智能体开发框架（开源）
NexRL	强化学习训练框架（开源）
训练数据	7万条能动性数据（开源）
EaaS通信库	GPU P2P通信组件（开源）

你看，从模型本身，到怎么训练，再到最后部署，这一整条链路全都开源了。这真的有用吗？我觉得很有用。毕竟在咱们国内的开源模型圈子里，能做到这种“全链路开放”的，还真是凤毛麟角。老实讲，这格局就打开了，对吧。

硅基流动：限时免费，良心平台

Nex-N2-Pro 这个模型，现在在 SiliconFlow（硅基流动） 上已经能用了，而且——重点来了——API 调用暂时是免费的。

为什么推荐硅基流动？

🔥 免费模型多到离谱：不管是 OCR、生图还是嵌入，甚至一些小型模型，长期免费随便用，这点真的很香
💰 价格屠夫：说实话，大模型 API 的价格，它家基本是行业地板价，便宜得让人不敢信
🎁 羊毛薅不停：新用户送券、老用户拉新有奖励，活动一个接一个，感觉他们家运营很活跃
🇨🇳 国内直连：注册快得飞起，不用搞那些复杂的翻墙操作，合规又稳定，对咱们国内开发者太友好了

🎉 专属福利

如果你打算试试，记得用我的链接注册，直接送 ¥16 代金券：

👉 https://cloud.siliconflow.cn/i/jGsKyVjD

话说回来，如果你已经实名过了，还可以去当「硅基流动推荐官」。每拉一个新用户，你就再赚一张 ¥16 券，而且——邀请人数真的没上限。这真的有用吗？至少对我来说，白嫖的快乐谁懂啊。

快速接入

# OpenAI 兼容接口，替换 endpoint 即可
export OPENAI_API_KEY="你的SiliconFlow API Key"
export OPENAI_BASE_URL="https://api.siliconflow.cn/v1"

# 直接调用
curl https://api.siliconflow.cn/v1/chat/completions 
 -H "Authorization: Bearer $OPENAI_API_KEY" 
 -H "Content-Type: application/json" 
 -d '{
   "model": "nex-agi/Nex-N2-Pro",
   "messages": [{"role":"user","content":"你好"}]
 }'