本地搭建Ai中枢：一套 API Key 聚合多家大模型厂商，适用于 Cursor、Hermes Agent、OpenClaw

ivye
免费干货
1小时前
6热度
0评论

用 LiteLLM Proxy 把 MiniMax、智谱 GLM、阿里 Qwen、小米 MiMo 统一成一个入口，Cursor / Hermes Agent / OpenClaw 等任意 OpenAI 兼容客户端即插即用

📌 写在前面

"我有好几个厂家的coding plan，但是来回切换要重新输入API Key，Url地址，很麻烦。"

"模型供应商限流，宕机，我需要负载均衡，任意切换其他厂家模型"

"有没有一种方法，只需要配置一次，就能同时用上MiniMax、智谱GLM、阿里Qwen、小米MiMo这些国产大模型？"

答案是：有！今天教大家用 LiteLLM Proxy 实现一个API Key调用所有国产大模型，而且Cursor直接支持！

本文重点：使用 openai/ 自定义 provider 模式，绕过检测，兼容所有OpenAI格式的API！

🔥 什么是LiteLLM Proxy？

简单来说，LiteLLM Proxy就像一个AI模型的"路由器"：

• 你只需要连接一个地址（127.0.0.1:4000）
• 使用一个API Key
• 就能调用4个国产大模型

核心优势：

优势	说明
✅ 统一接口	OpenAI兼容格式，Cursor原生支持
✅ 绕过限制	使用 `openai/` 前缀，自定义api_base，兼容所有OpenAI格式API
✅ 环境变量	API Key集中管理，安全方便
✅ 免费开源	完全免费，无供应商锁定

💡 为什么用 `openai/` 前缀？

这是本文的核心技巧！

# 普通方式（可能失败）
model: minimax/MiniMax-M2.7
api_base: https://api.minimaxi.com/v1

# ✅ 自定义方式（绕过检测）
model: openai/MiniMax-M2.7
api_base: https://api.minimaxi.com/v1

只要API是OpenAI兼容格式，就能用这个方式接入，不管厂商是否官方支持LiteLLM！

📦 一、准备工作

1.1 安装Python 3.11

LiteLLM需要Python 3.10+，建议使用Python 3.11。

下载地址：

https://www.python.org/downloads/

安装时记得勾选 "Add Python to PATH"

验证安装：

python --version
# 应该显示 Python 3.11.x

1.2 安装LiteLLM

打开PowerShell，运行：

pip install litellm "litellm[proxy]"

📁 二、创建项目文件夹

在合适的位置创建一个文件夹，比如：

D:\AI\LiteLLM-Proxy

⚙️ 三、配置API信息

3.1 创建环境变量文件

在项目文件夹里新建一个文件，命名为 .env（注意前面有个点）：

# ===========================================
# MiniMax 配置
# ===========================================
MINIMAX_BASE_URL=https://api.minimaxi.com/v1
MINIMAX_API_KEY=你的MiniMax密钥

# ===========================================
# 智谱 GLM 配置
# ===========================================
GLM_BASE_URL=https://open.bigmodel.cn/api/paas/v4
GLM_API_KEY=你的智谱密钥

# ===========================================
# 小米 MiMo 配置
# ===========================================
XIAOMI_BASE_URL=https://token-plan-cn.xiaomimimo.com/v1
XIAOMI_API_KEY=你的小米密钥

# ===========================================
# 阿里 Qwen 配置
# ===========================================
QWEN_BASE_URL=https://coding.dashscope.aliyuncs.com/v1
QWEN_API_KEY=你的阿里密钥

3.2 获取API密钥

平台	密钥格式	获取地址
MiniMax	`sk-cp-xxx`	platform.minimaxi.com
智谱GLM	`xxx`	open.bigmodel.cn
小米MiMo	`tp-xxx`	platform.xiaomimimo.com
阿里Qwen	`sk-sp-xxx`	coding.aliyun.com

🔧 四、创建配置文件（重点！）

这是最关键的一步！

在项目文件夹里新建 litellm_config.yaml：

# LiteLLM Proxy 配置文件
# 使用 openai/ 前缀 + 自定义 api_base
# 兼容所有 OpenAI 格式的 API

model_list:
  # ===========================================
  # MiniMax M2.7
  # 使用 openai/ 前缀绕过 provider 检测
  # ===========================================
  - model_name: minimax-m2.7
    litellm_params:
      model: openai/MiniMax-M2.7
      api_key: "${MINIMAX_API_KEY}"
      api_base: "${MINIMAX_BASE_URL}"
      max_tokens: 8192
      temperature: 0.2
      timeout: 180

  - model_name: minimax-m2.7-highspeed
    litellm_params:
      model: openai/MiniMax-M2.7-highspeed
      api_key: "${MINIMAX_API_KEY}"
      api_base: "${MINIMAX_BASE_URL}"
      max_tokens: 8192
      temperature: 0.2
      timeout: 180

  # ===========================================
  # 智谱 GLM-5.1
  # ===========================================
  - model_name: glm-5.1
    litellm_params:
      model: openai/glm-5.1
      api_key: "${GLM_API_KEY}"
      api_base: "${GLM_BASE_URL}"
      max_tokens: 65536
      temperature: 1.0
      timeout: 300
      extra_body:
        thinking:
          type: "enabled"

  - model_name: glm-5.1-fast
    litellm_params:
      model: openai/glm-5.1
      api_key: "${GLM_API_KEY}"
      api_base: "${GLM_BASE_URL}"
      max_tokens: 8192
      temperature: 1.0
      timeout: 120

  - model_name: glm-5v-turbo
    litellm_params:
      model: openai/glm-5v-turbo
      api_key: "${GLM_API_KEY}"
      api_base: "${GLM_BASE_URL}"
      max_tokens: 16384
      temperature: 1.0
      timeout: 180
      extra_body:
        thinking:
          type: "enabled"

  # ===========================================
  # 小米 MiMo
  # ===========================================
  - model_name: xiaomi-mimo-v2-pro
    litellm_params:
      model: openai/mimo-v2-pro
      api_key: "${XIAOMI_API_KEY}"
      api_base: "${XIAOMI_BASE_URL}"
      max_tokens: 32768
      temperature: 0.3
      timeout: 300

  - model_name: xiaomi-mimo-v2-omni
    litellm_params:
      model: openai/mimo-v2-omni
      api_key: "${XIAOMI_API_KEY}"
      api_base: "${XIAOMI_BASE_URL}"
      max_tokens: 16384
      temperature: 0.7
      timeout: 180

  # ===========================================
  # 阿里 Qwen
  # ===========================================
  - model_name: qwen3.6-plus
    litellm_params:
      model: openai/qwen3.6-plus
      api_key: "${QWEN_API_KEY}"
      api_base: "${QWEN_BASE_URL}"
      max_tokens: 32768
      temperature: 0.6
      timeout: 300

  - model_name: qwen3.6-plus-fast
    litellm_params:
      model: openai/qwen3.6-plus
      api_key: "${QWEN_API_KEY}"
      api_base: "${QWEN_BASE_URL}"
      max_tokens: 8192
      temperature: 0.6
      timeout: 120

  - model_name: qwen3.5-omni
    litellm_params:
      model: openai/qwen3.5-vl-plus
      api_key: "${QWEN_API_KEY}"
      api_base: "${QWEN_BASE_URL}"
      max_tokens: 16384
      temperature: 0.7
      timeout: 180

litellm_settings:
  drop_params: true
  set_verbose: false
  request_timeout: 300

general_settings:
  master_key: "cursor-unified-key"
  port: 4000
  host: 0.0.0.0
  database_url: null
  store_model_in_db: false
  store_key_in_db: false

🔑 核心配置说明

# 关键配置解释
model: openai/glm-5.1       # ✅ 使用 openai/ 前缀
api_key: "${GLM_API_KEY}"     # 从环境变量读取
api_base: "${GLM_BASE_URL}"  # 填入实际的API地址

为什么要用 openai/ 前缀？

1. 绕过LiteLLM对provider的检测
2. 兼容所有OpenAI格式的API
3. 不需要厂商官方支持LiteLLM
4. 只要API兼容OpenAI格式就能用

🚀 五、启动服务

5.1 一键启动

双击项目文件夹中的 START.bat 即可启动！

或者手动在PowerShell中运行：

cd D:\AI\LiteLLM-Proxy

# 设置UTF-8编码（解决中文乱码）
$env:PYTHONIOENCODING="utf-8"
$env:PYTHONUTF8="1"

# 启动服务
python -m litellm --config litellm_config.yaml --port 4000 --host 0.0.0.0

看到下面这行就表示成功了：

INFO:     Uvicorn running on http://0.0.0.0:4000

5.2 验证服务

打开浏览器访问：

http://127.0.0.1:4000

应该能看到LiteLLM的管理界面。

🌐 六、用 ngrok 把本地服务暴露到公网（可选）

💡 如果你的 LiteLLM 跑在本地，而 Cursor 限制了局域网上使用，或者你单纯想分享给小伙伴用，就需要一个内网穿透工具。这里推荐用 ngrok，免费、开箱即用。。

6.1 注册 ngrok 账号并获取 Token

1. 打开 https://ngrok.com/ 注册一个免费账号
2. 登录后进入 Your Authtoken 页面，复制你的 authtoken

6.2 下载并安装 ngrok

方式一：Winget 一键安装（推荐）

winget install ngrok.ngrok

方式二：手动下载

官方地址：https://ngrok.com/download

下载后解压，把 ngrok.exe 放到一个固定目录，并加入系统 PATH。

6.3 绑定 authtoken

ngrok config add-authtoken 你的authtoken

6.4 启动隧道

先确保 LiteLLM 已经在 4000 端口跑起来，然后新开一个 PowerShell 窗口：

ngrok http 4000

看到类似这样的输出就成功了：

Forwarding   https://properly-landless-aorta.ngrok-free.dev -> http://localhost:4000

把 https://properly-landless-aorta.ngrok-free.dev 这段地址记下来，这就是你 Cursor 里要填的公网地址。

6.5 （可选）申请固定域名

ngrok 免费版每次重启地址都会变。免费账号可以在控制台 Cloud Edge → Domains 里申请一个免费的固定静态域名（永久不变），启动时加 --url 参数：

ngrok http --url=你的固定域名.ngrok-free.app 4000

这样就不用每次改 Cursor 配置了。

6.6 验证公网访问

在 PowerShell 里测试（注意 ngrok 免费域名需要加一个特殊头绕过浏览器警告页）：

$headers = @{
  "Authorization" = "Bearer cursor-unified-key"
  "ngrok-skip-browser-warning" = "true"
}
Invoke-RestMethod -Uri "https://你的ngrok地址/v1/models" -Headers $headers

能看到模型列表返回就说明公网通了。Cursor 端不用加这个头，它的 User-Agent 不会被 ngrok 拦截。

💻 七、Cursor 配置（关键！）

⚠️ 重要：这一节有一个很多人踩的坑——"OpenAI API Key 开关"必须打开，否则所有配置都不生效，会报 Model name is not valid。

7.1 打开 Cursor 设置

1. 快捷键 Ctrl + , 打开设置，或左下角齿轮图标
2. 左侧选择 Cursor Settings → Models（或直接搜索 "Models"）

7.2 添加自定义模型

向下滚动到 Models 区域，点击 + Add Model，把下面这些模型名逐个加进去（模型名要和 litellm_config.yaml 里的 model_name一字不差）：

minimax-m2.7
minimax-m2.7-highspeed
glm-5.1
glm-5.1-fast
glm-5v-turbo
xiaomi-mimo-v2-pro
xiaomi-mimo-v2-omni
qwen3.6-plus
qwen3.6-plus-fast
qwen3.5-omni

💡 只想用几个模型？只添加你需要的即可。

7.3 配置 OpenAI API Key

继续向下找到 OpenAI API Key 区域，这里有三个关键操作缺一不可：

① 填写 API Key

cursor-unified-key

这个 key 就是 litellm_config.yaml 里 general_settings.master_key 的值，自己改成别的也行，两边保持一致就好。

② 勾选 Override OpenAI Base URL，填入地址

使用场景	填写地址
通过 ngrok 公网访问	`https://你的ngrok地址/`

⚠️ 地址结尾的不需要/v1 LiteLLM Proxy已经映射！

③ 打开 "OpenAI API Key" 右侧的开关！（最容易漏的一步）

OpenAI API Key                                               [  ●]  ← 开关必须打开（绿色）

这个开关如果不打开，前面所有配置都白搭，Cursor 依然会走官方 API，所以你在选模型时就会报 Model name is not valid: "xxx"。

7.4 验证配置

点击 Verify 按钮（在 API Key 输入框旁边）。看到 ✓ 绿色对勾就说明连接成功。

如果报错：

报错	原因	解决
`Model name is not valid`	开关没打开 / 模型名没加	检查 7.3 步③，以及 7.2 步模型名是否完全一致
`Failed to connect`	Base URL 错误 / 服务没启动	检查 LiteLLM 是否运行，地址是否带 `/v1`
`Unauthorized`	API Key 错误	检查 master_key 和 Cursor 里的 Key 是否一致
`ERR_NGROK_XXXX`	ngrok 问题	重启 ngrok，或考虑换 Cloudflare Tunnel

7.5 选择模型使用

回到对话界面，点击底部模型选择器，就能看到你添加的所有模型：

• minimax-m2.7 — MiniMax M2.7
• minimax-m2.7-highspeed — MiniMax M2.7 高速版
• glm-5.1 — 智谱 GLM-5.1
• glm-5.1-fast — 智谱 GLM-5.1 快速版
• glm-5v-turbo — 智谱 GLM-5V-Turbo 多模态
• xiaomi-mimo-v2-pro — 小米 MiMo 推理版
• xiaomi-mimo-v2-omni — 小米 MiMo 全模态
• qwen3.6-plus — 阿里 Qwen 深度思考版
• qwen3.6-plus-fast — 阿里 Qwen 快速版
• qwen3.5-omni — 阿里 Qwen 全模态

选一个开始对话即可！

🤖 八、Hermes Agent 接入

除了 Cursor，你还可以把同一个 LiteLLM 网关接入 Hermes Agent（Nous Research 开源的自进化 AI 智能体），让 Hermes 直接用上你配置的所有国产大模型。

💡 Hermes Agent 是一个终端里跑的 Agent 框架，带记忆、技能沉淀、多轮规划等能力。它原生兼容 OpenAI API 格式，所以接入 LiteLLM 只需要填三样：Base URL + API Key + 模型名。

8.1 安装 Hermes Agent

官方推荐一键脚本安装（macOS / Linux / WSL）：

curl -fsSL https://hermes.nousresearch.com/install.sh | bash

Windows 原生 PowerShell 建议用 WSL 或 Docker 方式运行，具体见官方文档：
https://hermes-agent.nousresearch.com/docs

验证安装：

hermes --version

8.2 方式一：交互式配置（推荐新手）

在终端运行：

hermes model

进入交互菜单后按下面选择：

1. 选择 Custom endpoint（自定义端点）
2. API Base URL 填：
- • 本机：http://127.0.0.1:4000/v1
- • ngrok 公网：https://你的ngrok地址/v1
3. API Key 填：cursor-unified-key（就是 litellm_config.yaml 里的 master_key）
4. Model Name 填你要用的模型名，例如 minimax-m2.7 或 qwen3.6-plus

配置完成后运行一下体检命令，确认连通：

hermes doctor

看到 ✓ 就说明配好了。

8.3 方式二：手动修改配置文件（推荐进阶）

Hermes 的配置文件在 ~/.hermes/config.yaml，直接编辑：

model:
  provider: "custom"
  base_url: "http://127.0.0.1:4000/v1"     # 或 https://你的ngrok地址/v1
  api_key_env: "LITELLM_API_KEY"           # 从环境变量读取密钥，更安全
  default: "minimax-m2.7"                  # 默认使用的模型

# 可选：预定义多个模型，方便随时切换
models:
  - name: "minimax-m2.7"
  - name: "minimax-m2.7-highspeed"
  - name: "glm-5.1"
  - name: "qwen3.6-plus"
  - name: "xiaomi-mimo-v2-pro"

然后在 ~/.hermes/.env 里设置密钥：

LITELLM_API_KEY=cursor-unified-key

⚠️ 官方近期移除了 .env 中的 OPENAI_BASE_URL 和 LLM_MODEL 变量，config.yaml 才是唯一配置来源，别被旧教程误导。

8.4 启动并使用

hermes

进入对话界面后：

操作	命令
查看当前模型	`/model`
切换模型	`/model minimax-m2.7-highspeed`
查看可用模型列表	`/models`
查看诊断信息	`/doctor`
退出	`/exit`

8.5 Cursor 与 Hermes 共用一套配置

因为两者都指向同一个 LiteLLM 网关，所以：

• LiteLLM 只需启动一次
• API Key 统一（master_key）
• 模型名统一（litellm_config.yaml 里的 model_name）
• 新增/修改模型后，Cursor 和 Hermes 双端同时生效，只需重启 LiteLLM

这就是用 LiteLLM 做统一网关的最大好处——一次配置，所有客户端受益。

8.6 Hermes Agent 常见报错

报错	原因	解决
`Connection refused`	LiteLLM 未启动或端口不对	先确认 `http://127.0.0.1:4000/v1/models` 能正常返回
`401 Unauthorized`	API Key 填错	检查与 `master_key` 是否一致
`model not found`	模型名在 LiteLLM 里不存在	对照 `litellm_config.yaml` 的 `model_name` 核对
`/v1/chat/completions 404`	Base URL 少了 `/v1`	URL 必须以 `/v1` 结尾

🦞 九、OpenClaw（小龙虾）接入

OpenClaw（圈内昵称"小龙虾"）是 datawhalechina 社区推广的开源 AI Agent 框架，强调本地优先、自主执行任务、可插拔模型。它同样支持任何 OpenAI 兼容端点，所以把它和 LiteLLM 对接，就能让小龙虾直接调用你配好的所有国产大模型。

💡 OpenClaw 和 Hermes Agent 是同类型工具，区别在于 OpenClaw 更强调「本地网关 + Skills/MCP 可扩展」的架构。两者可以同时装，共用一套 LiteLLM 网关。

9.1 安装 OpenClaw

官方推荐三种部署方式：一键脚本、Docker、源码安装。这里以一键脚本为例（macOS / Linux / WSL）：

curl -fsSL https://openclaw.ai/install.sh | bash

Windows 用户建议用 WSL 或 Docker，具体请看官方仓库：
https://github.com/datawhalechina/hello-claw

验证安装：

openclaw --version

9.2 方式一：命令行配置（推荐）

OpenClaw 所有配置都能通过 openclaw config set 命令设置。接入 LiteLLM 只要两行：

# ① 设置自定义 Base URL（指向 LiteLLM）
openclaw config set models.openai.base_url "http://127.0.0.1:4000/v1"

# ② 设置 API Key（等于 LiteLLM 的 master_key）
openclaw config set models.openai.api_key "cursor-unified-key"

# ③ 重启网关让配置生效
openclaw gateway restart

如果走 ngrok 公网，把第 ① 步的地址改成 https://你的ngrok地址/v1 即可。

9.3 方式二：手动编辑配置文件（推荐进阶）

OpenClaw 核心配置在 ~/.openclaw/openclaw.json，可以直接添加一个指向 LiteLLM 的自定义 provider：

{
  "models": {
    "providers": {
      "litellm": {
        "baseUrl": "http://127.0.0.1:4000/v1",
        "apiKey": "cursor-unified-key",
        "api": "openai-compatible",
        "models": [
          { "id": "minimax-m2.7",            "name": "MiniMax M2.7" },
          { "id": "minimax-m2.7-highspeed",  "name": "MiniMax M2.7 高速版" },
          { "id": "glm-5.1",                 "name": "智谱 GLM-5.1" },
          { "id": "glm-5.1-fast",            "name": "智谱 GLM-5.1 快速版" },
          { "id": "glm-5v-turbo",            "name": "智谱 GLM-5V Turbo" },
          { "id": "xiaomi-mimo-v2-pro",      "name": "小米 MiMo Pro" },
          { "id": "xiaomi-mimo-v2-omni",     "name": "小米 MiMo Omni" },
          { "id": "qwen3.6-plus",            "name": "阿里 Qwen-Plus 思考版" },
          { "id": "qwen3.6-plus-fast",       "name": "阿里 Qwen-Plus 快速版" },
          { "id": "qwen3.5-omni",            "name": "阿里 Qwen Omni" }
        ]
      }
    }
  }
}

改完后重启网关：

openclaw gateway restart

9.4 验证配置

OpenClaw 自带三件套检测工具：

命令	作用
`openclaw models probe`	探测所有配置的模型是否可用
`openclaw models status`	查看模型当前状态
`openclaw doctor`	一键诊断 + 自动修复常见问题

全部 ✓ 就说明小龙虾已经成功连上 LiteLLM 了。

9.5 切换与使用模型

# 列出所有模型
openclaw models list

# 切换默认模型
openclaw config set models.default "minimax-m2.7-highspeed"

# 启动对话
openclaw

在对话中也可以临时切换：

/model qwen3.6-plus

9.6 Cursor + Hermes + OpenClaw 三端共存

这三个客户端完全可以共存，本质上都是 LiteLLM 的下游调用方：

┌─────────┐  ┌──────────────┐  ┌──────────┐
│ Cursor  │  │ Hermes Agent │  │ OpenClaw │
└────┬────┘  └──────┬───────┘  └────┬─────┘
     │              │                │
     └──────────────┼────────────────┘
                    ▼
         ┌────────────────────┐
         │   LiteLLM Proxy    │
         │  127.0.0.1:4000    │
         └──────────┬─────────┘
                    ▼
      MiniMax / GLM / Qwen / MiMo ...

配置原则：

• LiteLLM 只需启动一次
• master_key 只需设置一次
• 模型增删改只需改 litellm_config.yaml
• 三端只负责"连哪个地址、用哪个 Key、选哪个模型"

9.7 OpenClaw 常见报错

报错	原因	解决
`gateway not running`	网关未启动	`openclaw gateway start`
`model probe failed`	上游或 LiteLLM 连不通	`openclaw doctor` 自动排查；或先手动 `curl` LiteLLM 的 `/v1/models`
`401 Unauthorized`	`apiKey` 与 `master_key` 不一致	保持两边完全一致
配置改了但不生效	没重启网关	`openclaw gateway restart`
Windows 下装不上	原生 Windows 不被官方支持	用 WSL2 或 Docker

📋 十、可用模型一览

模型	特点	适用场景
`minimax-m2.7`	自进化、编程强	复杂代码任务
`minimax-m2.7-highspeed`	同能力、更快	需要快速响应
`glm-5.1`	编程、思考模式	复杂编程任务
`glm-5.1-fast`	快速响应	日常对话
`glm-5v-turbo`	多模态编程	视觉+代码
`xiaomi-mimo-v2-pro`	推理模式、超长上下文	Agent任务
`xiaomi-mimo-v2-omni`	全模态	多模态任务
`qwen3.6-plus`	深度思考、中文优化	创意写作
`qwen3.6-plus-fast`	快速响应	日常对话
`qwen3.5-omni`	全模态	多模态任务

❓ 十一、常见问题

Q1: 启动报错"No module named litellm"

确保已安装：

pip install litellm "litellm[proxy]"

Q2: 端口被占用

4000端口被其他程序占用，可以换一个端口：

python -m litellm --config litellm_config.yaml --port 4001 --host 0.0.0.0

同时需要修改Cursor的API Endpoint为 http://127.0.0.1:4001/v1

Q3: 模型加载失败

检查 .env 文件中的API地址和密钥是否正确。

Q4: 为什么用 `openai/` 前缀？

这是本文的核心技巧！可以绕过LiteLLM对provider的检测，兼容所有OpenAI格式的API。

Q5: 支持多少模型？

理论上无限，只要API是OpenAI兼容格式都可以。

Q6: 为什么我加的模型后面没有"脑子图标"和性能等级？

在 Cursor 的模型选择器里，你会看到官方模型（Opus、Sonnet、GPT-5.4、Codex 等）右边有 🧠 图标和 High / Medium 等性能等级标签，而你通过自定义 API 加进去的模型（minimax-m2.7、xiaomi-mimo-v2-pro 等）后面什么都没有。

这是 Cursor 的设计限制，不是 Bug，也不是你的配置问题。

原因：

标记	含义	为什么自定义模型没有
🧠 图标	Cursor 认证该模型支持 reasoning/thinking 模式	Cursor 只对内置模型维护这个白名单
`High` / `Medium`	Cursor 根据内部 benchmark 给出的能力评级	这个评级是 Cursor 自己打的分，自定义模型 Cursor "不认识"
☁️ / $ 图标	是否经过 Cursor 服务器中转、计费档位等	自定义模型走你自己的 endpoint，Cursor 不参与计费

对功能有影响吗？

• ❌ 不影响使用 ——对话、代码补全、Agent 模式都能正常工作
• ❌ 不影响思考/推理 ——只要上游模型自己支持 thinking（比如在 extra_body 里开启了 enable_thinking），推理内容依然会返回
• ⚠️ 有个小差别：Cursor 的"自动模型切换"、"MAX Mode"等高级功能只对官方模型生效，自定义模型不会出现在这些选项里

能让它显示吗？

不能。这些标签是 Cursor 客户端硬编码的，只针对官方支持的模型列表。除非 Cursor 官方把你用的模型加进内置支持，否则永远只会以"裸模型名"形式展示。

所以——能用就行，心态放平 😄

🎯 十二、进阶玩法

12.1 添加更多模型

编辑 litellm_config.yaml，在 model_list 中添加更多模型：

  - model_name: my-custom-model
    litellm_params:
      model: openai/my-model-name
      api_key: "${MY_API_KEY}"
      api_base: "https://my-api.com/v1"

12.2 设置默认模型

可以设置一个默认模型，Cursor会自动使用：

general_settings:
  master_key: "cursor-unified-key"
  default_model: "minimax-m2.7"

12.3 查看用量

访问 http://127.0.0.1:4000/ui 可以查看API调用日志和用量统计。

💡 结语

通过LiteLLM Proxy + openai/ 自定义provider模式，我们实现了：

1. ✅ 一个API Key走天下 - 统一接口
2. ✅ 绕过厂商限制 - 兼容所有OpenAI格式API
3. ✅ Cursor原生支持 - 开箱即用
4. ✅ 免费开源 - 无供应商锁定

完整项目文件结构：

LiteLLM-Proxy/
├── .env                    # 环境变量（API密钥）
├── litellm_config.yaml    # 模型配置文件
├── START.bat              # 一键启动脚本
└── README.md              # 说明文档

转自：https://mp.weixin.qq.com/s/LmzTvoJIGTljij6ORyRXxA