本地搭建Ai中枢:一套 API Key 聚合多家大模型厂商,适用于 Cursor、Hermes Agent、OpenClaw

用 LiteLLM Proxy 把 MiniMax、智谱 GLM、阿里 Qwen、小米 MiMo 统一成一个入口,Cursor / Hermes Agent / OpenClaw 等任意 OpenAI 兼容客户端即插即用

📌 写在前面

"我有好几个厂家的coding plan,但是来回切换要重新输入API Key,Url地址,很麻烦。"

"模型供应商限流,宕机,我需要负载均衡,任意切换其他厂家模型"

"有没有一种方法,只需要配置一次,就能同时用上MiniMax、智谱GLM、阿里Qwen、小米MiMo这些国产大模型?"

答案是:有! 今天教大家用 LiteLLM Proxy 实现一个API Key调用所有国产大模型,而且Cursor直接支持!

本文重点:使用 openai/ 自定义 provider 模式,绕过检测,兼容所有OpenAI格式的API!


🔥 什么是LiteLLM Proxy?

简单来说,LiteLLM Proxy就像一个AI模型的"路由器"

  • • 你只需要连接一个地址(127.0.0.1:4000)
  • • 使用一个API Key
  • • 就能调用4个国产大模型

核心优势:

优势 说明
✅ 统一接口 OpenAI兼容格式,Cursor原生支持
✅ 绕过限制 使用 openai/ 前缀,自定义api_base,兼容所有OpenAI格式API
✅ 环境变量 API Key集中管理,安全方便
✅ 免费开源 完全免费,无供应商锁定

💡 为什么用 openai/ 前缀?

这是本文的核心技巧

# 普通方式(可能失败)
model: minimax/MiniMax-M2.7
api_base: https://api.minimaxi.com/v1

# ✅ 自定义方式(绕过检测)
model: openai/MiniMax-M2.7
api_base: https://api.minimaxi.com/v1

只要API是OpenAI兼容格式,就能用这个方式接入,不管厂商是否官方支持LiteLLM!

📦 一、准备工作

1.1 安装Python 3.11

LiteLLM需要Python 3.10+,建议使用Python 3.11。

下载地址:

https://www.python.org/downloads/

安装时记得勾选 "Add Python to PATH"

验证安装:

python --version
# 应该显示 Python 3.11.x

1.2 安装LiteLLM

打开PowerShell,运行:

pip install litellm "litellm[proxy]"

📁 二、创建项目文件夹

在合适的位置创建一个文件夹,比如:

D:\AI\LiteLLM-Proxy

⚙️ 三、配置API信息

3.1 创建环境变量文件

在项目文件夹里新建一个文件,命名为 .env(注意前面有个点):

# ===========================================
# MiniMax 配置
# ===========================================
MINIMAX_BASE_URL=https://api.minimaxi.com/v1
MINIMAX_API_KEY=你的MiniMax密钥

# ===========================================
# 智谱 GLM 配置
# ===========================================
GLM_BASE_URL=https://open.bigmodel.cn/api/paas/v4
GLM_API_KEY=你的智谱密钥

# ===========================================
# 小米 MiMo 配置
# ===========================================
XIAOMI_BASE_URL=https://token-plan-cn.xiaomimimo.com/v1
XIAOMI_API_KEY=你的小米密钥

# ===========================================
# 阿里 Qwen 配置
# ===========================================
QWEN_BASE_URL=https://coding.dashscope.aliyuncs.com/v1
QWEN_API_KEY=你的阿里密钥

3.2 获取API密钥

平台 密钥格式 获取地址
MiniMax sk-cp-xxx platform.minimaxi.com
智谱GLM xxx open.bigmodel.cn
小米MiMo tp-xxx platform.xiaomimimo.com
阿里Qwen sk-sp-xxx coding.aliyun.com

🔧 四、创建配置文件(重点!)

这是最关键的一步!

在项目文件夹里新建 litellm_config.yaml

# LiteLLM Proxy 配置文件
# 使用 openai/ 前缀 + 自定义 api_base
# 兼容所有 OpenAI 格式的 API

model_list:
  # ===========================================
  # MiniMax M2.7
  # 使用 openai/ 前缀绕过 provider 检测
  # ===========================================
  - model_name: minimax-m2.7
    litellm_params:
      model: openai/MiniMax-M2.7
      api_key: "${MINIMAX_API_KEY}"
      api_base: "${MINIMAX_BASE_URL}"
      max_tokens: 8192
      temperature: 0.2
      timeout: 180

  - model_name: minimax-m2.7-highspeed
    litellm_params:
      model: openai/MiniMax-M2.7-highspeed
      api_key: "${MINIMAX_API_KEY}"
      api_base: "${MINIMAX_BASE_URL}"
      max_tokens: 8192
      temperature: 0.2
      timeout: 180

  # ===========================================
  # 智谱 GLM-5.1
  # ===========================================
  - model_name: glm-5.1
    litellm_params:
      model: openai/glm-5.1
      api_key: "${GLM_API_KEY}"
      api_base: "${GLM_BASE_URL}"
      max_tokens: 65536
      temperature: 1.0
      timeout: 300
      extra_body:
        thinking:
          type: "enabled"

  - model_name: glm-5.1-fast
    litellm_params:
      model: openai/glm-5.1
      api_key: "${GLM_API_KEY}"
      api_base: "${GLM_BASE_URL}"
      max_tokens: 8192
      temperature: 1.0
      timeout: 120

  - model_name: glm-5v-turbo
    litellm_params:
      model: openai/glm-5v-turbo
      api_key: "${GLM_API_KEY}"
      api_base: "${GLM_BASE_URL}"
      max_tokens: 16384
      temperature: 1.0
      timeout: 180
      extra_body:
        thinking:
          type: "enabled"

  # ===========================================
  # 小米 MiMo
  # ===========================================
  - model_name: xiaomi-mimo-v2-pro
    litellm_params:
      model: openai/mimo-v2-pro
      api_key: "${XIAOMI_API_KEY}"
      api_base: "${XIAOMI_BASE_URL}"
      max_tokens: 32768
      temperature: 0.3
      timeout: 300

  - model_name: xiaomi-mimo-v2-omni
    litellm_params:
      model: openai/mimo-v2-omni
      api_key: "${XIAOMI_API_KEY}"
      api_base: "${XIAOMI_BASE_URL}"
      max_tokens: 16384
      temperature: 0.7
      timeout: 180

  # ===========================================
  # 阿里 Qwen
  # ===========================================
  - model_name: qwen3.6-plus
    litellm_params:
      model: openai/qwen3.6-plus
      api_key: "${QWEN_API_KEY}"
      api_base: "${QWEN_BASE_URL}"
      max_tokens: 32768
      temperature: 0.6
      timeout: 300

  - model_name: qwen3.6-plus-fast
    litellm_params:
      model: openai/qwen3.6-plus
      api_key: "${QWEN_API_KEY}"
      api_base: "${QWEN_BASE_URL}"
      max_tokens: 8192
      temperature: 0.6
      timeout: 120

  - model_name: qwen3.5-omni
    litellm_params:
      model: openai/qwen3.5-vl-plus
      api_key: "${QWEN_API_KEY}"
      api_base: "${QWEN_BASE_URL}"
      max_tokens: 16384
      temperature: 0.7
      timeout: 180

litellm_settings:
  drop_params: true
  set_verbose: false
  request_timeout: 300

general_settings:
  master_key: "cursor-unified-key"
  port: 4000
  host: 0.0.0.0
  database_url: null
  store_model_in_db: false
  store_key_in_db: false

🔑 核心配置说明

# 关键配置解释
model: openai/glm-5.1       # ✅ 使用 openai/ 前缀
api_key: "${GLM_API_KEY}"     # 从环境变量读取
api_base: "${GLM_BASE_URL}"  # 填入实际的API地址

为什么要用 openai/ 前缀?

  1. 1. 绕过LiteLLM对provider的检测
  2. 2. 兼容所有OpenAI格式的API
  3. 3. 不需要厂商官方支持LiteLLM
  4. 4. 只要API兼容OpenAI格式就能用

🚀 五、启动服务

5.1 一键启动

双击项目文件夹中的 START.bat 即可启动!

或者手动在PowerShell中运行:

cd D:\AI\LiteLLM-Proxy

# 设置UTF-8编码(解决中文乱码)
$env:PYTHONIOENCODING="utf-8"
$env:PYTHONUTF8="1"

# 启动服务
python -m litellm --config litellm_config.yaml --port 4000 --host 0.0.0.0

看到下面这行就表示成功了:

INFO:     Uvicorn running on http://0.0.0.0:4000

5.2 验证服务

打开浏览器访问:

http://127.0.0.1:4000

应该能看到LiteLLM的管理界面。

🌐 六、用 ngrok 把本地服务暴露到公网(可选)

💡 如果你的 LiteLLM 跑在本地,而 Cursor 限制了局域网上使用,或者你单纯想分享给小伙伴用,就需要一个内网穿透工具。这里推荐用 ngrok,免费、开箱即用。。

6.1 注册 ngrok 账号并获取 Token

  1. 1. 打开 https://ngrok.com/ 注册一个免费账号
  2. 2. 登录后进入 Your Authtoken 页面,复制你的 authtoken

6.2 下载并安装 ngrok

方式一:Winget 一键安装(推荐)

winget install ngrok.ngrok

方式二:手动下载

官方地址:https://ngrok.com/download

下载后解压,把 ngrok.exe 放到一个固定目录,并加入系统 PATH。

6.3 绑定 authtoken

ngrok config add-authtoken 你的authtoken

6.4 启动隧道

先确保 LiteLLM 已经在 4000 端口跑起来,然后新开一个 PowerShell 窗口:

ngrok http 4000

看到类似这样的输出就成功了:

Forwarding   https://properly-landless-aorta.ngrok-free.dev -> http://localhost:4000

把 https://properly-landless-aorta.ngrok-free.dev 这段地址记下来,这就是你 Cursor 里要填的公网地址。

6.5 (可选)申请固定域名

ngrok 免费版每次重启地址都会变。免费账号可以在控制台 Cloud Edge → Domains 里申请一个免费的固定静态域名(永久不变),启动时加 --url 参数:

ngrok http --url=你的固定域名.ngrok-free.app 4000

这样就不用每次改 Cursor 配置了。

6.6 验证公网访问

在 PowerShell 里测试(注意 ngrok 免费域名需要加一个特殊头绕过浏览器警告页):

$headers = @{
  "Authorization" = "Bearer cursor-unified-key"
  "ngrok-skip-browser-warning" = "true"
}
Invoke-RestMethod -Uri "https://你的ngrok地址/v1/models" -Headers $headers

能看到模型列表返回就说明公网通了。Cursor 端不用加这个头,它的 User-Agent 不会被 ngrok 拦截。


💻 七、Cursor 配置(关键!)

⚠️ 重要:这一节有一个很多人踩的坑——"OpenAI API Key 开关"必须打开,否则所有配置都不生效,会报 Model name is not valid

7.1 打开 Cursor 设置

  1. 1. 快捷键 Ctrl + , 打开设置,或左下角齿轮图标
  2. 2. 左侧选择 Cursor Settings → Models(或直接搜索 "Models")

7.2 添加自定义模型

向下滚动到 Models 区域,点击 + Add Model,把下面这些模型名逐个加进去(模型名要和 litellm_config.yaml 里的 model_name一字不差):

minimax-m2.7
minimax-m2.7-highspeed
glm-5.1
glm-5.1-fast
glm-5v-turbo
xiaomi-mimo-v2-pro
xiaomi-mimo-v2-omni
qwen3.6-plus
qwen3.6-plus-fast
qwen3.5-omni

💡 只想用几个模型?只添加你需要的即可。

7.3 配置 OpenAI API Key

继续向下找到 OpenAI API Key 区域,这里有三个关键操作缺一不可

① 填写 API Key

cursor-unified-key

这个 key 就是 litellm_config.yaml 里 general_settings.master_key 的值,自己改成别的也行,两边保持一致就好。

② 勾选 Override OpenAI Base URL,填入地址

使用场景 填写地址
通过 ngrok 公网访问 https://你的ngrok地址/

⚠️ 地址结尾的不需要/v1 LiteLLM Proxy已经映射!

③ 打开 "OpenAI API Key" 右侧的开关!(最容易漏的一步)

OpenAI API Key                                               [  ●]  ← 开关必须打开(绿色)

这个开关如果不打开,前面所有配置都白搭,Cursor 依然会走官方 API,所以你在选模型时就会报 Model name is not valid: "xxx"

7.4 验证配置

点击 Verify 按钮(在 API Key 输入框旁边)。看到 ✓ 绿色对勾就说明连接成功。

如果报错:

报错 原因 解决
Model name is not valid 开关没打开 / 模型名没加 检查 7.3 步③,以及 7.2 步模型名是否完全一致
Failed to connect Base URL 错误 / 服务没启动 检查 LiteLLM 是否运行,地址是否带 /v1
Unauthorized API Key 错误 检查 master_key 和 Cursor 里的 Key 是否一致
ERR_NGROK_XXXX ngrok 问题 重启 ngrok,或考虑换 Cloudflare Tunnel

7.5 选择模型使用

回到对话界面,点击底部模型选择器,就能看到你添加的所有模型:

  • • minimax-m2.7 — MiniMax M2.7
  • • minimax-m2.7-highspeed — MiniMax M2.7 高速版
  • • glm-5.1 — 智谱 GLM-5.1
  • • glm-5.1-fast — 智谱 GLM-5.1 快速版
  • • glm-5v-turbo — 智谱 GLM-5V-Turbo 多模态
  • • xiaomi-mimo-v2-pro — 小米 MiMo 推理版
  • • xiaomi-mimo-v2-omni — 小米 MiMo 全模态
  • • qwen3.6-plus — 阿里 Qwen 深度思考版
  • • qwen3.6-plus-fast — 阿里 Qwen 快速版
  • • qwen3.5-omni — 阿里 Qwen 全模态

选一个开始对话即可!

🤖 八、Hermes Agent 接入

除了 Cursor,你还可以把同一个 LiteLLM 网关接入 Hermes Agent(Nous Research 开源的自进化 AI 智能体),让 Hermes 直接用上你配置的所有国产大模型。

💡 Hermes Agent 是一个终端里跑的 Agent 框架,带记忆、技能沉淀、多轮规划等能力。它原生兼容 OpenAI API 格式,所以接入 LiteLLM 只需要填三样:Base URL + API Key + 模型名。

8.1 安装 Hermes Agent

官方推荐一键脚本安装(macOS / Linux / WSL):

curl -fsSL https://hermes.nousresearch.com/install.sh | bash

Windows 原生 PowerShell 建议用 WSL 或 Docker 方式运行,具体见官方文档:
https://hermes-agent.nousresearch.com/docs

验证安装:

hermes --version

8.2 方式一:交互式配置(推荐新手)

在终端运行:

hermes model

进入交互菜单后按下面选择:

  1. 1. 选择 Custom endpoint(自定义端点)
  2. 2. API Base URL 填:
    • • 本机:http://127.0.0.1:4000/v1
    • • ngrok 公网:https://你的ngrok地址/v1
  3. 3. API Key 填:cursor-unified-key(就是 litellm_config.yaml 里的 master_key
  4. 4. Model Name 填你要用的模型名,例如 minimax-m2.7 或 qwen3.6-plus

配置完成后运行一下体检命令,确认连通:

hermes doctor

看到 ✓ 就说明配好了。

8.3 方式二:手动修改配置文件(推荐进阶)

Hermes 的配置文件在 ~/.hermes/config.yaml,直接编辑:

model:
  provider: "custom"
  base_url: "http://127.0.0.1:4000/v1"     # 或 https://你的ngrok地址/v1
  api_key_env: "LITELLM_API_KEY"           # 从环境变量读取密钥,更安全
  default: "minimax-m2.7"                  # 默认使用的模型

# 可选:预定义多个模型,方便随时切换
models:
  - name: "minimax-m2.7"
  - name: "minimax-m2.7-highspeed"
  - name: "glm-5.1"
  - name: "qwen3.6-plus"
  - name: "xiaomi-mimo-v2-pro"

然后在 ~/.hermes/.env 里设置密钥:

LITELLM_API_KEY=cursor-unified-key

⚠️ 官方近期移除了 .env 中的 OPENAI_BASE_URL 和 LLM_MODEL 变量,config.yaml 才是唯一配置来源,别被旧教程误导。

8.4 启动并使用

hermes

进入对话界面后:

操作 命令
查看当前模型 /model
切换模型 /model minimax-m2.7-highspeed
查看可用模型列表 /models
查看诊断信息 /doctor
退出 /exit

8.5 Cursor 与 Hermes 共用一套配置

因为两者都指向同一个 LiteLLM 网关,所以:

  • • LiteLLM 只需启动一次
  • • API Key 统一master_key
  • • 模型名统一litellm_config.yaml 里的 model_name
  • • 新增/修改模型后,Cursor 和 Hermes 双端同时生效,只需重启 LiteLLM

这就是用 LiteLLM 做统一网关的最大好处——一次配置,所有客户端受益

8.6 Hermes Agent 常见报错

报错 原因 解决
Connection refused LiteLLM 未启动或端口不对 先确认 http://127.0.0.1:4000/v1/models 能正常返回
401 Unauthorized API Key 填错 检查与 master_key 是否一致
model not found 模型名在 LiteLLM 里不存在 对照 litellm_config.yaml 的 model_name 核对
/v1/chat/completions 404 Base URL 少了 /v1 URL 必须以 /v1 结尾

🦞 九、OpenClaw(小龙虾)接入

OpenClaw(圈内昵称"小龙虾")是 datawhalechina 社区推广的开源 AI Agent 框架,强调本地优先自主执行任务可插拔模型。它同样支持任何 OpenAI 兼容端点,所以把它和 LiteLLM 对接,就能让小龙虾直接调用你配好的所有国产大模型。

💡 OpenClaw 和 Hermes Agent 是同类型工具,区别在于 OpenClaw 更强调「本地网关 + Skills/MCP 可扩展」的架构。两者可以同时装,共用一套 LiteLLM 网关。

9.1 安装 OpenClaw

官方推荐三种部署方式:一键脚本、Docker、源码安装。这里以一键脚本为例(macOS / Linux / WSL):

curl -fsSL https://openclaw.ai/install.sh | bash

Windows 用户建议用 WSL 或 Docker,具体请看官方仓库:
https://github.com/datawhalechina/hello-claw

验证安装:

openclaw --version

9.2 方式一:命令行配置(推荐)

OpenClaw 所有配置都能通过 openclaw config set 命令设置。接入 LiteLLM 只要两行:

# ① 设置自定义 Base URL(指向 LiteLLM)
openclaw config set models.openai.base_url "http://127.0.0.1:4000/v1"

# ② 设置 API Key(等于 LiteLLM 的 master_key)
openclaw config set models.openai.api_key "cursor-unified-key"

# ③ 重启网关让配置生效
openclaw gateway restart

如果走 ngrok 公网,把第 ① 步的地址改成 https://你的ngrok地址/v1 即可。

9.3 方式二:手动编辑配置文件(推荐进阶)

OpenClaw 核心配置在 ~/.openclaw/openclaw.json,可以直接添加一个指向 LiteLLM 的自定义 provider:

{
  "models": {
    "providers": {
      "litellm": {
        "baseUrl": "http://127.0.0.1:4000/v1",
        "apiKey": "cursor-unified-key",
        "api": "openai-compatible",
        "models": [
          { "id": "minimax-m2.7",            "name": "MiniMax M2.7" },
          { "id": "minimax-m2.7-highspeed",  "name": "MiniMax M2.7 高速版" },
          { "id": "glm-5.1",                 "name": "智谱 GLM-5.1" },
          { "id": "glm-5.1-fast",            "name": "智谱 GLM-5.1 快速版" },
          { "id": "glm-5v-turbo",            "name": "智谱 GLM-5V Turbo" },
          { "id": "xiaomi-mimo-v2-pro",      "name": "小米 MiMo Pro" },
          { "id": "xiaomi-mimo-v2-omni",     "name": "小米 MiMo Omni" },
          { "id": "qwen3.6-plus",            "name": "阿里 Qwen-Plus 思考版" },
          { "id": "qwen3.6-plus-fast",       "name": "阿里 Qwen-Plus 快速版" },
          { "id": "qwen3.5-omni",            "name": "阿里 Qwen Omni" }
        ]
      }
    }
  }
}

改完后重启网关:

openclaw gateway restart

9.4 验证配置

OpenClaw 自带三件套检测工具:

命令 作用
openclaw models probe 探测所有配置的模型是否可用
openclaw models status 查看模型当前状态
openclaw doctor 一键诊断 + 自动修复常见问题

全部 ✓ 就说明小龙虾已经成功连上 LiteLLM 了。

9.5 切换与使用模型

# 列出所有模型
openclaw models list

# 切换默认模型
openclaw config set models.default "minimax-m2.7-highspeed"

# 启动对话
openclaw

在对话中也可以临时切换:

/model qwen3.6-plus

9.6 Cursor + Hermes + OpenClaw 三端共存

这三个客户端完全可以共存,本质上都是 LiteLLM 的下游调用方:

┌─────────┐  ┌──────────────┐  ┌──────────┐
│ Cursor  │  │ Hermes Agent │  │ OpenClaw │
└────┬────┘  └──────┬───────┘  └────┬─────┘
     │              │                │
     └──────────────┼────────────────┘
                    ▼
         ┌────────────────────┐
         │   LiteLLM Proxy    │
         │  127.0.0.1:4000    │
         └──────────┬─────────┘
                    ▼
      MiniMax / GLM / Qwen / MiMo ...

配置原则

  • • LiteLLM 只需启动一次
  • • master_key 只需设置一次
  • • 模型增删改只需改 litellm_config.yaml
  • • 三端只负责"连哪个地址、用哪个 Key、选哪个模型"

9.7 OpenClaw 常见报错

报错 原因 解决
gateway not running 网关未启动 openclaw gateway start
model probe failed 上游或 LiteLLM 连不通 openclaw doctor 自动排查;或先手动 curl LiteLLM 的 /v1/models
401 Unauthorized apiKey 与 master_key 不一致 保持两边完全一致
配置改了但不生效 没重启网关 openclaw gateway restart
Windows 下装不上 原生 Windows 不被官方支持 用 WSL2 或 Docker

📋 十、可用模型一览

模型 特点 适用场景
minimax-m2.7 自进化、编程强 复杂代码任务
minimax-m2.7-highspeed 同能力、更快 需要快速响应
glm-5.1 编程、思考模式 复杂编程任务
glm-5.1-fast 快速响应 日常对话
glm-5v-turbo 多模态编程 视觉+代码
xiaomi-mimo-v2-pro 推理模式、超长上下文 Agent任务
xiaomi-mimo-v2-omni 全模态 多模态任务
qwen3.6-plus 深度思考、中文优化 创意写作
qwen3.6-plus-fast 快速响应 日常对话
qwen3.5-omni 全模态 多模态任务

❓ 十一、常见问题

Q1: 启动报错"No module named litellm"

确保已安装:

pip install litellm "litellm[proxy]"

Q2: 端口被占用

4000端口被其他程序占用,可以换一个端口:

python -m litellm --config litellm_config.yaml --port 4001 --host 0.0.0.0

同时需要修改Cursor的API Endpoint为 http://127.0.0.1:4001/v1

Q3: 模型加载失败

检查 .env 文件中的API地址和密钥是否正确。

Q4: 为什么用 openai/ 前缀?

这是本文的核心技巧!可以绕过LiteLLM对provider的检测,兼容所有OpenAI格式的API。

Q5: 支持多少模型?

理论上无限,只要API是OpenAI兼容格式都可以。

Q6: 为什么我加的模型后面没有"脑子图标"和性能等级?

在 Cursor 的模型选择器里,你会看到官方模型(Opus、Sonnet、GPT-5.4、Codex 等)右边有 🧠 图标和 High / Medium 等性能等级标签,而你通过自定义 API 加进去的模型(minimax-m2.7xiaomi-mimo-v2-pro 等)后面什么都没有

这是 Cursor 的设计限制,不是 Bug,也不是你的配置问题。

原因:

标记 含义 为什么自定义模型没有
🧠 图标 Cursor 认证该模型支持 reasoning/thinking 模式 Cursor 只对内置模型维护这个白名单
High / Medium Cursor 根据内部 benchmark 给出的能力评级 这个评级是 Cursor 自己打的分,自定义模型 Cursor "不认识"
☁️ / $ 图标 是否经过 Cursor 服务器中转、计费档位等 自定义模型走你自己的 endpoint,Cursor 不参与计费

对功能有影响吗?

  • • ❌ 不影响使用 ——对话、代码补全、Agent 模式都能正常工作
  • • ❌ 不影响思考/推理 ——只要上游模型自己支持 thinking(比如在 extra_body 里开启了 enable_thinking),推理内容依然会返回
  • • ⚠️ 有个小差别:Cursor 的"自动模型切换"、"MAX Mode"等高级功能只对官方模型生效,自定义模型不会出现在这些选项里

能让它显示吗?

不能。这些标签是 Cursor 客户端硬编码的,只针对官方支持的模型列表。除非 Cursor 官方把你用的模型加进内置支持,否则永远只会以"裸模型名"形式展示。

所以——能用就行,心态放平 😄

🎯 十二、进阶玩法

12.1 添加更多模型

编辑 litellm_config.yaml,在 model_list 中添加更多模型:

  - model_name: my-custom-model
    litellm_params:
      model: openai/my-model-name
      api_key: "${MY_API_KEY}"
      api_base: "https://my-api.com/v1"

12.2 设置默认模型

可以设置一个默认模型,Cursor会自动使用:

general_settings:
  master_key: "cursor-unified-key"
  default_model: "minimax-m2.7"

12.3 查看用量

访问 http://127.0.0.1:4000/ui 可以查看API调用日志和用量统计。

💡 结语

通过LiteLLM Proxy + openai/ 自定义provider模式,我们实现了:

  1. 1. ✅ 一个API Key走天下 - 统一接口
  2. 2. ✅ 绕过厂商限制 - 兼容所有OpenAI格式API
  3. 3. ✅ Cursor原生支持 - 开箱即用
  4. 4. ✅ 免费开源 - 无供应商锁定

完整项目文件结构:

LiteLLM-Proxy/
├── .env                    # 环境变量(API密钥)
├── litellm_config.yaml    # 模型配置文件
├── START.bat              # 一键启动脚本
└── README.md              # 说明文档

转自:https://mp.weixin.qq.com/s/LmzTvoJIGTljij6ORyRXxA