本地搭建Ai中枢:一套 API Key 聚合多家大模型厂商,适用于 Cursor、Hermes Agent、OpenClaw
- 免费干货
- 1小时前
- 6热度
- 0评论
用 LiteLLM Proxy 把 MiniMax、智谱 GLM、阿里 Qwen、小米 MiMo 统一成一个入口,Cursor / Hermes Agent / OpenClaw 等任意 OpenAI 兼容客户端即插即用
📌 写在前面
"我有好几个厂家的coding plan,但是来回切换要重新输入API Key,Url地址,很麻烦。"
"模型供应商限流,宕机,我需要负载均衡,任意切换其他厂家模型"
"有没有一种方法,只需要配置一次,就能同时用上MiniMax、智谱GLM、阿里Qwen、小米MiMo这些国产大模型?"
答案是:有! 今天教大家用 LiteLLM Proxy 实现一个API Key调用所有国产大模型,而且Cursor直接支持!
本文重点:使用 openai/ 自定义 provider 模式,绕过检测,兼容所有OpenAI格式的API!


🔥 什么是LiteLLM Proxy?
简单来说,LiteLLM Proxy就像一个AI模型的"路由器":
- • 你只需要连接一个地址(127.0.0.1:4000)
- • 使用一个API Key
- • 就能调用4个国产大模型
核心优势:
| 优势 | 说明 |
|---|---|
| ✅ 统一接口 | OpenAI兼容格式,Cursor原生支持 |
| ✅ 绕过限制 | 使用 openai/ 前缀,自定义api_base,兼容所有OpenAI格式API |
| ✅ 环境变量 | API Key集中管理,安全方便 |
| ✅ 免费开源 | 完全免费,无供应商锁定 |
💡 为什么用 openai/ 前缀?
这是本文的核心技巧!
# 普通方式(可能失败)
model: minimax/MiniMax-M2.7
api_base: https://api.minimaxi.com/v1
# ✅ 自定义方式(绕过检测)
model: openai/MiniMax-M2.7
api_base: https://api.minimaxi.com/v1
只要API是OpenAI兼容格式,就能用这个方式接入,不管厂商是否官方支持LiteLLM!
📦 一、准备工作
1.1 安装Python 3.11
LiteLLM需要Python 3.10+,建议使用Python 3.11。
下载地址:
https://www.python.org/downloads/
安装时记得勾选 "Add Python to PATH"
验证安装:
python --version
# 应该显示 Python 3.11.x
1.2 安装LiteLLM
打开PowerShell,运行:
pip install litellm "litellm[proxy]"
📁 二、创建项目文件夹
在合适的位置创建一个文件夹,比如:
D:\AI\LiteLLM-Proxy
⚙️ 三、配置API信息
3.1 创建环境变量文件
在项目文件夹里新建一个文件,命名为 .env(注意前面有个点):
# ===========================================
# MiniMax 配置
# ===========================================
MINIMAX_BASE_URL=https://api.minimaxi.com/v1
MINIMAX_API_KEY=你的MiniMax密钥
# ===========================================
# 智谱 GLM 配置
# ===========================================
GLM_BASE_URL=https://open.bigmodel.cn/api/paas/v4
GLM_API_KEY=你的智谱密钥
# ===========================================
# 小米 MiMo 配置
# ===========================================
XIAOMI_BASE_URL=https://token-plan-cn.xiaomimimo.com/v1
XIAOMI_API_KEY=你的小米密钥
# ===========================================
# 阿里 Qwen 配置
# ===========================================
QWEN_BASE_URL=https://coding.dashscope.aliyuncs.com/v1
QWEN_API_KEY=你的阿里密钥
3.2 获取API密钥
| 平台 | 密钥格式 | 获取地址 |
|---|---|---|
| MiniMax | sk-cp-xxx |
platform.minimaxi.com |
| 智谱GLM | xxx |
open.bigmodel.cn |
| 小米MiMo | tp-xxx |
platform.xiaomimimo.com |
| 阿里Qwen | sk-sp-xxx |
coding.aliyun.com |
🔧 四、创建配置文件(重点!)
这是最关键的一步!
在项目文件夹里新建 litellm_config.yaml:
# LiteLLM Proxy 配置文件
# 使用 openai/ 前缀 + 自定义 api_base
# 兼容所有 OpenAI 格式的 API
model_list:
# ===========================================
# MiniMax M2.7
# 使用 openai/ 前缀绕过 provider 检测
# ===========================================
- model_name: minimax-m2.7
litellm_params:
model: openai/MiniMax-M2.7
api_key: "${MINIMAX_API_KEY}"
api_base: "${MINIMAX_BASE_URL}"
max_tokens: 8192
temperature: 0.2
timeout: 180
- model_name: minimax-m2.7-highspeed
litellm_params:
model: openai/MiniMax-M2.7-highspeed
api_key: "${MINIMAX_API_KEY}"
api_base: "${MINIMAX_BASE_URL}"
max_tokens: 8192
temperature: 0.2
timeout: 180
# ===========================================
# 智谱 GLM-5.1
# ===========================================
- model_name: glm-5.1
litellm_params:
model: openai/glm-5.1
api_key: "${GLM_API_KEY}"
api_base: "${GLM_BASE_URL}"
max_tokens: 65536
temperature: 1.0
timeout: 300
extra_body:
thinking:
type: "enabled"
- model_name: glm-5.1-fast
litellm_params:
model: openai/glm-5.1
api_key: "${GLM_API_KEY}"
api_base: "${GLM_BASE_URL}"
max_tokens: 8192
temperature: 1.0
timeout: 120
- model_name: glm-5v-turbo
litellm_params:
model: openai/glm-5v-turbo
api_key: "${GLM_API_KEY}"
api_base: "${GLM_BASE_URL}"
max_tokens: 16384
temperature: 1.0
timeout: 180
extra_body:
thinking:
type: "enabled"
# ===========================================
# 小米 MiMo
# ===========================================
- model_name: xiaomi-mimo-v2-pro
litellm_params:
model: openai/mimo-v2-pro
api_key: "${XIAOMI_API_KEY}"
api_base: "${XIAOMI_BASE_URL}"
max_tokens: 32768
temperature: 0.3
timeout: 300
- model_name: xiaomi-mimo-v2-omni
litellm_params:
model: openai/mimo-v2-omni
api_key: "${XIAOMI_API_KEY}"
api_base: "${XIAOMI_BASE_URL}"
max_tokens: 16384
temperature: 0.7
timeout: 180
# ===========================================
# 阿里 Qwen
# ===========================================
- model_name: qwen3.6-plus
litellm_params:
model: openai/qwen3.6-plus
api_key: "${QWEN_API_KEY}"
api_base: "${QWEN_BASE_URL}"
max_tokens: 32768
temperature: 0.6
timeout: 300
- model_name: qwen3.6-plus-fast
litellm_params:
model: openai/qwen3.6-plus
api_key: "${QWEN_API_KEY}"
api_base: "${QWEN_BASE_URL}"
max_tokens: 8192
temperature: 0.6
timeout: 120
- model_name: qwen3.5-omni
litellm_params:
model: openai/qwen3.5-vl-plus
api_key: "${QWEN_API_KEY}"
api_base: "${QWEN_BASE_URL}"
max_tokens: 16384
temperature: 0.7
timeout: 180
litellm_settings:
drop_params: true
set_verbose: false
request_timeout: 300
general_settings:
master_key: "cursor-unified-key"
port: 4000
host: 0.0.0.0
database_url: null
store_model_in_db: false
store_key_in_db: false
🔑 核心配置说明
# 关键配置解释
model: openai/glm-5.1 # ✅ 使用 openai/ 前缀
api_key: "${GLM_API_KEY}" # 从环境变量读取
api_base: "${GLM_BASE_URL}" # 填入实际的API地址
为什么要用 openai/ 前缀?
- 1. 绕过LiteLLM对provider的检测
- 2. 兼容所有OpenAI格式的API
- 3. 不需要厂商官方支持LiteLLM
- 4. 只要API兼容OpenAI格式就能用
🚀 五、启动服务
5.1 一键启动
双击项目文件夹中的 START.bat 即可启动!
或者手动在PowerShell中运行:
cd D:\AI\LiteLLM-Proxy
# 设置UTF-8编码(解决中文乱码)
$env:PYTHONIOENCODING="utf-8"
$env:PYTHONUTF8="1"
# 启动服务
python -m litellm --config litellm_config.yaml --port 4000 --host 0.0.0.0
看到下面这行就表示成功了:
INFO: Uvicorn running on http://0.0.0.0:4000
5.2 验证服务
打开浏览器访问:
http://127.0.0.1:4000
应该能看到LiteLLM的管理界面。
🌐 六、用 ngrok 把本地服务暴露到公网(可选)
💡 如果你的 LiteLLM 跑在本地,而 Cursor 限制了局域网上使用,或者你单纯想分享给小伙伴用,就需要一个内网穿透工具。这里推荐用 ngrok,免费、开箱即用。。
6.1 注册 ngrok 账号并获取 Token
- 1. 打开 https://ngrok.com/ 注册一个免费账号
- 2. 登录后进入 Your Authtoken 页面,复制你的 authtoken
6.2 下载并安装 ngrok
方式一:Winget 一键安装(推荐)
winget install ngrok.ngrok
方式二:手动下载
官方地址:https://ngrok.com/download
下载后解压,把 ngrok.exe 放到一个固定目录,并加入系统 PATH。
6.3 绑定 authtoken
ngrok config add-authtoken 你的authtoken
6.4 启动隧道
先确保 LiteLLM 已经在 4000 端口跑起来,然后新开一个 PowerShell 窗口:
ngrok http 4000
看到类似这样的输出就成功了:
Forwarding https://properly-landless-aorta.ngrok-free.dev -> http://localhost:4000
把 https://properly-landless-aorta.ngrok-free.dev 这段地址记下来,这就是你 Cursor 里要填的公网地址。
6.5 (可选)申请固定域名
ngrok 免费版每次重启地址都会变。免费账号可以在控制台 Cloud Edge → Domains 里申请一个免费的固定静态域名(永久不变),启动时加 --url 参数:
ngrok http --url=你的固定域名.ngrok-free.app 4000
这样就不用每次改 Cursor 配置了。
6.6 验证公网访问
在 PowerShell 里测试(注意 ngrok 免费域名需要加一个特殊头绕过浏览器警告页):
$headers = @{
"Authorization" = "Bearer cursor-unified-key"
"ngrok-skip-browser-warning" = "true"
}
Invoke-RestMethod -Uri "https://你的ngrok地址/v1/models" -Headers $headers
能看到模型列表返回就说明公网通了。Cursor 端不用加这个头,它的 User-Agent 不会被 ngrok 拦截。
💻 七、Cursor 配置(关键!)
⚠️ 重要:这一节有一个很多人踩的坑——"OpenAI API Key 开关"必须打开,否则所有配置都不生效,会报 Model name is not valid。

7.1 打开 Cursor 设置
- 1. 快捷键
Ctrl + ,打开设置,或左下角齿轮图标 - 2. 左侧选择 Cursor Settings → Models(或直接搜索 "Models")
7.2 添加自定义模型
向下滚动到 Models 区域,点击 + Add Model,把下面这些模型名逐个加进去(模型名要和 litellm_config.yaml 里的 model_name一字不差):
minimax-m2.7
minimax-m2.7-highspeed
glm-5.1
glm-5.1-fast
glm-5v-turbo
xiaomi-mimo-v2-pro
xiaomi-mimo-v2-omni
qwen3.6-plus
qwen3.6-plus-fast
qwen3.5-omni
💡 只想用几个模型?只添加你需要的即可。
7.3 配置 OpenAI API Key
继续向下找到 OpenAI API Key 区域,这里有三个关键操作缺一不可:
① 填写 API Key
cursor-unified-key
这个 key 就是
litellm_config.yaml里general_settings.master_key的值,自己改成别的也行,两边保持一致就好。
② 勾选 Override OpenAI Base URL,填入地址
| 使用场景 | 填写地址 |
|---|---|
| 通过 ngrok 公网访问 | https://你的ngrok地址/ |
⚠️ 地址结尾的不需要
/v1LiteLLM Proxy已经映射!
③ 打开 "OpenAI API Key" 右侧的开关!(最容易漏的一步)
OpenAI API Key [ ●] ← 开关必须打开(绿色)
这个开关如果不打开,前面所有配置都白搭,Cursor 依然会走官方 API,所以你在选模型时就会报 Model name is not valid: "xxx"。
7.4 验证配置
点击 Verify 按钮(在 API Key 输入框旁边)。看到 ✓ 绿色对勾就说明连接成功。
如果报错:
| 报错 | 原因 | 解决 |
|---|---|---|
Model name is not valid |
开关没打开 / 模型名没加 | 检查 7.3 步③,以及 7.2 步模型名是否完全一致 |
Failed to connect |
Base URL 错误 / 服务没启动 | 检查 LiteLLM 是否运行,地址是否带 /v1 |
Unauthorized |
API Key 错误 | 检查 master_key 和 Cursor 里的 Key 是否一致 |
ERR_NGROK_XXXX |
ngrok 问题 | 重启 ngrok,或考虑换 Cloudflare Tunnel |
7.5 选择模型使用
回到对话界面,点击底部模型选择器,就能看到你添加的所有模型:
- •
minimax-m2.7— MiniMax M2.7 - •
minimax-m2.7-highspeed— MiniMax M2.7 高速版 - •
glm-5.1— 智谱 GLM-5.1 - •
glm-5.1-fast— 智谱 GLM-5.1 快速版 - •
glm-5v-turbo— 智谱 GLM-5V-Turbo 多模态 - •
xiaomi-mimo-v2-pro— 小米 MiMo 推理版 - •
xiaomi-mimo-v2-omni— 小米 MiMo 全模态 - •
qwen3.6-plus— 阿里 Qwen 深度思考版 - •
qwen3.6-plus-fast— 阿里 Qwen 快速版 - •
qwen3.5-omni— 阿里 Qwen 全模态
选一个开始对话即可!


🤖 八、Hermes Agent 接入
除了 Cursor,你还可以把同一个 LiteLLM 网关接入 Hermes Agent(Nous Research 开源的自进化 AI 智能体),让 Hermes 直接用上你配置的所有国产大模型。
💡 Hermes Agent 是一个终端里跑的 Agent 框架,带记忆、技能沉淀、多轮规划等能力。它原生兼容 OpenAI API 格式,所以接入 LiteLLM 只需要填三样:Base URL + API Key + 模型名。
8.1 安装 Hermes Agent
官方推荐一键脚本安装(macOS / Linux / WSL):
curl -fsSL https://hermes.nousresearch.com/install.sh | bash
Windows 原生 PowerShell 建议用 WSL 或 Docker 方式运行,具体见官方文档:
https://hermes-agent.nousresearch.com/docs
验证安装:
hermes --version
8.2 方式一:交互式配置(推荐新手)
在终端运行:
hermes model
进入交互菜单后按下面选择:
- 1. 选择 Custom endpoint(自定义端点)
- 2. API Base URL 填:
- • 本机:
http://127.0.0.1:4000/v1 - • ngrok 公网:
https://你的ngrok地址/v1
- • 本机:
- 3. API Key 填:
cursor-unified-key(就是litellm_config.yaml里的master_key) - 4. Model Name 填你要用的模型名,例如
minimax-m2.7或qwen3.6-plus
配置完成后运行一下体检命令,确认连通:
hermes doctor
看到 ✓ 就说明配好了。
8.3 方式二:手动修改配置文件(推荐进阶)
Hermes 的配置文件在 ~/.hermes/config.yaml,直接编辑:
model:
provider: "custom"
base_url: "http://127.0.0.1:4000/v1" # 或 https://你的ngrok地址/v1
api_key_env: "LITELLM_API_KEY" # 从环境变量读取密钥,更安全
default: "minimax-m2.7" # 默认使用的模型
# 可选:预定义多个模型,方便随时切换
models:
- name: "minimax-m2.7"
- name: "minimax-m2.7-highspeed"
- name: "glm-5.1"
- name: "qwen3.6-plus"
- name: "xiaomi-mimo-v2-pro"
然后在 ~/.hermes/.env 里设置密钥:
LITELLM_API_KEY=cursor-unified-key
⚠️ 官方近期移除了
.env中的OPENAI_BASE_URL和LLM_MODEL变量,config.yaml才是唯一配置来源,别被旧教程误导。
8.4 启动并使用
hermes
进入对话界面后:
| 操作 | 命令 |
|---|---|
| 查看当前模型 | /model |
| 切换模型 | /model minimax-m2.7-highspeed |
| 查看可用模型列表 | /models |
| 查看诊断信息 | /doctor |
| 退出 | /exit |
8.5 Cursor 与 Hermes 共用一套配置
因为两者都指向同一个 LiteLLM 网关,所以:
- • LiteLLM 只需启动一次
- • API Key 统一(
master_key) - • 模型名统一(
litellm_config.yaml里的model_name) - • 新增/修改模型后,Cursor 和 Hermes 双端同时生效,只需重启 LiteLLM
这就是用 LiteLLM 做统一网关的最大好处——一次配置,所有客户端受益。
8.6 Hermes Agent 常见报错
| 报错 | 原因 | 解决 |
|---|---|---|
Connection refused |
LiteLLM 未启动或端口不对 | 先确认 http://127.0.0.1:4000/v1/models 能正常返回 |
401 Unauthorized |
API Key 填错 | 检查与 master_key 是否一致 |
model not found |
模型名在 LiteLLM 里不存在 | 对照 litellm_config.yaml 的 model_name 核对 |
/v1/chat/completions 404 |
Base URL 少了 /v1 |
URL 必须以 /v1 结尾 |
🦞 九、OpenClaw(小龙虾)接入
OpenClaw(圈内昵称"小龙虾")是 datawhalechina 社区推广的开源 AI Agent 框架,强调本地优先、自主执行任务、可插拔模型。它同样支持任何 OpenAI 兼容端点,所以把它和 LiteLLM 对接,就能让小龙虾直接调用你配好的所有国产大模型。
💡 OpenClaw 和 Hermes Agent 是同类型工具,区别在于 OpenClaw 更强调「本地网关 + Skills/MCP 可扩展」的架构。两者可以同时装,共用一套 LiteLLM 网关。
9.1 安装 OpenClaw
官方推荐三种部署方式:一键脚本、Docker、源码安装。这里以一键脚本为例(macOS / Linux / WSL):
curl -fsSL https://openclaw.ai/install.sh | bash
Windows 用户建议用 WSL 或 Docker,具体请看官方仓库:
https://github.com/datawhalechina/hello-claw
验证安装:
openclaw --version
9.2 方式一:命令行配置(推荐)
OpenClaw 所有配置都能通过 openclaw config set 命令设置。接入 LiteLLM 只要两行:
# ① 设置自定义 Base URL(指向 LiteLLM)
openclaw config set models.openai.base_url "http://127.0.0.1:4000/v1"
# ② 设置 API Key(等于 LiteLLM 的 master_key)
openclaw config set models.openai.api_key "cursor-unified-key"
# ③ 重启网关让配置生效
openclaw gateway restart
如果走 ngrok 公网,把第 ① 步的地址改成
https://你的ngrok地址/v1即可。
9.3 方式二:手动编辑配置文件(推荐进阶)
OpenClaw 核心配置在 ~/.openclaw/openclaw.json,可以直接添加一个指向 LiteLLM 的自定义 provider:
{
"models": {
"providers": {
"litellm": {
"baseUrl": "http://127.0.0.1:4000/v1",
"apiKey": "cursor-unified-key",
"api": "openai-compatible",
"models": [
{ "id": "minimax-m2.7", "name": "MiniMax M2.7" },
{ "id": "minimax-m2.7-highspeed", "name": "MiniMax M2.7 高速版" },
{ "id": "glm-5.1", "name": "智谱 GLM-5.1" },
{ "id": "glm-5.1-fast", "name": "智谱 GLM-5.1 快速版" },
{ "id": "glm-5v-turbo", "name": "智谱 GLM-5V Turbo" },
{ "id": "xiaomi-mimo-v2-pro", "name": "小米 MiMo Pro" },
{ "id": "xiaomi-mimo-v2-omni", "name": "小米 MiMo Omni" },
{ "id": "qwen3.6-plus", "name": "阿里 Qwen-Plus 思考版" },
{ "id": "qwen3.6-plus-fast", "name": "阿里 Qwen-Plus 快速版" },
{ "id": "qwen3.5-omni", "name": "阿里 Qwen Omni" }
]
}
}
}
}
改完后重启网关:
openclaw gateway restart
9.4 验证配置
OpenClaw 自带三件套检测工具:
| 命令 | 作用 |
|---|---|
openclaw models probe |
探测所有配置的模型是否可用 |
openclaw models status |
查看模型当前状态 |
openclaw doctor |
一键诊断 + 自动修复常见问题 |
全部 ✓ 就说明小龙虾已经成功连上 LiteLLM 了。
9.5 切换与使用模型
# 列出所有模型
openclaw models list
# 切换默认模型
openclaw config set models.default "minimax-m2.7-highspeed"
# 启动对话
openclaw
在对话中也可以临时切换:
/model qwen3.6-plus
9.6 Cursor + Hermes + OpenClaw 三端共存
这三个客户端完全可以共存,本质上都是 LiteLLM 的下游调用方:
┌─────────┐ ┌──────────────┐ ┌──────────┐
│ Cursor │ │ Hermes Agent │ │ OpenClaw │
└────┬────┘ └──────┬───────┘ └────┬─────┘
│ │ │
└──────────────┼────────────────┘
▼
┌────────────────────┐
│ LiteLLM Proxy │
│ 127.0.0.1:4000 │
└──────────┬─────────┘
▼
MiniMax / GLM / Qwen / MiMo ...
配置原则:
- • LiteLLM 只需启动一次
- • master_key 只需设置一次
- • 模型增删改只需改
litellm_config.yaml - • 三端只负责"连哪个地址、用哪个 Key、选哪个模型"
9.7 OpenClaw 常见报错
| 报错 | 原因 | 解决 |
|---|---|---|
gateway not running |
网关未启动 | openclaw gateway start |
model probe failed |
上游或 LiteLLM 连不通 | openclaw doctor 自动排查;或先手动 curl LiteLLM 的 /v1/models |
401 Unauthorized |
apiKey 与 master_key 不一致 |
保持两边完全一致 |
| 配置改了但不生效 | 没重启网关 | openclaw gateway restart |
| Windows 下装不上 | 原生 Windows 不被官方支持 | 用 WSL2 或 Docker |
📋 十、可用模型一览
| 模型 | 特点 | 适用场景 |
|---|---|---|
minimax-m2.7 |
自进化、编程强 | 复杂代码任务 |
minimax-m2.7-highspeed |
同能力、更快 | 需要快速响应 |
glm-5.1 |
编程、思考模式 | 复杂编程任务 |
glm-5.1-fast |
快速响应 | 日常对话 |
glm-5v-turbo |
多模态编程 | 视觉+代码 |
xiaomi-mimo-v2-pro |
推理模式、超长上下文 | Agent任务 |
xiaomi-mimo-v2-omni |
全模态 | 多模态任务 |
qwen3.6-plus |
深度思考、中文优化 | 创意写作 |
qwen3.6-plus-fast |
快速响应 | 日常对话 |
qwen3.5-omni |
全模态 | 多模态任务 |
❓ 十一、常见问题
Q1: 启动报错"No module named litellm"
确保已安装:
pip install litellm "litellm[proxy]"
Q2: 端口被占用
4000端口被其他程序占用,可以换一个端口:
python -m litellm --config litellm_config.yaml --port 4001 --host 0.0.0.0
同时需要修改Cursor的API Endpoint为 http://127.0.0.1:4001/v1
Q3: 模型加载失败
检查 .env 文件中的API地址和密钥是否正确。
Q4: 为什么用 openai/ 前缀?
这是本文的核心技巧!可以绕过LiteLLM对provider的检测,兼容所有OpenAI格式的API。
Q5: 支持多少模型?
理论上无限,只要API是OpenAI兼容格式都可以。
Q6: 为什么我加的模型后面没有"脑子图标"和性能等级?
在 Cursor 的模型选择器里,你会看到官方模型(Opus、Sonnet、GPT-5.4、Codex 等)右边有 🧠 图标和 High / Medium 等性能等级标签,而你通过自定义 API 加进去的模型(minimax-m2.7、xiaomi-mimo-v2-pro 等)后面什么都没有。
这是 Cursor 的设计限制,不是 Bug,也不是你的配置问题。
原因:
| 标记 | 含义 | 为什么自定义模型没有 |
|---|---|---|
| 🧠 图标 | Cursor 认证该模型支持 reasoning/thinking 模式 | Cursor 只对内置模型维护这个白名单 |
High / Medium |
Cursor 根据内部 benchmark 给出的能力评级 | 这个评级是 Cursor 自己打的分,自定义模型 Cursor "不认识" |
| ☁️ / $ 图标 | 是否经过 Cursor 服务器中转、计费档位等 | 自定义模型走你自己的 endpoint,Cursor 不参与计费 |
对功能有影响吗?
- • ❌ 不影响使用 ——对话、代码补全、Agent 模式都能正常工作
- • ❌ 不影响思考/推理 ——只要上游模型自己支持 thinking(比如在
extra_body里开启了enable_thinking),推理内容依然会返回 - • ⚠️ 有个小差别:Cursor 的"自动模型切换"、"MAX Mode"等高级功能只对官方模型生效,自定义模型不会出现在这些选项里
能让它显示吗?
不能。这些标签是 Cursor 客户端硬编码的,只针对官方支持的模型列表。除非 Cursor 官方把你用的模型加进内置支持,否则永远只会以"裸模型名"形式展示。
所以——能用就行,心态放平 😄
🎯 十二、进阶玩法
12.1 添加更多模型
编辑 litellm_config.yaml,在 model_list 中添加更多模型:
- model_name: my-custom-model
litellm_params:
model: openai/my-model-name
api_key: "${MY_API_KEY}"
api_base: "https://my-api.com/v1"
12.2 设置默认模型
可以设置一个默认模型,Cursor会自动使用:
general_settings:
master_key: "cursor-unified-key"
default_model: "minimax-m2.7"
12.3 查看用量
访问 http://127.0.0.1:4000/ui 可以查看API调用日志和用量统计。
💡 结语
通过LiteLLM Proxy + openai/ 自定义provider模式,我们实现了:
- 1. ✅ 一个API Key走天下 - 统一接口
- 2. ✅ 绕过厂商限制 - 兼容所有OpenAI格式API
- 3. ✅ Cursor原生支持 - 开箱即用
- 4. ✅ 免费开源 - 无供应商锁定
完整项目文件结构:
LiteLLM-Proxy/
├── .env # 环境变量(API密钥)
├── litellm_config.yaml # 模型配置文件
├── START.bat # 一键启动脚本
└── README.md # 说明文档
转自:https://mp.weixin.qq.com/s/LmzTvoJIGTljij6ORyRXxA