- 集中身份验证 - API 密钥管理的单一入口
- 使用情况跟踪 - 监控团队和项目的使用情况
- 成本控制 - 实施预算和速率限制
- 审计日志 - 跟踪所有模型交互以实现合规性
- 模型路由 - 无需更改代码即可在提供商之间切换
网关要求
为了使 LLM gateway 与 Claude Code 配合使用,它必须满足以下要求: API 格式 网关必须向客户端公开以下至少一种 API 格式:-
Anthropic Messages:
/v1/messages,/v1/messages/count_tokens- 必须转发请求头:
anthropic-beta、anthropic-version
- 必须转发请求头:
-
Bedrock InvokeModel:
/invoke,/invoke-with-response-stream- 必须保留请求体字段:
anthropic_beta、anthropic_version
- 必须保留请求体字段:
-
Vertex rawPredict:
:rawPredict、:streamRawPredict、/count-tokens:rawPredict- 必须转发请求头:
anthropic-beta、anthropic-version
- 必须转发请求头:
Claude Code 根据 API 格式确定要启用的功能。当使用 Bedrock 或 Vertex 的 Anthropic Messages 格式时,您可能需要设置环境变量
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1。配置
模型选择
默认情况下,Claude Code 将为选定的 API 格式使用标准模型名称。 如果您在网关中配置了自定义模型名称,请使用 模型配置 中记录的环境变量来匹配您的自定义名称。LiteLLM 配置
LiteLLM 是第三方代理服务。Anthropic 不认可、维护或审计 LiteLLM 的安全性或功能。本指南仅供参考,可能会过时。请自行判断使用。
前置条件
- Claude Code 更新到最新版本
- LiteLLM Proxy Server 已部署且可访问
- 通过您选择的提供商访问 Claude 模型
基本 LiteLLM 设置
配置 Claude Code:身份验证方法
静态 API 密钥
使用固定 API 密钥的最简单方法:Authorization 请求头发送。
使用辅助程序的动态 API 密钥
用于轮换密钥或按用户身份验证:- 创建 API 密钥辅助程序脚本:
- 配置 Claude Code 设置以使用辅助程序:
- 设置令牌刷新间隔:
Authorization 和 X-Api-Key 请求头发送。apiKeyHelper 的优先级低于 ANTHROPIC_AUTH_TOKEN 或 ANTHROPIC_API_KEY。
统一端点(推荐)
使用 LiteLLM 的 Anthropic 格式端点:- 负载均衡
- 故障转移
- 对成本跟踪和最终用户跟踪的一致支持