第二章:接入国内大模型
2.1 为什么要选择国内大模型
使用国内大模型有很多优势,特别适合中国用户。本文将从多个维度详细分析为什么选择国内模型。
一、访问速度优势
国内模型服务器部署在中国境内,访问速度更快:
- 响应时间更短,通常在1-2秒内就能得到回复
- 网络延迟更低,使用体验更流畅
- 不受国际网络波动影响,稳定性更好
二、成本考虑
国内模型通常价格更实惠:
- API 调用费用更低,比海外模型普遍低30%-50%
- 提供免费额度或试用机会,适合个人学习和小型项目
- 适合频繁使用的场景,长期使用成本优势明显
- 支付方式更方便,支持支付宝、微信支付等国内常用支付方式
三、中文处理能力
国内模型对中文的理解和处理更加精准:
- 更好地理解中文语境和文化内涵
- 处理中文成语、俗语、歇后语等特殊表达更准确
- 生成中文内容更自然流畅,符合中文表达习惯
- 支持更多中文方言和表达方式,覆盖更广泛的用户群体
四、数据安全与合规
使用国内模型更符合国内法规要求:
- 数据存储在国内,符合《中华人民共和国数据安全法》
- 隐私保护更符合国内标准,严格遵守《个人信息保护法》
- 不受跨境数据传输限制,避免了数据跨境带来的安全风险
- 更容易满足企业内部的数据安全审计要求
五、本地化服务支持
国内模型提供更好的本地化服务:
- 客服支持中文沟通,响应速度更快
- 提供完善的中文技术文档和教程,便于理解和使用
- 定期举办线上线下技术交流活动,促进用户学习和分享
- 与国内主流开发工具、框架和平台深度集成
六、支持Claude Code的国内模型厂商
目前,已有多家国内AI厂商提供了支持Claude Code的服务:
智谱AI(GLM)
- 代表模型:GLM-4、GLM-3
- 优势:中文理解能力强,代码生成质量高
- 适用场景:代码开发、文档生成、智能问答
通义千问(Qwen)
- 代表模型:Qwen Plus、Qwen Max
- 优势:多模态能力强,支持图像和代码
- 适用场景:代码补全、代码解释、系统设计
DeepSeek
- 代表模型:DeepSeek-R1、DeepSeek-Coder
- 优势:专注于代码领域,代码生成准确率高
- 适用场景:代码生成、代码修复、代码优化
豆包
- 代表模型:豆包4.0、豆包Code
- 优势:用户界面友好,集成度高
- 适用场景:代码学习、辅助开发、代码评审
Kimi
- 代表模型:Kimi-Coder、Kimi-Max
- 优势:上下文窗口大,支持长文本处理
- 适用场景:大型项目开发、文档理解、代码重构
七、最佳实践
选择合适的模型
根据不同的使用场景选择合适的模型:
- 代码生成:优先选择DeepSeek-Coder、Kimi-Coder等专注于代码的模型
- 文档生成:推荐使用GLM-4、Qwen Plus等综合性模型
- 长文本处理:选择Kimi-Max等大上下文窗口模型
优化API使用
- 合理设置
maxTokens值,避免不必要的消耗 - 使用流式输出,提高响应速度
- 缓存常用请求的结果,减少重复调用
安全使用API密钥
- 不要将API密钥硬编码到代码中
- 定期更换API密钥
- 限制API密钥的使用范围和权限
- 使用环境变量或配置文件管理API密钥
八、总结
选择国内大模型具有诸多优势,包括更快的访问速度、更低的成本、更好的中文处理能力、更强的数据安全性以及更完善的本地化服务。
随着国内AI技术的不断发展,国内模型在性能和功能上已经逐渐赶上甚至超越海外模型,成为越来越多开发者的首选。建议开发者根据自己的需求和使用场景,选择适合的国内模型,充分利用AI技术提升开发效率和质量。
2.2 配置 GLM
GLM(智谱AI)是国内领先的大语言模型之一,由智谱AI开发,对中文理解能力出色,支持多种应用场景。
以下是配置 GLM 到 Claude Code 的详细步骤。
注册与获取 API
步骤 1:注册智谱AI账户
- 访问智谱AI开放平台:
- 点击页面左上方的"注册"按钮
- 输入手机号并进行验证,完成注册
- 完成实名认证(实名认证后可获得更多免费额度)
步骤 2:获取免费额度
- 注册后自动获得 100 万 tokens 免费额度
- 完成实名认证后额外获得 400 万 tokens(有效期一个月)
- 新用户总共可获得 500 万 tokens 的免费额度
提示
GLM 推出了编码套餐,可以https://www.bigmodel.cn/glm-coding?ic=5AH7ATEZSC,配合Claude Code,完成你的工作需求。
步骤 3:获取 API Key
- 登录智谱AI开放平台
- 点击右上角的"查看API Key"或进入"API管理"
- 点击"添加新的Key"或"创建新Key"
- 填写Key名称(可选),点击确认
- 系统会生成 API Key
- 重要:妥善保存 API Key,建议复制到安全的地方
配置 Claude Code
配置GLM到Claude Code有三种方式,选择适合你的一种即可。
方式一:使用自动化助手(推荐)
步骤 1:运行自动化助手
npx @z_ai/coding-helper
步骤 2:按照提示操作
自动化助手会引导你完成:
提示
- 工具安装
- 套餐配置
- MCP 服务器管理
方式二:使用自动化脚本(仅限 macOS 和 Linux)
如果是 macOS 或 Linux 系统,可以使用自动化脚本快速配置。
步骤 1:下载并运行脚本
在终端中执行以下命令:
curl -O "https://cdn.bigmodel.cn/install/claude_code_env.sh" && bash ./claude_code_env.sh
步骤 2:脚本自动配置
脚本会自动修改 ~/.claude/settings.json 文件,配置以下环境变量:
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your_zhipu_api_key",
"ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/anthropic",
"API_TIMEOUT_MS": "3000000",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1
}
}
注意:请将 your_zhipu_api_key 替换为你实际获取的 API Key。
方式三:手动配置
如果你需要手动配置,请根据你的操作系统选择以下方式之一。
macOS 和 Linux
- 创建或编辑配置文件
~/.claude/settings.json - 添加以下内容(替换
your_zhipu_api_key为你的 API Key):
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your_zhipu_api_key",
"ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/anthropic",
"API_TIMEOUT_MS": "3000000",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1
}
}
Windows(Cmd)
在 Cmd 中运行以下命令(替换 your_zhipu_api_key 为你的 API Key):
setx ANTHROPIC_AUTH_TOKEN your_zhipu_api_key
setx ANTHROPIC_BASE_URL https://open.bigmodel.cn/api/anthropic
setx CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC 1
Windows(PowerShell)
在 PowerShell 中运行以下命令(替换 your_zhipu_api_key 为你的 API Key):
[System.Environment]::SetEnvironmentVariable('ANTHROPIC_AUTH_TOKEN', 'your_zhipu_api_key', 'User')
[System.Environment]::SetEnvironmentVariable('ANTHROPIC_BASE_URL', 'https://open.bigmodel.cn/api/anthropic', 'User')
[System.Environment]::SetEnvironmentVariable('CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC', '1', 'User')
重要提示:配置完成后,请关闭所有终端窗口,打开一个新的终端窗口以使配置生效。
测试连接
步骤 1:启动 Claude Code
claude
步骤 2:信任文件夹
首次启动时,Claude Code 会询问是否信任当前文件夹,选择 Yes。
步骤 3:发送测试消息
在 Claude Code 的聊天界面中,输入一条简单的测试消息,例如:
你好,请用一句话介绍一下你自己。
步骤 4:验证结果
如果看到 GLM 的回复,说明配置成功!
- 回复应该流畅自然
- 响应时间应该在几秒内
- 没有错误提示
步骤 5:检查模型状态(可选)
在 Claude Code 中输入 /status 命令,可以查看当前使用的模型状态和配置信息。
GLM 模型
GLM Coding Plan 默认使用智谱 AI 的最新模型,通过环境变量映射到 Claude Code 的模型层级。
默认模型映射
配置成功后,GLM 模型会自动映射到 Claude Code 的模型层级:
- Claude Opus → GLM-4.7(最强大的模型)
- Claude Sonnet → GLM-4.7(平衡性能与速度)
- Claude Haiku → GLM-4.5-Air(快速响应模型)
提示:默认情况下,你在 Claude Code 界面上看到的是 Claude 模型名称,但实际使用的是 GLM 模型。这是服务端的模型映射,无需手动配置。
GLM-4.7
- 特点:智谱最新的旗舰模型,综合能力最强
- 适用场景:复杂任务、深度代码生成、需要高质量输出的场景
- 性能:在代码生成、逻辑推理、问题解决等方面表现优异
GLM-4.5-Air
- 特点:轻量级模型,响应速度快
- 适用场景:快速对话、简单任务、需要实时响应的场景
- 性能:响应速度快,适合大量使用
手动切换模型(高级用户)#
如果你需要手动切换模型,可以编辑 ~/.claude/settings.json 文件,添加以下配置:
{
"env": {
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.7"
}
}
注意:一般不建议手动调整模型映射,因为硬编码后当 GLM Coding Plan 的模型更新升级时,不方便自动更新到最新模型。
常见问题#
Q:API Key 泄露了怎么办?
A:立即在智谱AI开放平台删除旧密钥,创建新的密钥,并更新你的配置。
Q:配置后提示"认证失败"怎么办?
A:检查以下几点:
- API Key 是否正确,注意不要有多余的空格
- Base URL 是否填写为
https://open.bigmodel.cn/api/anthropic - 配置后是否重新打开了新的终端窗口
- 配置文件的 JSON 格式是否正确
Q:免费额度用完了怎么办?
[已移除:营销/导流内容]
Q:如何确认配置是否生效?
A:启动 Claude Code 后,输入 /status 命令查看模型状态和配置信息。
Q:配置后没有生效怎么办?
A:尝试以下排查步骤:
- 关闭所有 Claude Code 窗口
- 重新打开一个新的命令行窗口
- 再次运行
claude启动 - 如果问题仍然存在,可以删除
~/.claude/settings.json文件,然后重新配置 - 确认配置文件的 JSON 格式是否正确,可以使用在线 JSON 校验工具进行检查
Q:GLM 的中文能力如何?
A:GLM 是国内领先的大模型之一,中文理解能力非常出色,适合中文用户使用。
Q:可以在多个项目中使用同一个 API Key 吗?
A:可以,一个 API Key 可以在多个项目中使用,但建议为不同项目创建不同的 Key 以便于管理。
Q:推荐使用哪个版本的 Claude Code?
A:建议使用最新版本的 Claude Code。你可以通过以下命令检查当前版本和升级:
# 检查当前版本
claude --version
# 升级到最新版本
claude update
我们在 Claude Code 2.0.14 等版本验证通过,建议使用此版本或更新版本。
Q:如何切换使用不同的 GLM 模型?
A:默认情况下,GLM 模型会自动映射到 Claude Code 的模型层级。如果需要手动切换,可以编辑 ~/.claude/settings.json 文件,修改 ANTHROPIC_DEFAULT_HAIKU_MODEL、ANTHROPIC_DEFAULT_SONNET_MODEL、ANTHROPIC_DEFAULT_OPUS_MODEL 环境变量。但一般不建议手动调整,以便自动更新到最新模型。
Q:配置文件修改后不生效怎么办?
A:确保:
- JSON 格式正确,检查变量名称、逗号等
- 关闭所有 Claude Code 窗口,重新打开新的终端
- 如果问题持续,可以删除配置文件重新配置
2.3 配置通义千问
通义千问是阿里巴巴推出的中文大模型,在中文理解和生成方面表现优秀。阿里云百炼提供了 Anthropic API 兼容服务,可以方便地在 Claude Code 中接入通义千问系列模型。(https://help.aliyun.com/zh/model-studio/claude-code)
前提条件#
步骤 1:开通阿里云百炼服务#
- 登录阿里云百炼控制台:https://bailian.console.aliyun.com/
- 若页面顶部显示需要开通,请点击开通阿里云百炼的模型服务
- 首次开通后可领取新人免费额度(有效期:90天)
- 超出额度或期限将产生费用,建议开启"免费额度用完即停"功能
步骤 2:获取 API Key#
- 进入阿里云百炼控制台
- 在左侧菜单中找到"API-KEY管理"
- 点击"创建新的API-KEY"按钮
- 系统会生成一个 API Key
- 重要:妥善保存这个密钥,它只会显示一次
安装 Claude Code#
macOS 安装#
在终端中执行以下命令:
npm install -g @anthropic-ai/claude-code
Windows 安装#
在 Windows 上使用 Claude Code,需要先安装 WSL 或 Git for Windows,然后在 WSL 或 Git Bash 中执行:
npm install -g @anthropic-ai/claude-code
配置环境变量
要通过兼容 Anthropic API 的方式接入阿里云百炼的模型服务,需要配置以下两个环境变量:
ANTHROPIC_BASE_URL:设置为https://dashscope.aliyuncs.com/apps/anthropicANTHROPIC_API_KEY或ANTHROPIC_AUTH_TOKEN:设置为阿里云百炼 API Key
macOS 配置
在终端中执行以下命令,查看默认 Shell 类型:
echo $SHELL
Zsh 配置
# 用百炼 API Key 替换 YOUR_DASHSCOPE_API_KEY
echo 'export ANTHROPIC_BASE_URL="https://dashscope.aliyuncs.com/apps/anthropic"' >> ~/.zshrc
echo 'export ANTHROPIC_API_KEY="YOUR_DASHSCOPE_API_KEY"' >> ~/.zshrc
source ~/.zshrc
Bash 配置
# 用百炼 API Key 替换 YOUR_DASHSCOPE_API_KEY
echo 'export ANTHROPIC_BASE_URL="https://dashscope.aliyuncs.com/apps/anthropic"' >> ~/.bash_profile
echo 'export ANTHROPIC_API_KEY="YOUR_DASHSCOPE_API_KEY"' >> ~/.bash_profile
source ~/.bash_profile
Windows 配置
CMD 配置:
REM 用百炼 API Key 替换 YOUR_DASHSCOPE_API_KEY
setx ANTHROPIC_API_KEY "YOUR_DASHSCOPE_API_KEY"
setx ANTHROPIC_BASE_URL "https://dashscope.aliyuncs.com/apps/anthropic"
打开新的 CMD 窗口,运行以下命令检查:
echo %ANTHROPIC_API_KEY%
echo %ANTHROPIC_BASE_URL%
PowerShell 配置:
# 用百炼 API Key 替换 YOUR_DASHSCOPE_API_KEY
[Environment]::SetEnvironmentVariable("ANTHROPIC_API_KEY", "YOUR_DASHSCOPE_API_KEY", [EnvironmentVariableTarget]::User)
[Environment]::SetEnvironmentVariable("ANTHROPIC_BASE_URL", "https://dashscope.aliyuncs.com/apps/anthropic", [EnvironmentVariableTarget]::User)
打开新的 PowerShell 窗口,运行以下命令检查:
echo $env:ANTHROPIC_API_KEY
echo $env:ANTHROPIC_BASE_URL
支持的模型#
百炼提供的 Anthropic API 兼容服务支持以下通义千问系列模型:
通义千问 Max(仅 qwen3-max-preview 支持思考模式)#
- qwen3-max
- qwen3-max-2025-09-23
- qwen3-max-preview
通义千问 Plus#
- qwen-plus
- qwen-plus-latest
- qwen-plus-2025-09-11
通义千问 Flash#
- qwen-flash
- qwen-flash-2025-07-28
通义千问 Turbo#
- qwen-turbo
- qwen-turbo-latest
通义千问 Coder(不支持思考模式)#
- qwen3-coder-plus
- qwen3-coder-plus-2025-09-23
- qwen3-coder-flash
通义千问 VL(不支持思考模式)#
- qwen-vl-max
- qwen-vl-plus
测试连接#
步骤 1:启动 Claude Code#
在终端中执行:
claude-code
步骤 2:配置模型#
在 Claude Code 对话期间,执行 /mode 命令,然后选择或输入你想使用的通义千问模型名称,例如:
/mode qwen-plus
步骤 3:发送测试消息#
输入一条简单的测试消息:
你好,请用一句话介绍一下你自己。
步骤 4:验证结果#
如果看到通义千问的回复,说明配置成功!
- 回复应该流畅自然
- 响应时间应该在几秒内
- 没有错误提示
模型版本说明#
通义千问 Max 系列#
- 最强大的版本
- qwen3-max-preview 支持思考模式
- 适合复杂任务和专业场景
- 价格较高
通义千问 Plus 系列#
- 能力较强
- 理解深入
- 适合大多数复杂任务
- 价格适中
通义千问 Flash 系列#
- 响应速度快
- 成本较低
- 适合日常对话和简单任务
- 性价比高
通义千问 Turbo 系列#
- 响应最快
- 成本最低
- 适合快速对话和简单任务
- 适合新手使用
通义千问 Coder 系列#
- 专为编程任务优化
- 代码生成和理解能力强
- 不支持思考模式
- 适合开发场景
通义千问 VL 系列#
- 支持视觉理解
- 可以处理图像和文本
- 不支持思考模式
- 适合多模态任务
重要提示#
- 旧版接口已弃用:旧版兼容接口
https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy仅支持调用 qwen3-coder-plus 模型,建议迁移至新版接口。 - 免费额度限制:Claude Code 无法使用 Qwen Code 每日 2000 次免费额度,使用百炼的 API 兼容服务会按照百炼的计费规则计费。
- 地域限制:本文档仅适用于中国内地版(北京地域)。
- 思考模式:只有 qwen3-max-preview 支持思考模式,其他模型不支持。
常见问题#
Q:API Key 泄露了怎么办?
A:立即在阿里云百炼控制台删除旧密钥,创建新的密钥,并更新环境变量。
Q:为什么提示"鉴权失败"?
A:检查 API Key 是否正确,注意不要有多余的空格。同时确认 ANTHROPIC_BASE_URL 设置正确。
Q:如何选择合适的模型版本?
A:新手建议使用 qwen-turbo 或 qwen-flash,如果发现能力不足再升级到 qwen-plus 或 qwen3-max。编程任务推荐使用 qwen3-coder-plus。
Q:通义千问和文心一言哪个更好?
A:两个模型都很优秀,建议都配置好,根据具体任务选择使用。通义千问在编程和多模态方面有优势。
Q:如何查看模型参数及计费规则?
A:请访问阿里云百炼控制台的模型列表页面查看详细信息。
Q:环境变量配置后不生效怎么办?
A:确保已执行 source 命令使环境变量生效,并打开新的终端窗口进行测试。
2.4 使用 AICodeSwitch 工具
AICodeSwitch 是一个便捷的工具,可以让你快速配置Claude Code或Codex这类本地编程工具,并且可以在不同的大模型之间快速切换,无需每次都去设置中修改配置。
什么是 AICodeSwitch
AICodeSwitch 是一个模型路由工具,它的主要功能包括:
- 集中管理多个 AI 模型的配置
- 内置模型适配器,可以把GPT类的模型也作为Claude Code的驱动模型
- 一键切换不同的路由
- 根据任务类型,在路由规则中自动选择合适的模型
- 丰富的日志信息,显示各模型的使用统计信息
简单来说,它就像一个"模型切换器",让你在使用 Claude Code 时可以随时GLM、GPT、Qwen等模型之间切换。
安装与配置
步骤 1:安装 AICodeSwitch
AICodeSwitch 通常以 npm 包的形式提供。
- 打开终端(命令行)
- 输入以下命令安装:
npm install -g aicodeswitch
- 如果是MacOS或Linux用户,可能需要使用
sudo命令:sudo npm install -g aicodeswitch。 - 等待安装完成
步骤 2:配置模型信息
- 在终端中输入:
aicos ui
- 这会打开一个图形化界面,帮助你配置模型信息。
aicos命令是aicodeswitch命令的别名。 - 配置供应商和路由
- 激活路由
具体可以参考这个视频 https://www.bilibili.com/video/BV1a865B8ErA/
[图示或嵌入内容已省略]
你不需要自己手动对 Claude Code 或 Codex 进行配置修改,AICodeSwitch 会自动修改它们的配置文件,并接管它们的模型请求。
随时随地切换大模型#
你可以在 AICodeSwitch 的图形化界面中,随时切换不同的模型。
你只需要在路由列表中,点击“激活”对应的路由。
路由规则中,你可以根据实际情况,配置不同的大模型,激活路由后,就切换到了规则里面配置的大模型。
常见问题#
Q:AICodeSwitch 是免费的吗?
A:AICodeSwitch 工具本身是免费的,但使用各个模型仍需支付相应的 API 费用。
Q:可以同时配置多个国内模型吗?
A:可以,你可以配置GLM、通义千问等多个国内模型,随时切换使用。
Q:切换模型会影响对话历史吗?
A:不会,对话历史会保留,但不同模型可能对上下文的理解略有差异。
2.5 使用免费的大模型
在本章节中,我们将介绍如何将免费的大模型接入到Claude Code中,主要通过以下几种方式:使用免费大模型提供商的服务、本地搭建免费大模型,以及通过ClaudeCodeRouter实现接入。
一、寻找免费大模型提供商#
1.1 OpenRouter#
OpenRouter是一个聚合了多种大模型的平台,其中包含一些免费或提供免费额度的模型。
步骤 1:注册OpenRouter账户
- 访问OpenRouter官网:https://openrouter.ai/
- 点击右上角的"Sign Up"按钮
- 使用邮箱或GitHub账户完成注册
- 登录后进入控制台
步骤 2:获取免费模型
-
在控制台中点击"Models"标签
-
筛选"Free"模型,查看可用的免费模型
-
选择适合的模型,例如:
- Llama 3 8B Instruct
- Mistral 7B Instruct
- Gemma 7B Instruct
步骤 3:获取API密钥
- 在控制台中点击"API Keys"标签
- 点击"Create API Key"按钮
- 为密钥命名,选择访问权限
- 复制生成的API密钥,妥善保存
1.2 阿里云通义千问#
阿里云提供的通义千问模型也提供一定的免费额度。
步骤 1:注册阿里云账户
- 访问阿里云官网:https://www.aliyun.com/
- 点击右上角的"免费注册"按钮
- 使用手机号完成注册和实名认证
步骤 2:开通通义千问服务
- 搜索"通义千问",进入产品页面
- 点击"立即开通",按照提示完成开通
- 进入通义千问控制台
步骤 3:寻找免费模型
- 在官网文档中,寻找可免费使用的大模型列表
- 将它们保存起来
步骤 4:获取API密钥
- 在控制台中进入"API密钥管理"页面
- 点击"创建AccessKey"按钮
- 复制生成的AccessKey ID和AccessKey Secret,妥善保存
二、本地搭建Ollama运行免费大模型#
Ollama是一个可以在本地运行大模型的工具,支持多种开源免费模型。
2.1 安装Ollama#
macOS
- 访问Ollama官网:https://ollama.com/
- 点击"Download for macOS"按钮
- 打开下载的DMG文件,将Ollama拖拽到Applications文件夹
- 打开终端,运行
ollama --version验证安装成功
Windows
- 访问Ollama官网:https://ollama.com/
- 点击"Download for Windows"按钮
- 运行下载的安装程序,按照提示完成安装
- 打开命令提示符或PowerShell,运行
ollama --version验证安装成功
Linux
- 打开终端,运行以下命令:
curl -fsSL https://ollama.com/install.sh | sh
- 安装完成后,运行
ollama --version验证安装成功
2.2 下载并运行免费大模型#
- 打开终端,运行以下命令下载并运行Llama 3 8B模型:
ollama run llama3
- Ollama会自动下载模型并启动交互式会话
- 测试模型:输入
你好,请介绍一下自己,查看模型回复 - 退出交互式会话:输入
/bye
2.3 启动Ollama API服务#
- 打开终端,运行以下命令启动Ollama API服务:
ollama serve
- API服务默认运行在
http://localhost:11434 - 测试API服务:
curl http://localhost:11434/api/chat -d '{"model": "llama3", "messages": [{"role": "user", "content": "你好"}]}'
- 如果返回模型回复,则说明API服务运行正常
三、将免费大模型接入到ClaudeCodeRouter
ClaudeCodeRouter是一个中间层服务,可以将多种大模型接入到Claude Code中。
3.1 安装ClaudeCodeRouter
请参考上一节内容。
3.2 配置ClaudeCodeRouter
- 创建配置文件
router.config.json:
{
"port": 3000,
"models": [
{
"name": "llama3",
"type": "ollama",
"baseUrl": "http://localhost:11434",
"model": "llama3"
},
{
"name": "openrouter-llama3",
"type": "openrouter",
"apiKey": "your_openrouter_api_key",
"model": "meta-llama/llama-3-8b-instruct:free"
}
]
}
-
配置说明:
port:ClaudeCodeRouter服务端口models:模型列表,支持多种模型配置type:模型类型,支持"ollama"、"openrouter"、"aliyun"等baseUrl:模型API地址(针对本地模型)apiKey:模型API密钥(针对云服务)model:模型名称
3.3 启动ClaudeCodeRouter服务
打开终端,运行以下命令:
ccr start
四、将Claude Code接入到ClaudeCodeRouter
4.1 配置Claude Code
-
打开Claude Code的配置文件,不同操作系统的位置:
- macOS/Linux:
~/.claude/settings.json - Windows:
%USERPROFILE%\.claude\settings.json
- macOS/Linux:
-
编辑配置文件,添加以下内容:
{
"env": {
"ANTHROPIC_BASE_URL": "http://localhost:3456",
"ANTHROPIC_AUTH_TOKEN": "sk-anything",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "llama3",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "llama3",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "llama3"
}
}
-
配置说明:
ANTHROPIC_BASE_URL:ClaudeCodeRouter服务地址ANTHROPIC_AUTH_TOKEN:可以填写任意值,ClaudeCodeRouter暂不验证密钥ANTHROPIC_DEFAULT_*_MODEL:将Claude模型映射到免费模型
4.2 重启Claude Code#
- 关闭所有Claude Code窗口
- 打开一个新的终端窗口
- 进入代码工作目录,运行
claude命令启动Claude Code
4.3 验证配置#
- 在Claude Code的聊天界面中,输入测试消息:
你好,请介绍一下自己。
- 如果看到免费模型的回复,说明配置成功
- 输入
/status命令,查看当前使用的模型状态 - 可以看到模型名称显示为配置的免费模型
五、进阶配置与优化#
5.1 配置多个免费模型#
在ClaudeCodeRouter配置文件中,可以添加多个免费模型,实现模型切换:
{
"port": 3000,
"models": [
{
"name": "llama3",
"type": "ollama",
"baseUrl": "http://localhost:11434",
"model": "llama3"
},
{
"name": "mistral",
"type": "ollama",
"baseUrl": "http://localhost:11434",
"model": "mistral"
},
{
"name": "gemma",
"type": "ollama",
"baseUrl": "http://localhost:11434",
"model": "gemma:7b"
}
]
}
5.2 模型切换#
在Claude Code中,可以通过修改配置文件中的ANTHROPIC_DEFAULT_*_MODEL值来切换不同的免费模型:
{
"env": {
"ANTHROPIC_DEFAULT_OPUS_MODEL": "mistral",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "mistral",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "mistral"
}
}
5.3 性能优化#
- 对于本地运行的模型,可以调整Ollama的配置以提高性能:
export OLLAMA_NUM_GPU=1 # 使用GPU加速
ollama serve
对于ClaudeCodeRouter,可以调整日志级别和超时时间:
{
"port": 3000,
"logLevel": "info",
"timeout": 60000,
"models": [
// 模型配置
]
}
六、常见问题及解决方案#
6.1 ClaudeCodeRouter启动失败#
- 检查端口是否被占用:使用
lsof -i :3000查看端口占用情况 - 检查配置文件格式是否正确:使用JSON验证工具检查配置文件
- 检查Node.js版本是否符合要求:建议使用v18或更高版本
6.2 Claude Code无法连接到ClaudeCodeRouter#
- 检查ClaudeCodeRouter服务是否正在运行
- 检查配置文件中的
ANTHROPIC_BASE_URL是否正确 - 检查网络连接是否正常
- 尝试重启Claude Code和ClaudeCodeRouter
6.3 模型回复速度慢#
- 对于本地模型,检查电脑配置是否足够:建议至少8GB RAM,最好有GPU加速
- 对于云服务模型,检查网络连接是否稳定
- 尝试使用更小尺寸的模型,例如7B参数的模型
6.4 模型回复质量不佳#
- 尝试使用更适合代码生成的模型,例如DeepSeek-Coder、CodeLlama等
- 优化提示词,提供更清晰的指令
- 调整模型参数,例如
temperature、top_p等
七、总结#
通过以上步骤,我们可以将免费的大模型接入到Claude Code中,主要包括以下几种方式:
- 使用OpenRouter、阿里云等免费大模型提供商的服务
- 本地搭建Ollama运行免费大模型
- 通过ClaudeCodeRouter将多种模型统一管理
- 将Claude Code配置为使用ClaudeCodeRouter提供的免费模型
这种方式不仅可以节省API调用费用,还可以根据需求选择不同的模型,提高开发效率。随着开源大模型的不断发展,免费模型的性能和功能也在不断提升,为开发者提供了更多的选择。
建议开发者根据自己的需求和使用场景,选择合适的免费模型接入方式。对于个人学习和小型项目,本地搭建Ollama是一个不错的选择;对于需要更高性能的场景,可以考虑使用OpenRouter等平台提供的免费模型;而对于需要管理多个模型的团队,可以使用ClaudeCodeRouter实现统一管理。