硅基流动大模型服务平台已上线深度求索团队最新开源的 DeepSeek-V3.1。
DeepSeek-V3.1 总参数共 671B,激活参数 37B,采用混合推理架构(同时支持思考模式与非思考模式),相比 DeepSeek-R1-0528,具有更高思考效率,能在更短时间内给出答案;同时,DeepSeek-V3.1 在工具使用与智能体任务中的表现有较大提升。DeepSeek-V3.1 新版本在 SWE、Browsecomp、xbench 和 SimpleQA 基础测试上实现大幅性能提升,在多个领域比肩 Claude 4 Sonnet 等模型。

DeepSeek-V3.1 的价格为输入 4 元 / M Tokens,输出 12 元 / M Tokens,比 Claude 4 Sonnet 的输入成本便宜 5 倍,输出成本便宜 9 倍,成为编码、智能体等场景的绝佳选择之一。

除了最大支持 500 万 TPM,这次硅基流动平台推出的 DeepSeek-V3.1 率先支持 160K 超长上下文,让开发者高效处理长文档、多轮对话、编码及智能体等复杂场景。核心价值包括:
- 超长文档无需分段切割:无损解析法律合同比对、学术文献综述、金融报告解析、全量代码库理解;
- 深度对话长程记忆:适应复杂客服、心理咨询、教学辅导等强连贯性交互场景;
- 复杂任务端到端处理:告别分段处理/缓存拼接等工程逻辑,一站式完成全链路任务;
- 高精度 RAG 增强检索:百份文档嵌入上下文,基于完整信息生成精准答案,显著降低检索错误率。
欢迎通过以下方式使用 DeepSeek-V3.1,国内站与国际站新用户可分别自动获取 14 元或 1 美元赠金体验。
国内站在线体验
https://cloud.siliconflow.cn/models
国际站在线体验
https://cloud.siliconflow.com/models
第三方应用接入教程
https://docs.siliconflow.cn/cn/usercases/
开发者 API 文档
https://docs.siliconflow.cn/cn/api-reference/chat-completions/
DeepSeek 教程
(注意:硅基流动的上下文缓存功能正在支持中,使用时请关注费用消耗。)
我们在 Claude Code 中调用 DeepSeek-V3.1,让它生成一个网页版的打地鼠小游戏。


实际效果如下。

- 在终端中运行以下命令:
- 提示输入 API Key 时,复制粘贴你的硅基流动 API Key。

- 提示选择模型时,使用方向键选择要在 Claude Code 中使用的 DeepSeek-V3.1 / Qwen3-Coder / GLM-4.5 / Kimi K2 等模型。
- 根据提示,复制相应命令并重启终端运行,应用配置:

- 执行 Claude 命令,进入 Claude Code 并使用。
注意:目前 Claude Code 并不支持添加多个自定义模型(Custom Model),你可以再次执行上述 1-5 步,选择并更新 ANTHROPIC_MODEL 环境变量的方式切换模型。
如果你想手动配置 Claude Code 的环境变量,可以在终端中运行下列命令:
Gen-CLI 基于开源的 Gemini-CLI 改造而来,目前已在 GitHub 开源(https://github.com/gen-cli/gen-cli/),你可以通过以下方式安装。
-
- 确保操作系统已经安装 node 18+
-
- 设置 API key 环境变量
-
- 运行 Gen-CLI
通过 npx 运行 repo:
或者,通过 npm 安装命令:

- 在 VSCode 中,通过 Ctrl/Command+Shift+P 打开命令工具,在新 Tab 中打开 Cline 进行配置
- 在新窗口中进行配置
- API Provider:选择 “OpenAI Compatible”
- Base Url:https://api.siliconflow.cn/v1
- API Key:从硅基流动大模型服务平台中获取
- Model ID:从硅基流动大模型服务平台模型卡片中获取
- 开始使用
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/240862.html原文链接:https://javaforall.net
