Kimi K2.5：月之暗面发布的开源多模态大模型，支持Agent协作与全场景智能任务执行

Kimi K2.5是由北京月之暗面科技（Moonshot AI）发布的开源多模态大模型，同步上线于Hugging Face官方仓库，是Kimi系列模型的重磅升级版本。其核心定位是“面向全场景的高性能开源智能基座”，原生融合文本、图像、视频三大模态能力，突破传统模型“单轮交互”局限，实现“复杂任务自主执行”，是月之暗面“模型即Agent”（Model as Agent）理念的核心落地成果。

作为开源模型，Kimi K2.5采用宽松的许可协议（参考前代MIT协议），支持个人与商业场景的免费使用、修改与二次开发，同时提供从在线调用、本地部署到API接入的全链路使用方案，降低不同用户的使用门槛。其开发团队核心成员包括AGI领域资深研究者，依托月之暗面在大模型架构、训练优化等领域的技术积累，打造出兼具性能与易用性的开源大模型解决方案。

Kimi K2.5在多模态处理、智能任务执行、开发赋能等领域实现全方位突破，核心特色如下：

区别于传统“文本+视觉”后期拼接的方案，Kimi K2.5采用原生三模态融合架构，可直接接收并处理文本、图像、视频输入，实现跨模态理解与生成。支持设计稿、屏幕录制、办公文档（Word/Excel/PPT）等复杂格式解析，例如能将手绘设计稿直接转换为前端代码，或提取视频中的关键信息生成文字摘要，视觉理解精度处于开源社区领先水平。

支持Agent集群协作模式，可自主调度多个“智能体”分工完成复杂任务。继承并升级了前代模型的自主工具调用能力，无需人工干预即可实现300轮以上的多步骤推理与工具调用，在网络浏览、数据统计、报告生成等任务中表现接近行业顶尖水平。例如，可自主完成“检索行业数据→整理分析→生成可视化图表→撰写分析报告”的全流程任务。

配套发布专属编程助手Kimi Code，支持VS Code、Cursor等主流编辑器集成。提供代码生成、bug修复、代码复现、大型代码库逻辑分析等功能，延续月之暗面在编码领域的技术优势。针对开发者需求优化了代码理解与生成效率，可适配Python、Java、JavaScript等主流编程语言，尤其擅长复杂业务逻辑的代码实现。

深度优化办公场景需求，具备办公软件高级处理能力。可自动生成专业报告、分析Excel表格数据、设计PPT排版逻辑，支持长文档（百万字级）的快速总结与关键信息提取。针对企业场景，支持多格式办公文件的批量处理与格式转换，大幅提升办公效率。

提供多版本部署方案，支持从个人PC到企业集群的全场景部署。推出社区量化版本，降低硬件门槛，普通高性能显卡即可运行基础推理任务。同时兼容主流推理引擎，支持性能与资源占用的灵活调配，平衡不同用户的使用需求。

Kimi K2.5依托月之暗面核心技术栈打造，在架构设计、训练优化等方面具备显著技术优势，核心细节如下：

采用先进的混合专家模型（Mixture-of-Experts, MoE）架构，总参数量达1万亿级，但其稀疏激活机制确保每处理一个token仅激活320亿参数，在降低计算成本的同时保障模型性能。模型包含384个专家网络，每轮token处理会动态选择8个专家参与计算，实现算力的高效分配。同时优化了长上下文处理能力，支持128K上下文窗口，可轻松处理长文档、多轮对话等场景。

预训练数据量达15.5T tokens，覆盖文本、图像、视频等多模态数据，通过重写策略提升数据token利用率，确保训练效率。数据来源涵盖通用知识、专业领域文献、编程代码、办公场景数据等，经过严格的数据清洗与质量筛选。针对Agent能力优化，构建了大范围Agent数据合成流程，强化模型的任务规划与执行能力；针对编码能力，专门构建了包含30K问题的代码训练集，提升代码理解与生成精度。

依托月之暗面三大核心技术：Mooncake（KV中心化LLM服务架构，获FAST 2025最佳论文）、MOBA（长上下文注意力技术）、Muon（高效LLM训练优化器），形成“模型+工具+基建”的完整技术栈。其中，MOBA技术大幅提升长文本处理的效率与精度，Muon优化器则缩短训练周期、降低资源消耗，为模型的高性能与高效部署提供技术保障。

参数类别具体数值/说明架构类型混合专家模型（MoE）总参数量 1万亿参数激活参数量 320亿/每token 专家数量 384个（每token选择8个专家）上下文窗口 128K tokens 预训练数据量 15.5T tokens（多模态融合数据）支持模态文本、图像、视频推荐推理引擎 vLLM、SGLang、KTransformers

Kimi K2.5凭借多模态与Agent核心能力，可适配个人、企业、开发者等多类用户的全场景需求：

Kimi K2.5：月之暗面发布的开源多模态大模型，支持Agent协作与全场景智能任务执行

Kimi K2.5提供三种核心使用方式，满足不同用户的需求：

适合普通用户快速体验核心功能，无需部署与配置：

需满足一定硬件要求，支持自定义修改与二次开发，步骤如下：

（1）部署环境要求

部署场景最低配置推荐配置基础推理（量化版） GPU：32GB显存（RTX 4090/A6000）；CPU：16核；内存：64GB；存储：2TB SSD GPU：64GB显存（A100 80GB）；CPU：32核；内存：128GB；存储：4TB NVMe SSD 全量推理 GPU：80GB显存（A100/H100）；CPU：32核；内存：128GB；存储：4TB SSD GPU：2×H100 80GB；CPU：64核；内存：256GB；存储：8TB NVMe SSD 集群部署 4个计算节点，单节点：2×A100 80GB、256GB内存、2TB SSD 8个计算节点，单节点：2×H100 80GB、512GB内存、4TB SSD；InfiniBand网络

（2）软件环境配置

  # 更新系统   sudo apt update && sudo apt upgrade -y   # 安装工具包   sudo apt install -y curl wget git vim build-essential cmake

  # 下载并安装CUDA   wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda_12.1.0_530.30.02_linux.run   sudo chmod +x cuda_12.1.0_530.30.02_linux.run   sudo ./cuda_12.1.0_530.30.02_linux.run   # 配置环境变量   echo 'export PATH=/usr/local/cuda-12.1/bin:$PATH' >> ~/.bashrc   echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc   source ~/.bashrc

  # 用conda创建环境   conda create -n kimi-k25 python=3.10   conda activate kimi-k25   # 安装核心依赖   pip install torch==2.1.0 torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121   pip install transformers>=4.35.0 accelerate>=0.25.0 bitsandbytes>=0.41.0

（3）模型部署与启动

  git lfs install   git clone https://huggingface.co/moonshotai/Kimi-K2.5

  # 安装vLLM   pip install vllm>=0.2.5   # 启动API服务   python -m vllm.entrypoints.openai.api_server     --model ./Kimi-K2.5     --tensor-parallel-size 2     --max-model-len 32768     --port 8000

通过月之暗面官方API将Kimi K2.5集成至自有产品：

Kimi K2.5是月之暗面推出的月之暗面 Kimi 教程高性能开源多模态大模型，基于MoE架构打造，以1万亿总参数量与原生三模态融合能力为核心支撑，强化Agent集群协作与复杂任务自主执行能力，同时提供从在线使用、本地部署到API接入的全链路方案，适配企业办公、软件开发、教育培训等多场景需求。其宽松的开源许可协议降低了商业与个人使用门槛，配套的详细部署文档与工具链进一步提升了易用性，依托月之暗面成熟的技术栈，在性能与稳定性上形成显著优势，成为开源大模型领域兼具实用性与扩展性的优质选择。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/267576.html原文链接：https://javaforall.net

Kimi K2.5：月之暗面发布的开源多模态大模型，支持Agent协作与全场景智能任务执行

（1）部署环境要求

（2）软件环境配置

（3）模型部署与启动

关于作者

全栈程序员-站长

相关推荐

国产 OpenClaw 有哪些？2026 年最全盘点

月之暗面发布Kimi Claw：一个在云端拥有40G空间的24×7运行的OpenClaw，基于Kimi模型驱动

快速了解一下月之暗面开源的全球首个万亿参数级大模型 Kimi K2

Kimi K2再进化：从助手到Agent

月之暗面发布 Kimi CLI：命令行+AI Agent 双模式切换，开发者效率新工具

月之暗面宣布KimiK2模型更新