月之暗面发布开源Kimi K2 Thinking模型

月之暗面近日发布Kimi K2 Thinking——Kimi系列迄今能力最强的开源思考模型。该模型基于“模型即Agent”理念训练，原生具备“边思考，边使用工具”的能力，在多项基准测试中达到SOTA水平。

在Humanity’s Last Exam测试中，Kimi K2 Thinking取得44.9%的成绩，展现强大推理与问题解决能力。该测试涵盖100多个专业领域，允许使用搜索、Python和网络浏览工具。模型通过多轮搜索与推理，层层深入完成复杂任务。

Kimi K2 Thinking在OpenAI发布的BrowseComp基准测试中表现突出，以60.2%的成绩刷新SOTA，显著高于人类平均29.2%的水平。该测试评估AI在信息过载环境下的坚持性与创造力。模型可实现上百轮“思考→搜索→浏览网页→编程”的动态循环，持续完善假设并构建逻辑一致的答案。

在Agentic编程方面，模型在SWE-Multilingual、SWE-bench验证集及Terminal终端使用等测试中性能提升。其对HTML、React等前端任务处理能力增强，能将创意转化为功能齐全、响应式的产品，并支持复杂多步开发流程。

通用能力方面，Kimi K2 Thinking在创意写作中表现出更强的风格连贯性和情感共鸣；在学术研究中提升分析深度与逻辑结构；在个人情感类问题回应中更具同理心，提供细致观点与可行建议。

技术层面，模型采用后训练量化感知训练（QAT），并对MoE组件应用INT4纯权重量化，实现原生INT4推理，生成速度提升约2倍。所有基准测试成绩均在INT4精度下取得，提升了对国产加速芯片的兼容性。

该模型已上线kimi.com及最新版Kimi手机应用常规对话模式，后续将升级Agent模式底层模型。API可通过Kimi开放平台访问，支持256K上下文，标准API每百万Token输入4元、输出16元，Turbo API输入8元、输出58元。模型亦可在Hugging Face、ModelScope等平台下载部署。

为保障轻量化体验，当前聊天模式仅部署部分工具并减少调用轮次，可能无法完全匹配基准分数。完整能力月之暗面 Kimi 教程将在“OK Computer”Agent模式更新后释放。Kimi K2 Thinking于11月6日发布，此前Kimi K2-0905版本已于9月5日更新，支持256K上下文，广泛接入Cline、Cursor、Perplexity等产品。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/268017.html原文链接：https://javaforall.net

月之暗面发布开源Kimi K2 Thinking模型

关于作者

全栈程序员-站长

相关推荐

估值3800亿美元的Anthropic，增长营销部门竟只有一人！

月之暗面发布旗下首个万亿参数开源模型 Kimi K2，擅长代码与 Agentic 任务

Kimi迄今能力最强开源思考模型，月之暗面Kimi K2 Thinking发布

估值180億美元 中國AI初創公司月之暗面再尋求融資

2026 AI黑话科普：小白程序员必收藏，轻松掌握大模型核心术语！

【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型

估值180億美元中國AI初創公司月之暗面再尋求融資