月之暗面发布开源Kimi K2 Thinking模型

月之暗面发布开源Kimi K2 Thinking模型

月之暗面近日发布Kimi K2 Thinking——Kimi系列迄今能力最强的开源思考模型。该模型基于“模型即Agent”理念训练,原生具备“边思考,边使用工具”的能力,在多项基准测试中达到SOTA水平。

在Humanity’s Last Exam测试中,Kimi K2 Thinking取得44.9%的成绩,展现强大推理与问题解决能力。该测试涵盖100多个专业领域,允许使用搜索、Python和网络浏览工具。模型通过多轮搜索与推理,层层深入完成复杂任务。

Kimi K2 Thinking在OpenAI发布的BrowseComp基准测试中表现突出,以60.2%的成绩刷新SOTA,显著高于人类平均29.2%的水平。该测试评估AI在信息过载环境下的坚持性与创造力。模型可实现上百轮“思考→搜索→浏览网页→编程”的动态循环,持续完善假设并构建逻辑一致的答案。

在Agentic编程方面,模型在SWE-Multilingual、SWE-bench验证集及Terminal终端使用等测试中性能提升。其对HTML、React等前端任务处理能力增强,能将创意转化为功能齐全、响应式的产品,并支持复杂多步开发流程。

通用能力方面,Kimi K2 Thinking在创意写作中表现出更强的风格连贯性和情感共鸣;在学术研究中提升分析深度与逻辑结构;在个人情感类问题回应中更具同理心,提供细致观点与可行建议。

技术层面,模型采用后训练量化感知训练(QAT),并对MoE组件应用INT4纯权重量化,实现原生INT4推理,生成速度提升约2倍。所有基准测试成绩均在INT4精度下取得,提升了对国产加速芯片的兼容性。

该模型已上线kimi.com及最新版Kimi手机应用常规对话模式,后续将升级Agent模式底层模型。API可通过Kimi开放平台访问,支持256K上下文,标准API每百万Token输入4元、输出16元,Turbo API输入8元、输出58元。模型亦可在Hugging Face、ModelScope等平台下载部署。

为保障轻量化体验,当前聊天模式仅部署部分工具并减少调用轮次,可能无法完全匹配基准分数。完整能力月之暗面 Kimi 教程将在“OK Computer”Agent模式更新后释放。Kimi K2 Thinking于11月6日发布,此前Kimi K2-0905版本已于9月5日更新,支持256K上下文,广泛接入Cline、Cursor、Perplexity等产品。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/268017.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午5:31
下一篇 2026年3月12日 下午5:31


相关推荐

关注全栈程序员社区公众号