月之暗面推出万亿参数Kimi K2模型并开源MoE架构

月之暗面推出万亿参数Kimi K2模型并开源MoE架构

在关键基准测试中,Kimi K2展现领先性能SWE Bench Verified达到65.8%准确率, 月之暗面 Kimi 教程LiveCodeBench录得53.7%MATH-500则高达97.4%,超越DeepSeek-V3和阿里Qwen3等开源竞品。其Agent能力尤为突出,支持自主编程、工具调用和多步推理,例如自动规划Coldplay巡演行程,完成机票酒店预订、生成日历及HTML行程摘要;实际测试中,根据用户需求生成日本旅游攻略,涵盖餐厅推荐、景点细节及实用贴士,尽管初期HTML输出略显粗糙。

技术创新聚焦MuonClip优化器,替代传统Adam方案,确保万亿参数训练全程零中断,显著提升token处理效率。API服务已上线,兼容OpenAI与Anthropic格式,支持128K上下文,定价设定为每百万输入tokens收费4元,输出tokens收费16元

面对2025年市场竞争加剧,月之暗面用户增长放缓,此次开源策略被视为差异化突围手段。Perplexity CEO公开称赞模型潜力,金山云等企业已接入应用。模型在零售、航空场景的Tau2测试中表现卓越,电信领域得分65.8%,验证其复杂任务处理能力。实际案例还包括分析13万行薪资数据生成可视化图表,以及一键构建期货交易界面,凸显工业级实用性。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/271527.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午2:00
下一篇 2026年3月12日 下午2:00


相关推荐

关注全栈程序员社区公众号