月之暗面推出新型混合线性注意力架构 “Kimi Linear”

Ai探索者 • 2026年3月12日下午2:44 • 月之暗面 • 阅读 1

近日，月之暗面发布了一种全新的混合线性注意力架构，名为 “Kimi Linear”。这一架构据称在处理短距离、长距离信息以及强化学习（RL）等多种场景中，性能优于传统的全注意力方法。其核心技术 Kimi Delta Attention(KDA)是对 Gated DeltaNet 的一次优化，特别引入了一种更高效的门控机制，以更好地管理有限状态 RNN 的记忆使用。

Kimi Linear 的设计由三份 Kimi Delta Attention 和一份全局 MLA 组成。这种结构通过细粒度的门控来压缩有限状态 RNN 的记忆，使得模型在处理信息时更加高效。官方指出，在处理1M token 的数据场景中，Kimi Linear 的 KV cache 占用降低了75%，而解码吞吐量可提升6倍，TPOT 相较于传统 MLA 加速了6.3倍。

这种新的架构为各种 AI 应用场景提供了更强的支持，无论是在信息密集型的自然语言处理任务还是在动态环境中的强化学习，Kimi Linear 都有着显著的优势。随着 AI 技术的不断发展，这种高效的注意力机制可能会为未来的智能应用带来新的突破。

更多技术细节可以在 Kimi Linear 的技术报告中找到，https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf。

划重点:

🌟 月之暗面 Kimi 教程 Kimi Linear 是一种新型的混合线性注意力架构，优化了信息处理性能。

🚀 该架构在1M token 场景下，KV cache 占用减少75%，解码吞吐量提升6倍。

🔍 Kimi Delta Attention 是其核心技术，通过细粒度门控优化了 RNN 的记忆管理。

发布者：Ai探索者，转载请注明出处：https://javaforall.net/270700.html原文链接：https://javaforall.net

月之暗面推出新型混合线性注意力架构 “Kimi Linear”

关于作者

Ai探索者网站注册用户

​月之暗面推出新型混合线性注意力架构 “Kimi Linear”

关于作者

Ai探索者网站注册用户

相关推荐

openclaw怎么使用 openclaw新手入门操作指南

月之暗面新模型Kimi K2 Thinking发布

月之暗面 Kimi K2-0905 重磅升级：上下文 256K + 高速 API，国产大模型进入“极速时代”

月之暗面Kimi K2 Thinking：460万美元成本，性能超GPT-5等大模型

月之暗面回应Kimi K2模型API速度慢：正全力优化推理效率

月之暗面Kimi Linear架构发布：长文本处理效率突破，AgentLLM迎来新篇章

月之暗面推出新型混合线性注意力架构 “Kimi Linear”