月之暗面Kimi-Researcher登顶HLE,AI智能体新强者来袭!

月之暗面Kimi-Researcher登顶HLE,AI智能体新强者来袭!

月之暗面公司今日震撼发布其备受瞩目的Kimi研究功能,正式进军竞争激烈的AI智能体领域。据悉,该功能在多项严格测试中展现出了卓越性能,特别是在“人类终极考验”(HLE)测试中,以压倒性优势超越了谷歌与OpenAI的同类产品,荣登榜首。

Kimi研究功能的核心竞争力在于其自主研发的Kimi-Researcher智能体,这款智能体在多轮搜索与推理方面展现出了非凡的能力。据统计,Kimi-Researcher在执行任务时,平均会执行23个推理步骤,并浏览超过200个相关网页,其强大的信息处理与分析能力令人瞩目。

在HLE测试中,Kimi-Researcher基于Kimi 月之暗面 Kimi 教程 k-系列模型的内部版本构建,并通过端到端的智能体强化学习进行训练。其Pass@1得分率达到了26.9%,Pass@4准确率更是高达40.17%,刷新了业界记录。尤为Kimi-Researcher的HLE初始得分仅为8.6%,经过强化学习训练后,成绩实现了质的飞跃,这充分证明了端到端智能体强化学习在提升智能体智能水平方面的巨大潜力。

Kimi-Researcher在多个复杂且具有挑战性的真实世界基准测试中同样表现出色。在xbench测试的xbench-DeepSearch项目上,Kimi-Researcher取得了69%的Pass@1得分率(四次运行平均值),优于其他配备搜索工具的模型。在涉及多轮搜索推理(如frameS、Seal-0)和事实性信息问答(如SimpleQA)的基准测试中,Kimi-Researcher同样展现出了卓越的性能。

为了让更多用户能够体验到Kimi-Researcher的强大功能,月之暗面公司宣布,即日起将逐步向用户开放内测申请。用户只需访问kimi.com即可提交申请。更令人期待的是,月之暗面公司计划在未来几个月内开源Kimi-Researcher背后的基础预训练模型以及经过强化学习训练后的模型,这将为AI社区的发展注入新的活力。

感兴趣的用户可以访问月之暗面公司的GitHub页面(https://moonshotai.github.io/Kimi-Researcher/),了解更多关于Kimi-Researcher的详细信息。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/267813.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午5:42
下一篇 2026年3月12日 下午5:43


相关推荐

关注全栈程序员社区公众号