“养龙虾”爆火,首个模型排行榜出炉 MiniMax、Kimi国产双雄霸榜OpenClaw

“养龙虾”爆火,首个模型排行榜出炉 MiniMax、Kimi国产双雄霸榜OpenClaw

(来源:财闻)

谷歌的Gemini 3 Flash Preview 以95.1% 的成功率夺冠。

当地时间3月7日,OpenClaw 创始人 Peter Steinberger 在平台X上分享龙虾基准测试排行榜。PinchBench 测试openclaw 龙虾了32款主流大模型,从成功率、速度、费用三个维度,测试哪个模型最适合养龙虾。

排行榜显示,谷歌(GOOGL.US)的Gemini 3 Flash Preview 以95.1% 的成功率夺冠,其次是国产模型 MiniMax M2.1,成功率93.6%,战胜 Claude Sonnet 4.5(92.7%)和 GPT-4o(85.2%)等一众国际大模型。

Kimi K2.5则以93.4%的成功率紧随其后,位居第三。至此,国产双雄直接占据了 TOP3的两个席位。

“养龙虾”爆火,首个模型排行榜出炉 MiniMax、Kimi国产双雄霸榜OpenClaw
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/257573.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月13日 上午10:02
下一篇 2026年3月13日 上午10:02


相关推荐

关注全栈程序员社区公众号