阿里巴巴发布千问3模型:8种版本全面开源,性能创纪录

阿里巴巴发布千问3模型:8种版本全面开源,性能创纪录

新京报贝壳财经讯(记者罗亦丹)2025年4月29日凌晨,阿里巴巴正式发布新一代通义千问模型Qwen3(简称千问3),并将其8种模型版本全部开千问 Qwen 教程源。该模型参数量仅为DeepSeek-R1的1/3,部署成本显著降低,性能在各项评测中创下国产模型新高。

千问3的界面设计相比于其他大模型有所创新,用户可通过拖动“时间轴”按钮来控制思考的最大长度,以优化tokens(算力单位)的消耗。同时,搜索框中添加了即将推出的“MCP”(模型上下文协议)选项,进一步提升用户体验。

在性能方面,千问3采用混合专家(MoE)架构,总参数量达到235B,激活只需22B。预训练数据量为36T,并通过多轮强化学习整合非思考模式与思考模型,提升了推理、指令遵循和多语言能力等方面的表现。千问3在奥数水平的AIME25测评中获得81.5分,刷新开源纪录;在LiveCodeBench评测中突破70分,超越Grok3;在ArenaHard测评中以95.6分超越OpenAI-o1及DeepSeek-R1,显示出卓越的性能。

值得注意的是,千问3的部署成本大幅下降,仅需4张H20即可实现满血版部署,显存占用仅为同类模型的三分之一。此外,千问3提供了丰富的模型版本,包括2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。每款模型均在同尺寸开源模型中获得最佳性能,30B参数MoE模型实现了10倍以上的性能提升,3B激活就能媲美上代Qwen2.5-32B模型。

千问3的各个版本为不同应用场景提供了便捷的选择,例如4B模型适合手机端,8B模型可在电脑和汽车端流畅部署,32B模型则受到大规模部署企业的青睐。千问3的发布标志着国产大模型在技术和应用上的新突破,未来将进一步推动AI技术的普及与应用。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/256994.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月13日 上午10:39
下一篇 2026年3月13日 上午10:39


相关推荐

关注全栈程序员社区公众号