Qwen3参数概览:从0.6B到235B,混合推理与多模态的极致平衡(附本地部署参数推荐)

Qwen3参数概览:从0.6B到235B,混合推理与多模态的极致平衡(附本地部署参数推荐)

模型名称 总参数量 激活参数量 架构类型 上下文长度 支持语言 许可证 主要特性 Qwen3-235B-A22B 2350亿 220亿 MoE 128K token 119种 Qwen License 旗舰模型,编码、数学、通用能力媲美DeepSeek-R1、Grok-3,高效推理 Qwen3-30B-A3B 300亿 30亿 MoE 128K token 119种 Qwen License 小型MoE,性能超Qwen2.5-32B,推理成本低,适合本地部署 Qwen3-32B 320亿 320亿 Dense 128K token 119种 Apache 2.0 高性能密集模型,适合复杂任务,推理能力匹敌Qwen2.5-72B Qwen3-14B 140亿 140亿 Dense 128K token 119种 Apache 2.0 中等规模,平衡性能与资源占用千问 Qwen 教程,适合企业级应用 Qwen3-8B 80亿 80亿 Dense 128K token 119种 Apache 2.0 轻量高效,适用于边缘设备,性能媲美Qwen2.5-14B Qwen3-4B 40亿 40亿 Dense 128K token 119种 Apache 2.0 小型模型,推理速度快,性能接近Qwen2.5-7B Qwen3-1.7B 17亿 17亿 Dense 128K token 119种 Apache 2.0 超轻量,适合移动设备,性能匹敌Qwen2.5-3B Qwen3-0.6B 6亿 6亿 Dense 128K token 119种 Apache 2.0 最小规模,极低资源需求,适用于低功耗场景
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/261899.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午11:04
下一篇 2026年3月12日 下午11:04


相关推荐

关注全栈程序员社区公众号