大模型圈十一假期也在卷!
刚刚,阿里通义千问Qwen大模型团队开源Qwen3-VL-30B-A3B,包含Instruct和Thinking两个版本。MoE架构,总参数30B,激活参数3B。

Qwen3-VL是迄今为止Qwen系列中功能最强大的视觉-语言模型,此前已经开源了Qwen3千问 Qwen 教程-VL-235B-A22B。
同时,团队还开源了该模型的FP8版本,使用了激活感知权重量化(AWQ)技术,量化后的性能几乎与原始BF16模型相当。
虽然Qwen3-VL-30B-A3B仅激活3B参数,但评测结果表明,该模型在STEM、视觉问答(VQA)、OCR、视频理解、智能体等多个任务中与GPT-5-Mini和Cluade4-Sonnet相媲美。


此外,该模型与语言模型Qwen3-30B-A3B相比,语言能力并没有下降。

目前模型已在魔搭社区(ModelScope)和Hugging Face开源。
- ModelScope:
https://www.modelscope.cn/models/Qwen/Qwen3-VL-30B-A3B-Instruct-FP8
https://www.modelscope.cn/models/Qwen/Qwen3-VL-30B-A3B-Instruct
https://www.modelscope.cn/models/Qwen/Qwen3-VL-30B-A3B-Thinking
https://www.modelscope.cn/models/Qwen/Qwen3-VL-30B-A3B-Thinking-FP8
- Hugging Face
https://huggingface.co/Qwen/Qwen3-VL-30B-A3B-Instruct
https://huggingface.co/Qwen/Qwen3-VL-30B-A3B-Instruct-FP8
https://huggingface.co/Qwen/Qwen3-VL-30B-A3B-Thinking
https://huggingface.co/Qwen/Qwen3-VL-30B-A3B-Thinking-FP8
发布者:Ai探索者,转载请注明出处:https://javaforall.net/263135.html原文链接:https://javaforall.net
