阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

全栈程序员-站长 • 2026年3月13日上午8:10 • 千问 • 阅读 1

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

就在 DeepSeek-V3 更新的同一夜，阿里通义千问 Qwen 又双叒叕一次梦幻联动了 —— 发布 Qwen2.5-VL-32B-Instruct。

此前开源家族视觉语言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三种尺寸。

这一次的 32B 版本进一步兼顾尺寸和性能，可在本地运行。同时经过强化学习优化，在三个方面改进显著：

对比近期开源的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT 等，Qwen2.5-VL-32B 在纯文本能力上也达到了同规模的 SOTA 表现。在多个基准上，Qwen2.5-VL-32B 甚至超过了 72B。

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

举个栗子，比如根据一张交通指示牌照片，Qwen2.5-VL-32B 就能做如下精细的图像理解和推理：

我正在这条路上驾驶一辆大卡车，现在 12 点了。我能在 13 点之前到达 110 公里远的地方吗？

千问 Qwen 教程阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

Qwen2.5-VL-32B 首先对时间、距离、卡车限速进行分析，然后分步骤条理清晰推算出正确答案：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

模型已经开源，尽管自己前往实测～

官方刚刚发布的技术博客中也放出了更多展示示例。

数学推理能力上，几何体分析也不在话下：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

同样是先有问题分析环节，然后再分四个小步骤推理正确答案：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

下面这种复杂难题也能解：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

能够依次类推，归纳出构造规律：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

像下面这种图片理解就更不在话下了：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

多轮深度提问也可以：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

现在，阿里已将 Qwen2.5-VL-32B-Instruct 放在了 Hugging Face 上。

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

在 Qwen Chat 上就能直接体验 Qwen2.5-VL-32B，感兴趣的童鞋可以试试。

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

动作快的网友已经开始在 MLX Community 运行了：

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

在 Hacker News 上，网友也就 DeepSeek 和 Qwen 的举动进行了新一轮热烈讨论。网友纷纷表示：

开源赢了，奥尔特曼错了。

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

值得一提的是，春节期间，DeepSeek 曾与阿里通义千问 Qwen 多次几乎同时发布新模型，这一次又双叒叕赶一块去了。

杭州，原来真的是商量着一起发？？？

阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/259608.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.6K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

即梦做化妆品广告教程

上一篇 2026年3月13日上午8:10

腾讯元宝电脑版／网页版再次更新：支持实时预览 HTML 代码

下一篇 2026年3月13日上午8:11

千问

通义千问 Qwen Chat Memory 上线，AI 能“记住”你指定的重要信息

通义千问 Qwen Chat Memory 上线，AI 能“记住”你指定的重要信息

Ai探索者
2026年3月13日
2
千问

LangChain1.0实战之多模态RAG系统（一）——多模态RAG系统核心架构及智能问答功能开发

LangChain1.0实战之多模态RAG系统（一）——多模态RAG系统核心架构及智能问答功能开发

Ai探索者
2026年3月13日
3
千问

ComfyUI QwenVL插件安装使用图文教程详解

ComfyUI QwenVL插件安装使用图文教程详解

全栈程序员-站长
2026年3月13日
3
千问

Qwen3与DeepSeek-V2技术解析[源码]

Qwen3与DeepSeek-V2技术解析[源码]

全栈程序员-站长
2026年3月14日
2
千问

华为、阿里大模型：参数相关性0.927引抄袭争议

华为、阿里大模型：参数相关性0.927引抄袭争议

全栈程序员-站长
2026年3月13日
2
千问

Qwen7b微调保姆级教程

Qwen7b微调保姆级教程

全栈程序员-站长
2026年3月13日
2

关注全栈程序员社区公众号