Qwen-Image：阿里通义千问推出的图像生成基础模型

全栈程序员-站长 • 2026年3月12日下午10:54 • 千问 • 阅读 2

Qwen‑Image 是通义千问团队推出的 20B 参数多模态 Transformer 模型，定位为图像生成基础模型。它专注于复杂文本的高保真渲染，并能够在生成图像的同时进行文字布局、段落排版和细节编辑，适用于中文与英文等多语言场景。在通用生成基准（GenEval、DPG、OneIG‑Bench）和图像编辑基准（GEdit、ImgEdit、GSO）上均达到先进性能。借助更一致的图像编辑能力和跨基准表现，Qwen‑Image 能帮助用户完成宣传海报、图文插画、文档排版等创作任务，并降低专业视觉内容创作门槛。

Qwen-Image在多个公开基准上进行了评估，包括用于通用图像生成的GenEval、DPG和OneIG-Bench，以及用于图像编辑的GEdit、ImgEdit和GSO。Qwen-Image在所有基准测试中均取得了最先进的性能，展现出其在图像生千问 Qwen 教程成与图像编辑方面的强大能力。此外，在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的结果表明，Qwen-Image在文本渲染方面表现尤为出色，特别是在中文文本渲染上，大幅领先现有的最先进模型。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/262110.html原文链接：https://javaforall.net

Qwen-Image：阿里通义千问推出的图像生成基础模型

关于作者

全栈程序员-站长

相关推荐

Qwen3模型高效微调环境准备

巅峰离场！马斯克点赞 48 小时后，阿里千问负责人林俊旸告别

AI Agent+MCP实战课：多工具集成 + 数据库开发，从0到1搭建商业级编程智能体

Mac 部署安装 OpenClaw 教程：从零搭建个人 AI 助手完整指南

千问怎样训练专属问答机器人_千问机器人训练法【教程】

通义千问Qwen Code v0.3.0发布：内置中英文，国际化能力提升