阿里通义千问推出多模态模型Qwen VLo,引入全新生成机制

阿里通义千问推出多模态模型Qwen VLo,引入全新生成机制

凤凰网科技讯 6月28日,阿里云通义千问刚刚发文,宣布推出最新的多模态统一理解与生成模型Qwen VLo。这一全新升级的模型可以进行高质量的再创造,实现从感知到生成的跨越。

阿里通义千问推出多模态模型Qwen VLo,引入全新生成机制

官方表示,Qwen VLo采用动态分辨率训练,支持动态分辨率生成。无论是输入端还是输出端,模型都支持任意分辨率和长宽比的图像生成。这意味着用户不再受限于固定的格式,可以根据实际需求生成适配不同场景的图像内容。

此外,Qwen VLo还创新性地引入了一种全新的生成机制:从上到下、从左到右逐步清晰的生成过程。这一机制不仅提升了生成效率,还特别适用于需要精细控制的长段落文字生成任务。

阿里云官方提醒,Qwen 千问 Qwen 教程 VLo属于预览阶段,还有很多不足的地方,在生成的过程可能存在不符合事实、不完全和原图一致的问题,开发团队还在持续迭代。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/259097.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月13日 上午8:40
下一篇 2026年3月13日 上午8:40


相关推荐

关注全栈程序员社区公众号