10亿红包后,腾讯混元打算开源这个“800亿”的模型

10亿红包后,腾讯混元打算开源这个“800亿”的模型

图片

在刚刚宣布元宝春节10亿红包活动后,1月28日,腾讯混元宣布将近日于元宝和腾讯混元官元宝 混元 Hunyuan 教程网同步上线的模型(HunyuanImage 3.0-Instruct)开源。

混元图像3.0图生图基于80B(800亿)总参数规模(激活参数约13B),在处理图像编辑任务时展现出强大的推理能力和精准的编辑效果。

训练过程中,混元团队构建了千万量级的图生图数据,覆盖80多个任务,并注入了,使模型能够学会先分析用户图像和意图,再输出详细编辑指令。后训练阶段采用自研,高效对齐用户偏好,大幅提升了指令响应和非编辑区域保持一致的效果。

据悉,在最新全球权威大模型竞技场  的Image Edit(图片编辑)榜单上,腾讯混元图像3.0图生图位列全球第七,进入第一梯队,成为全球最强的开源图生图模型。LMArena官方X祝贺混元图像3.0图生图模型:“图片编辑类别与Nano-Banana和Seedream-4.5等表现相当”。

图片

混元图像3.0图生图支持多样化的图片编辑与多图融合能力,包括增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑功能,以及将多张照片中的元素提取出来合成新图片的能力。该模型基于混元图像3.0的原生多模态架构,将文本理解、视觉理解与图像生成深度融合于同一模型中,这使得模型更能理解用户指令,生成的效果也更好。

对于普通用户,该模型可用于制作表情包、虚拟人物合拍、社交分享等日常场景。对于专业用户,它能够助力电商海报设计、游戏角色定制、创意图片制作等专业领域,显著提升创作效率。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/262000.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午10:59
下一篇 2026年3月12日 下午10:59


相关推荐

关注全栈程序员社区公众号