1月26日,腾讯混元发布混元图像3.0图生图(HunyuanImage 3.0-Instruct)模型,支持图片编辑与多图融合,并在元宝 混元 Hunyuan 教程“元宝”平台同步上线,用户可通过元宝全端及腾讯混元官网直接体验。
该模型总参数量80B,激活参数约13B,采用混合专家(MoE)架构,基于混元图像3.0原生多模态基础模型,引入图生图多任务数据,通过指令微调和后训练,提升对输入图像与编辑指令的理解与处理能力。其指令遵循效果稳定,生成图像一致性高、真实感强、情绪表现力佳,生成速度明显提升。
混元图像3.0图生图具备图像理解与推理能力。模型接收用户输入图像及提示词后,首先解析图像内容,再依据提示词推理需编辑区域、具体编辑步骤及需保留区域,形成细化编辑指令,保障输出质量。
模型支持增删改、风格变换、老照片修复、人物与文字修改等图片编辑功能,以及多图中人物或元素提取、合成合照、生成新图等多图融合能力。在元宝平台上,用户可基于该模型制作表情包、虚拟人物合拍、社交分享内容、电商海报、游戏角色定制及创意图片等。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/260664.html原文链接:https://javaforall.net
