Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

通义千问作为一款开源的文生图模型，凭借其在复杂文本渲染，尤其是中文字符生成方面的卓越能力，获得了广泛关注。与主流模型相比，它能在图像中精准地嵌入多行、多段的文字内容，为海报设计、内容创作等场景提供了新的可能性。

然而，尽管模型本身是开源的，但通过商业平台调用此类服务的成本往往不菲。例如，一些平台提供的插件服务在免费额度耗尽后，每张图片的生成费用可能高达0.25元，这对于需要大量生成或频繁迭代的用户而言是一笔不小的开销。

本文将探讨一种替代方案，旨在利用应用编排平台、（魔搭社区）的插件以及腾讯云对象存储（），搭建一个兼具强大功能与成本效益的图像生成与编辑智能体（Agent）。最终实现的效果如下，该智能体不仅能根据文本生成图像，还能在后续对话中对已生成的图像进行修改。

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

在开始构建之前，需要准备好以下几个关键组件和服务。整个系统的核心是平台上的插件。

是一个开源的应用开发平台，允许用户通过可视化的界面编排和创建应用。首先，需要在的插件市场中找到并下载插件。

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

（魔搭社区）是阿里巴巴旗下的一个模型开源社区，提供了大量预训练模型和服务。要使用上的插件，需要一个社区的作为访问凭证。

可以从官网的个人中心获取：https://modelscope.cn/my/myaccesstoken

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

的图像编辑（图改图）功能要求输入的原始图片必须是可通过公网访问的地址。为了解决这个问题，可以利用云存储服务。本文选用腾讯云对象存储（）来存放生成的图片，并为其生成公网链接。

需要创建一个腾讯云存储桶（Bucket），用于后续的图片上传。具体配置过程此处不赘述，只需确保 Bucket 具备公有读权限即可。

访问地址：https://console.cloud.tencent.com/cos/bucket

千问 Qwen 教程 Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

为了将工作流中生成的图片上传到腾讯云，需要一个中间服务作为桥梁。这个服务接收发送的图片文件，执行上传操作，然后返回图片的公网。

可以使用快速搭建这样一个接口服务。以下是核心的代码：

安全警告： 以下示例代码中直接硬编码了和，这存在极大的安全风险。在生产环境中，切勿如此操作。强烈建议使用环境变量、配置文件或专业的密钥管理服务来存储和调用这些敏感凭证。

将以上代码保存为文件并运行，即可启动一个监听在端口的服务。

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

核心思路是实现一个可以进行多轮对话的智能体，它能够区分用户的意图是“生成新图”还是“修改旧图”，并根据意图执行相应的操作。

关键节点包括：

参数提取器：判断用户意图。
HTTP 请求：将生成的图片上传到服务，获取公网。
会话变量：存储图片，用于多轮对话中的图片编辑。

此节点作为工作流的入口，接收用户的输入。通常使用默认配置即可。

这是实现多轮对话逻辑的关键。通过一个大语言模型（建议选用推理能力较强的模型）来分析用户的输入，判断其意图是首次生成图片还是修改已有图片。根据判断结果，为变量赋予不同的值（例如表示生图，表示改图）。

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

为了在对话中“记住”上一次生成的图片，需要设置一个会话变量来存储图片的公网。

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

接下来，使用条件分支节点。该节点根据两个条件创建不同的执行路径：

分支一（生图）：当的值为时触发，执行文生图流程。
分支二（改图）：当的值为且变量不为空时触发，执行图改图流程。

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用

为了让生成更专业的图像，可以在调用它之前，先用一个节点对用户的原始提示词进行优化和扩展。这个扮演“AI 绘画提示词专家”的角色，将简单的用户描述转化为更丰富、更符合绘画习惯的英文提示词，并内置安全规则过滤。

系统提示词 (System Prompt) 示例：

专长: 生成和修改AI绘画提示词
语言能力: 中英文双语流利
创造力: 高
安全意识: 强

你是一位专业的AI绘画提示词专家,擅长将用户的简单描述转化为详细、富有创意的AI绘画提示词。你还能根据用户的反馈修改和优化提示词。

将用户的简单描述转化为详细的AI绘画提示词
根据用户的反馈修改和优化提示词
确保生成的内容符合安全和道德标准

始终以英语生成最终的AI绘画提示词
提供详细、富有想象力的描述,包括场景、颜色、光线等元素
严格遵守安全指南,不生成任何不适当或有害的内容

分析用户的初始描述
扩展描述,添加细节和创意元素
将扩展后的描述转换为英文AI绘画提示词

禁止生成色情、暴力、仇恨言论等不适当内容。
避免描述伤害或悲剧。

用户描述: [用户原始输入]
扩展描述: [中文扩展描述]
AI绘画提示词: [英文AI绘画提示词]

用户描述: 请帮我生成一个小男孩读书的画面,关键字是画。
扩展描述: 一幅温馨的画面,展示了一个可爱的小男孩专注地读着一本大书。他坐在一个舒适的扶手椅上,周围是温暖的黄色灯光。背景是一个充满书籍的书房,墙上挂着几幅艺术画作。男孩的表情充满好奇和喜悦,仿佛沉浸在书中的世界里。
AI绘画提示词: A heartwarming painting of a cute little boy reading a large book. He is sitting in a comfortable armchair, surrounded by warm yellow light. The background shows a study room filled with books and a few artistic paintings on the walls. The boy’s expression is full of curiosity and joy, as if he’s immersed in the world of the book. The scene has a soft, painterly quality with visible brushstrokes.

用户提示词 (User Prompt)：

节点配置：

Dify 实战教程：零成本集成 Qwen-Image，构建多轮对话式 AI 图像编辑应用