Gemini与GPT联动(保姆级顶会绘图教程)

Gemini与GPT联动(保姆级顶会绘图教程)

本教程采用一套标准化的工作流,将复杂的绘图任务拆解为 “逻辑构建(The Architect)” 与 “视觉渲染(The Renderer)” 两个独立且互补的环节。通过利用 LLM 强大的逻辑推理能力来指导绘图模型的像素生成能力,我们能够产出符合 CVPR/NeurIPS 等顶刊标准的学术插图!

目标:利用逻辑推理能力强的 LLM(如 Gemini 3 Pro, GPT-5, Claude 4.5)将你的论文内容转化为一份[VISUAL SCHEMA]

操作指南:请复制下方的 Prompt,并将你的论文摘要或方法章节的内容附在最后。这一步的核心在于将抽象的算法逻辑转化为绘图模型能够理解的“强硬”物理描述。


目标:利用 Nano-Banana Pro 的指令遵循能力,将蓝图转化为像素。

操作指南:请复制下面的通用模板。注意,你只需要将步骤一生成的 —BEGIN PROMPT— 到 —END PROMPT— 之间的内容(包含方括号内的英文)完整粘贴进去即可,无需做任何修改。


打开GPT或者其它AI模型,上传手稿或者输入绘图要求(摘要),并输入指令:


将论文上传至GPT,然后复制上述模板指令:

Gemini与GPT联动(保姆级顶会绘图教程)

GPT根据论文内容生成的Prompt如下:


打开Gemini官网:Gemini

4.2.1图像生成

选择工具中的生成图像,并复制4.1生成的Prompt到对话框:

Gemini与GPT联动(保姆级顶会绘图教程)

等待生成:

Gemini与GPT联动(保姆级顶会绘图教程)

生成效果图如下:

Gemini与GPT联动(保姆级顶会绘图教程)

4.2.2图像修改

若图像生成不符合自己的要求,可以再让GPT进行修改,例如生成中文图片:

Gemini与GPT联动(保姆级顶会绘图教程)

生成的新Prompt如下:


再将生成的prompt输入Gemini:

gpt 教程Gemini与GPT联动(保姆级顶会绘图教程)

生成新的中文图如下:

Gemini与GPT联动(保姆级顶会绘图教程)

4.2.3图片的优化

作者可以根据自己的想法发送不同的要求让GPT不断润色,最终修改prompt后的图如下:

Gemini与GPT联动(保姆级顶会绘图教程)

渲染效果我根据第3部分试了,效果一般,感兴趣的可以自己试一下。

1.数据采集与分析专栏

Gemini与GPT联动(保姆级顶会绘图教程)

2.AI实时故障系统终端部署

Gemini与GPT联动(保姆级顶会绘图教程)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/285660.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 上午7:11
下一篇 2026年3月16日 上午7:11


相关推荐

关注全栈程序员社区公众号