Gemini与GPT联动（保姆级顶会绘图教程）

Ai探索者 • 2026年3月16日上午7:11 • gpt • 阅读 22

本教程采用一套标准化的工作流，将复杂的绘图任务拆解为 “逻辑构建（The Architect）” 与 “视觉渲染（The Renderer）” 两个独立且互补的环节。通过利用 LLM 强大的逻辑推理能力来指导绘图模型的像素生成能力，我们能够产出符合 CVPR/NeurIPS 等顶刊标准的学术插图！

目标：利用逻辑推理能力强的 LLM（如 Gemini 3 Pro, GPT-5, Claude 4.5）将你的论文内容转化为一份[VISUAL SCHEMA]。

操作指南：请复制下方的 Prompt，并将你的论文摘要或方法章节的内容附在最后。这一步的核心在于将抽象的算法逻辑转化为绘图模型能够理解的“强硬”物理描述。

目标：利用 Nano-Banana Pro 的指令遵循能力，将蓝图转化为像素。

操作指南：请复制下面的通用模板。注意，你只需要将步骤一生成的 —BEGIN PROMPT— 到 —END PROMPT— 之间的内容（包含方括号内的英文）完整粘贴进去即可，无需做任何修改。

打开GPT或者其它AI模型，上传手稿或者输入绘图要求（摘要），并输入指令：

将论文上传至GPT，然后复制上述模板指令：

Gemini与GPT联动（保姆级顶会绘图教程）