没想到,在 Lovart 里 Nano Banana 还能这么玩

没想到,在 Lovart 里 Nano Banana 还能这么玩

早上六点多,睡眼蒙眬中打开 X,看到了一条 Lovart 的消息。他们已经开始支持 Nano Banana,并且这两天免费访问。

这给我激动坏了,我们公司是 Lovart 的忠实用户,最近产品的视觉设计都已经完全在用 Lovart 来做了。

没想到,Lovart 这么快就支持了 Nano Banana,果然是创业公司的速度,快得让人发自内心地敬佩。

图片

上午,我不知不觉玩了俩小时,然后激动地告诉同事:Nano Banana 也许现在还有很多不完美的地方,但基于这款模型,完全是可能做出来让用户眼前一亮的新产品。

这样吧。我先简单介绍两句 Nano Banana,相信大家或多或少都已经听过。它是谷歌最新一代的图像生成与编辑模型,正式名字叫 Gemini 2.5 Flash Image。

Nano Banana 把人物一致性和指令遵循能力做到了极致。过去用 AI 生成图片,看起来总会有种塑料感,不真实。包括豆包的图像生成模型,用多了之后,一眼就能看出来是 AI 图。但 Nano Banana 生成的图片,已经非常自然和逼真。

而且指令遵循方面,它支持局部的修改,比如剃光头、换发色、调整表情或手势,Nano Banana 能够根据用户的提示词,完成精准的修改。

这一点我相信在图片和视频模型中,绝对是一次重要的突破。更强的指令遵循能力意味着创作效率的大幅提升。新一代的产品马上就要来了。

图片

Lovart 目前已经支持 Nano Banana 模型。我演示下大家就知道有多方便。

在 Gemini 或者 Google AI Studio 中,我们需要挨个上传图片,然后在对话框中表达自己的需求。一方面,上传图片特慢,动不动还提示失败。另外一方面,图片一多,容易乱,而且有时候自然语言也无法精准说清楚自己的需求。

Lovart 的智能画布,相当于是在模型 API 的基础之上,做了一层很厚的交互,把生图的功能带到了实际工作环境。

我相信,这两天多数人使用 Nano Banana 还是纯玩。玩当然没问题,但我觉得,Nano Banana 的真正价值,应该是在工作中替代 PhotoShop。对于生产场景而言,目前的对话框设计,肯定不够。

废话不多说了。直接开始吧。Lovart 的地址是:

https://www.lovart.ai

#01

用 Nano Banana 做露营灯图片

批注完成后,ChatCanvas 会自动识别并执行修改,准确无误地生成我们想要的效果。

这种交互方式简洁而直观,仿佛我们在与一个设计师对话,AI 能够快速理解我们的需求,并在几秒钟内完成调整。有了 Nano Banana 的改图和生图能力后,智能画布 可以实现更好的效果。

相比 Gemini 这样的 ChatBot 产品,ChatCanvas 上传图片特别方便。我们可以从桌面把图片拖拽进来,也可以从其他网站直接复制粘贴进来。

下图中,我从小红书上看到一张不错的图片后,复制,然后快速就能粘贴到 Lovart 的画布中。这个体验,简直太丝滑了。Nano Banana 教程

而且你可以看到,我能够在画布中随性调整图片的位置和大小,怎么方便怎么来。紧接着,点击最下方的评论按钮,框选图片后,输入我的想法,再点击回车,图片就开始生成了。

图片

下图中,最右侧的图片是 Lovart 调用 Nano Banana 生成的。还行吧?

图片

你可能会说,这也没办法体现画布的优势吧?用 Gemini 同样不复杂。

我们继续往前演示你就能明白。我感觉刚刚新生成图片还是不完美,因为没有桌子后,露营的氛围少了一些。我的想法是希望能够保留图二的桌子,同时,把桌子上的东西去掉,只留图一的露营灯。

这操作,在画布中就很容易实现:继续框选图片,输入新的指令就好。

图片

很快,新的露营灯图片生成了:

图片

ChatCanvas 更酷的地方是它可以并行运行。坦白讲,Nano Banana 生成图片还是有些慢。在 Gemini 中我很多时候都得等,等得人心急。

但在 Lovart 的智能画布中,我们框选图片,可以并行地生成很多图片,随心所欲。如下图,我正在并行生成三个图片。

图片

下面这张,效果还不错,我最喜欢。

图片

整体再给大家截图看下,这是我花了一个小时做的露营灯项目,甚至还让高圆圆也拿了这款灯。你可以看到,我轻松地在画布中组合多张图片,生成全新图像。这样的灵活性是 Gemini 等以 Chat 为主的产品做不到的。

今天我这只是做了个简单的 Demo,但在实际工作中,要设计一个露营灯的视觉效果,可能需要处理上百张图片。而 Chat 模式的产品,图片一多,我估计大家都会疯掉。来回上传图片,等待,这得多有耐心的人才能做到。

图片

一张可以无限延伸的画布,天然就适合创造和发散,所以,我觉得 Lovart 选了画布这种交互,应该也是深思熟虑的结果。

但也许你会有所疑惑,这么多图片看着有些凌乱,多了也不好找吧?是的,有这问题。不过,Lovart 的画布提供了一键整理的功能。框选图片之后,如下图,我可以选择排布方式。

图片

选择自动排列后,凌乱的画布,一下子就变得井井有条了:

图片

#02

在 ChatCanvas 中写写画画

视频中,他直接用铅笔标注出来图片怎么修改。这个太酷了。因为有时候,我们没办法用自然语言清楚地表达哪些地方需要修改。这时候,用铅笔直接标注后,再配合文字,更容易准确表达。有点意思。

#03

一个完整的案例

另外一个角度也印证了做垂类 AI 应用的逻辑:把交互做好做厚,同时,接入行业最好的模型。模型会不断发展,而交互则会放大模型的能力。

打开 Lovart 的主页,看到我们熟悉的对话框入口,直接在这里输入我们朴素的需求。

比如,最近我在琢磨想做一场 AI Maker 的大会,但没 Logo,咱们试试让 Lovart 生成。Lovart 它会理解我的需求后,拆解任务,并给我交付一个版本的初稿。

模型部分,我们可以选择 Nano  Banana。

图片

具体过程我不再赘述,。下面是一个简单的 Gif,其实这类产品操作上都没有任何难度。

图片

Logo 的初版方案生成好后,就进入到了我们刚刚讲到的 ChatCanvas 页面。ChatCanvas 的核心是修改。我相信,现在无论哪个 AI 生成的图片,都不会是最终的版本,我们需要花时间调整和优化。

而 Nano Banana 这个模型,最擅长的地方就是根据指令精准地修改图片。

比如我可以在画布中,上传另外一个风格的 Logo,请它参考修改:

图片

#04

写在最后

尽管如此,我之所以兴奋,是因为看到了技术的巨大潜力。Nano Banana 之后,肯定会有更新一代的模型,而且根据以往的经验,其他公司也会迅速跟进。我坚信,到今年年底,用自然语言快速修改图片将变得更加普及和高效。

看到 Lovart 的速度后,我难免有些焦虑。好的模型和好的应用之间还有距离,并不是所有人都能访问到谷歌的产品,也并非所有人都知道怎么生成 3D 手办的提示词。

这中间,也许是有机会的。所谓的苟且红利。而且,像 Lovart 这样,人家基于一个垂类产品构建起的壁垒,在新模型的加持下,只会更强。

新的机会正在涌现。新的产品正在冒出水面。我很喜欢 Lovart 这款产品,有认识他们同学的朋友,记得帮我介绍。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/248821.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月15日 下午4:11
下一篇 2026年3月15日 下午4:12


相关推荐

关注全栈程序员社区公众号