谷歌生成式AI团队发布了Nano-Banana的首个官方教程——《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。核心信息是如何用 Nano-Banana Pro 制作专业级的素材!

Nano-Banana Pro 相较于前一代模型是一次重大飞跃,从“有趣”的图像生成迈向“实用”的专业素材制作。它在文本呈现、角色一致性、视觉合成、世界知识(Search)和高分辨率(4K)输出方面表现出色。

以下是谷歌团队的官方指南:



附教程地址:

x.com/GoogleAIStu…

本文内容概览:

  • 提示词黄金法则
  • 文本渲染、信息图与视觉合成
  • 角色 一致 性与 吸睛的 缩略图
  • 基于 Google 搜索的现实锚定
  • 高级编辑、修复与上色
  • 维度转换 (2D ↔ 3D)
  • 高分辨率与纹理
  • 思考与推理
  • 一次性分镜与概念艺术
  • 结构控制与布局引导

一 、 Nano-Banana Pro的 提示词黄 金法则

Nano-Banana Pro 是一个 “会思考”的模型 。它不仅仅是匹配关键词,它能理解你的意图、 物理规律和画面构图 。要 想 获得最佳效果,请停止通过 “标签堆砌” (例如:狗, 公园, 4k, 真实感)来抽卡,开始 像一位创意总监那样去下达指令 。

1、编辑,不要重新抽卡

该模型非常擅长理解对话式的修改指令。如果生成的图片有 80% 是正确的, 不要 从头重新生成,直接告诉它你需要调整哪里。

2、使用自然语言和完整句子

像在向一位人类艺术家汇报一样与模型对话, 使用正确的语法和描述性形容词。

3、具体且有描述性

模糊的提示词只会带来平庸的结果, 定义主体、环境、光照和情绪。

4、提供上下文(“为什么”或“给谁看”)

因为模型会“思考”, 给它提供上下文 有助于它做出合乎逻辑的艺术决策。


二、 文本渲染、信息图表与视觉合成

Nano-Banana Pro 在渲染清晰、风格化的文本以及将复杂信息转化为视觉格式方面拥有 SOTA(当前最佳)的能力。

最佳实践:

  • 压缩:要求模型将密集文本或 PDF “压缩”成视觉辅助材料。
  • 风格:明确指定你想要的风格,如“精致的编辑风”、“技术图表”或“手绘白板”效果。
  • 引用:明确指定你想要的文本, 用引号括起来。

示例提示词:

财报信息图(数据输入)



复古信息图 :



技术图表:



白板总结(教育类):



三、角色 一致性与吸睛的缩略图

Nano-Ba nana Pro 最多支持 14 张参考图像 (高保真模式下为 6 张) 。 这使得“身份锁定”成为可能 ——将特定人物或角色放入新场景中而不会出现面部扭曲。

最佳实践:

  • 身份锁定:明确说明:“保持人物的面部特征与图像 1 完全相同。”
  • 表情/动作: 在保持身份特征的同时描述情绪或姿势的变化。
  • 病毒式构图: 在一次处理内将主体与醒目的图形和文字结合。

示例提示词:



“毛绒伙伴”场景(群体一致性)

[输入 3 张不同毛绒玩偶的图片]



品牌资产生成:

[输入 1 张产品图像]



四、 基于 Google 搜索的现实锚定

Nano-Ba nana Pro 可以利用 Google 搜索,基于实时数据、时事或事实核查生成图像, 从而在时效性话题上减少幻觉。

最佳实践:

  • 要求 对 动态数据(天气、股票、新闻)进行可视化。
  • 模型在生成图像之前“思考”(推理)搜索结果。

示例提示词:

事件可视化:



五、高级编辑、修复与上色

模型擅长通过对话式提示进行复杂编辑。这包括“ 图像修补 ”(移除/添加对象)、“修复”(修复老照片)、“上色”(漫画/黑白照片)和“风格转换”。

最佳实践:

  • 语义指令 :你不需要手动遮罩;只需自然地告诉模型要更改什么。
  • 物理 理解: 你可以提出复杂的更改请求, 例如“把这个 杯子装满液体”来测试物理生成能力。

示例提示词:

对象移除与图像修补:



漫画/连环画上色:

[输入黑白漫画分镜]



本地化(文本翻译 + 文化适配)

[输入伦敦公交车站广告图像]



光线/季节控制:

[输入一张夏季房屋图像]



六、维度转换 (2D ↔ 3D):

Nano-Ba nana Pro一项强大的新功能是将 2D 示意图转换为 3D 可视化效果,反之亦然,非常适合室内设计师、建筑师和表情包创作者。

示例提示词:

2D 平面图转 3D 室内设计板:



2D 转 3D 表情包转换:



七、高分辨率与纹理

Nano-Banana Pro 支持原生 1K 至 4K 图像生成。这对于细节纹理或大幅面打印特别有用。

最佳实践:

  • 如果你的 API/界面允许,请明确要求高分辨率(2K 或 4K)。
  • 描述高保真细节(瑕疵、表面纹理)。

示例提示词:

4K 纹理生成:



复杂逻辑(思考模式):



八、思考与推理

Nano-Banana Pro 默认采用“思考”过程,在渲染最终输出前会生成临时的思考图像(不收费)来细化构图。 这样可以进行数据分析并解决视觉问题。

示例提示词:

解方程:



视觉推理:



九、 一次性分镜与概念艺术

Nano- Banana Pro 支持 在一次会话中生成连续画面或分镜而无需使用网格,确保叙事连贯流畅。 这也常用于“电影概念艺术”(例如,即将上映 电影的虚假泄露图)。

示例提示词:



十、结构控制与布局引导

输入图像不限于角色参考或待编辑的主体。你可以用它们来严格控制最终输出的构图和布局。 这对于需要将草图、线框图或特定网格布局转化为精美资产的设计师来说是革命性的。

最佳实践:

  • 草稿与 草图: 上传手绘草图以精确指定文本和对象应放置的位置。
  • 线框图:使用现有布局或线框图的截图来生成高保真 UI 模型。
  • 网格:使用网格图像强制模型为基于图块的游戏或 LED 显示屏生成 素材。

示例提示词:

草图转最终广告:



线框图转 UI 模型:



像素艺术与 LED 显示屏:

(提示:开发人员随 后可以 以编程方式 提取每个单元格的中心 颜色,来驱动连接的 64x64 LED 矩阵显示屏)。



精灵图集:

(提示:你可以随后提取每个单元格并制作 GIF 动画)。



作者 GitHub: github.com/NLP-LOVE

微信公众号:



本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:alixiixcom@163.com