您的位置: 首页> 新闻资讯> Gemini Nano Banana 提升了企业大规模图像编辑的一致性和可控性——但并非完美无缺

Gemini Nano Banana 提升了企业大规模图像编辑的一致性和可控性——但并非完美无缺

时间:2025-08-27 13:00:03 来源:互联网

谷歌发布Gemini 2.5 Flash Image(许多测试用户称之为nanobanana的新模型),为企业创意项目提供更多选择。相比前代模型,它能更快速、更精准地批量修改图像风格。

该模型将直接集成至Gemini应用。

基于Gemini 2.5 Flash架构的升级版,显著增强了Gemini应用原生图像编辑功能。Gemini 2.5 Flash Image能保持角色特征在不同图像中的一致性,编辑过程更稳定。例如用户上传宠物照片后,若要求更换背景或给狗狗添加帽子,模型会精准执行指令而不改变主体特征。

"我们深知,当编辑自己或熟悉人物的照片时,细微偏差都会影响体验——'相似但不完全相同'的呈现会让人不适。"谷歌在由Gemini应用多模态生成负责人David Sharon与DeepMind Gemini图像产品主管Nicole Brichtova联合撰写的博客中强调,"因此本次更新重点确保亲友乃至宠物的照片都能保持高度特征一致性。"

企业和部分用户曾抱怨,AI生成图像在微调时容易出现过度变异。例如指令调整人物位置时,模型虽完成任务,却可能导致面部特征偏移。

所有Gemini生成图像都将携带谷歌SynthID水印。该模型面向Gemini应用全体用户开放(含免费版)。

社交媒体热潮

关于谷歌新图像模型的猜测在社交平台持续发酵。LM Arena用户发现代号nanobanana的神秘模型能"以惊人准确度完成复杂多步指令",正如Andreessen Horowitz合伙人Justine Moore在推文所述。

早期测试者证实该模型出自谷歌,但当时官方未回应其在LM Arena的具体规划。

直至本周模型发布,此前的种种猜测某种程度上可谓预言成真。

这场热潮折射出模型供应商在生成逼真图像及精准编辑方面的激烈竞争,彰显多模态模型的突飞猛进。

但谷歌仍需应对Qwen新推出的Qwen-Image Edit等竞品,以及为ChatGPT集成原生AI图像编辑并开放API的OpenAI。

图像编辑领域传统巨头Adobe早已将旗舰模型Firefly植入Photoshop等专业平台。

原生图像编辑

Gemini三月份即已向免费用户开放聊天平台的原生AI图像编辑功能。

内置图像编辑器让企业用户无需切换窗口即可修改图表。

用户上传照片后,通过自然语言指令完成编辑,满意后可重新上传生成视频。

除常规的服装替换和场景变更外,Gemini 2.5 Flash Image还支持多图融合、多轮编辑及跨图像风格迁移。

上一篇:AWS、微软和谷歌联合支持Linux Foundation的DocumentDB数据库,旨在降低企业成本并减少供应商锁定 下一篇:全汉推出 VITA PM 电源:主流级白金牌全模组,至高 1000W 功率

相关文章

相关应用

最近更新