北京时间周五凌晨,美国科技公司谷歌宣布上架新一代图像生成模型NanoBanana2,使得高质量图像的生成更快、更便宜、更容易。

作为背景,谷歌于去年8月底首发NanoBanana(Gemini2.5Flash图像模型)。由于其超级逼真的角色一致性,以及突出的自然语言理解和3D建模能力,引发全球网友狂热追捧,一举奠定谷歌在AI应用领域的江湖地位。
去年11月,谷歌趁热推出NanoBananaPro(Gemini3Pro图像模型),允许用户生成更加精细、更高质量的图片,并提供“工作室级别的创作控制”。
根据谷歌的说法,NanoBanana2(即Gemini3.1Flash图像模型)能够兼具NanoBananaPro的图像生成质量、推理能力和先进世界知识,以及Flash模型的“闪电生成速度”。
这意味着一系列曾经专属于“Pro”系列模型的功能下放到最基础的版本。NanoBanana2同样支持最多5个角色的相貌一致及14个物体的忠实呈现。自然语言理解能力的提升,使得模型更精准地捕捉复杂提示词的细微差别,从而生成更贴近想法的图像。

(NanoBanana2生成示例,来源:谷歌博客)新一代产品支持设置各种纵横比和最高4K分辨率,并能提供更生动的光照、更丰富的纹理和更清晰的细节。

(来源:谷歌博客)Pro图像模型的精准文本呈现和多语种翻译能力也得到继承。此前该功能仅限于Gemini订阅用户使用,随着NanoBanana2上架,免费版Gemini用户也能使用该功能。

(来源:谷歌博客)据“大模型竞技场”Arena.ai披露,NanoBanana2上架后即刻登顶文生图榜单的第一位。同时每张图像的成本只有0.067美元,约为NanoBananaPro的一半。

即日起,NanoBanana2已经成为谷歌Gemini、搜索和视频编辑工具Flow中的默认图像模型。NanoBanana2模型将取代Gemini应用中Fast、Thinking和Pro生成功能里的NanoBananaPro选项。