首页
科技
谷歌nano banana上线:单图成本仅0.3元,比OpenAI便宜95%

谷歌nano banana上线:单图成本仅0.3元,比OpenAI便宜95%

热心网友
3334
转载
2025-08-27

昨晚,神秘且强大的图像生成与编辑模型 nano banana 终于正式显露真身。没有意外,它果然来自谷歌,并且也获得了一个正式但无趣的名字:gemini-2.5-flash-image-preview。

据介绍,该模型具有「SOTA 的图像生成与编辑能力、惊人的角色一致性以及闪电般的速度」。

从其名字也可以猜测,谷歌应该还有一个非 flash 的 gemini-2.5-image 模型 —— 其性能应该会更加强大,但速度会更慢。

现目前,gemini-2.5-flash-image-preview 已经在 Google AI Studio 和 Gemini API 中提供了预览。用户可以免费试用。

可以看到,gemini-2.5-flash-image-preview 支持 32k 上下文,提供了温度(可以控制模型的创造力)以及一些高级设置。

然而,遗憾的是,该模型尚不支持对中文输入执行图像生成和编辑,而是会给出文本响应。

另外,在 Gemini 中,用户只需选择 2.5 Flash 并使用合适的提示词,也可以使用该模型。

价格方面,gemini-2.5-flash-image-preview 输入/输出文本的价格是 0.3/2.5 美元,输入/输出图像的价格是 0.3/30 美元。知识截止时间是 2025 年 6 月。

大概计算下来,该模型生成每张图像的成本大约为 0.039 美元(约 0.28 元),远低于 OpenAI 的图像生成成本。

具体功能(尤其是图像编辑)上,谷歌最新博客介绍说他们尤其注重在不同图片间保持人物形象的一致性。

「我们知道,当你编辑自己或熟悉的人时,哪怕是细微的差别都会显得刺眼 ——『差一点但不完全一样』的效果就是感觉不对。正因如此,我们的最新更新专门针对这一点,让你的朋友、家人,甚至宠物,无论是尝试 60 年代的蜂窝头发型,还是给吉娃娃穿上芭蕾舞裙,都能始终看起来像他们自己。」

麻 将

你只需要给 Gemini 一张照片,并告诉它你想要修改的地方,就能加上独特的个人风格。该模型可以帮你把自己和宠物放在同一张照片里,把房间背景换成新壁纸的效果,或者把你带到世界上任何你能想象的地方 —— 同时保持「你就是你」。完成后,你甚至可以把编辑过的照片再次上传到 Gemini,把新图变成一段有趣的视频。

谷歌还分享了一些玩法示例。

换装或换场景:上传一张人物或宠物的照片,该模型会在任何新场景下都保持他们的外貌一致。你可以尝试不同的服装、职业,甚至看看你在另一个年代会是什么样子 —— 但始终还是你自己。

谷歌甚至还专门构建了一个演示模板应用来展示不同年代的你是什么样。

地址:https://aistudio.google.com/apps/bundled/past_forward

合成照片:你现在可以上传多张照片,把它们融合成一个全新的场景。比如,把你和狗狗的照片合成在篮球场上,生成一张完美的合影。

多轮编辑:你可以不断修改 Gemini 生成的图像。比如,从一间空房间开始,先刷墙,再加书架、家具或茶几。Gemini 会一路协助你,只改动你指定的部分,同时保留其余部分。

混合设计:把一张图的风格应用到另一张图的物体上。比如,把花瓣的颜色和质感应用到一双雨靴上,或者用蝴蝶翅膀的花纹设计一件连衣裙。

原生世界知识:该模型还能够利用 Gemini 的世界知识,从而解锁全新的应用场景。为了展示这一点,谷歌在 Google AI Studio 中构建了一个模板应用,它可以将一个简单画布变成交互式教育导师。

地址:https://aistudio.google.com/apps/bundled/codrawing

此外,谷歌还提到所有在 Gemini 应用中生成或编辑的图片都会带有可见水印,以及谷歌的隐形 SynthID 数字水印,以清晰标识它们是 AI 生成的。

该模型一上线就迎来了一波测试热潮,谷歌首席科学家 Jeff Dean 直接以身入局,将自己 P 成了一个足球运动员卡牌角色。

诺奖得主、DeepMind 创始人兼 CEO Demis Hassabis 也来了一张个人形象照。

网友们也是各洒创意,分享了很多有趣结果。

排行榜

gemini-2.5-flash-image-preview 正式上线后不久,各个榜单也开始晒出该模型的成绩表现。

在 Artificial Analysis 图像编辑排行榜上,该模型直接跃升至第一位,获得了 1212 的 ELO 分数。

而在其文生图榜单上,字节跳动的即梦 3.0 和 OpenAI 的 GPT-4o 还有少量优势。

不过,在投票人数更多的 LM Arena 的榜单上,gemini-2.5-flash-image-preview 在这两个任务上都已经成为冠军。

下面展示了在各个指标上更详细的分数,其中 gemini-2.5-flash-image-preview 在角色一致性、创意、图表、事物 / 环境等方面优势明显,而在风格化方面,GPT-4o 目前最为领先。

你已经尝试过 nano banana /gemini-2.5-flash-image-preview 了吗?感觉如何?

参考链接

https://x.com/googleaistudio/status/1960344388560904213

https://blog.google/products/gemini/updated-image-editing-model/

https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新文章

魅族Flyme Auto 2发布:首搭银河M9/领克10EM-P,原生AI架构加持

8 月 20 日消息,在今晚举行的发布会上,吉利推出了其全域 AI 智能座舱,实现一个用户 ID 统一吉利所有品牌车型,银河 M9 和领克 10 EM-P 将首搭 Flyme Auto 2。此外,

2025-08-27.
1248

vivo胡柏山:MR设备可成高效生产力工具,推动行业应用创新

在“vivo 会客厅”活动上,vivo 执行副总裁、首席运营官、vivo 中央研究院院长胡柏山表示,手机设备已经成生产力工具。比如,外卖快递小哥,手机就是最主要的生产力工具。此外通过 AI 大模型,

2025-08-27.
1449

AMD RX 9060显卡确认OEM专供,未来或开放零售

8 月 20 日消息,AMD 昨天在接受韩国媒体 Quasarzone 采访时确认,Radeon RX 9060 显卡目前仅通过整机 OEM 厂商提供,暂不会以独立零售产品形式发售,但不排除未来将

2025-08-27.
1495

路透社最新民调:超七成美国人担忧AI引发永久性失业潮

8 月 20 日消息,路透社今天发布了与 Ipsos 共同发起的最新民调数据,从中获悉,美国人对 AI 可能导致大规模永久失业感到强烈担忧。民调结果显示,71% 的受访者担心 AI 会让过多人永久

2025-08-27.
5704

金山软件2025Q2财报:营收23.1亿元,净利润5.3亿元同比下滑7%

8 月 20 日消息,金山软件今日公布 2025 年第二季度财报。报告期,公司营收 23 074 亿元,同比下降 7%,环比下降 1%。办公软件及服务、网络游戏及其他收益分别占集团 2025 年第

2025-08-27.
5400

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
全民酷跑
全民酷跑 体育竞技 2025-08-27更新
查看
神枪手来了
神枪手来了 动作冒险 2025-08-27更新
查看
战舰猎手
战舰猎手 动作冒险 2025-08-27更新
查看
钓海2
钓海2 休闲益智 2025-08-27更新
查看
阿修罗之眼
阿修罗之眼 动作冒险 2025-08-27更新
查看
异世界转生模拟器2
异世界转生模拟器2 动作冒险 2025-08-27更新
查看
多职业传奇
多职业传奇 角色扮演 2025-08-27更新
查看
战舰猎手小米
战舰猎手小米 动作冒险 2025-08-27更新
查看
战舰猎手
战舰猎手 动作冒险 2025-08-27更新
查看
芭比梦幻屋
芭比梦幻屋 模拟经营 2025-08-27更新
查看