当前位置: 首页
科技数码
“小香蕉”生图模型实测:性能全面超越主流竞品

“小香蕉”生图模型实测:性能全面超越主流竞品

热心网友 时间:2025-08-30
转载

前一阵子,大模型竞技场 LMArena 里面悄咪咪地出现了一个神秘的图片模型 —— nano-banana,在一众生图模型里面乱杀。

这个小香蕉无名无姓,可一旦在 LMArena 抽到它,对手必被吊打。

这个神秘的模型在生图一致性上强得惊人,对提示词的理解和完成度也好得可怕。大伙儿你一票我一票,迅速把它送上了榜单第一位。

就在众人纷纷猜测新模型到底出身哪个高门大户的时候,谷歌 AI Studio 的产品 Leader 跳出来发了一个香蕉,暗戳戳地认领了 nano-banana。

而就在昨天,nano-banana 终于正式上线谷歌 AI Studio,直接去 Gemini 那里就能玩,不用竞技场费事抽卡了。

谷歌在官方博客里是这么秀肌肉的:开局一张脸,以后不管是啥场景,啥服装,啥表情,都能让人一眼看出来你还是你。

把几张照片搓在一起,生成的结果既能保证原来的形象不崩,又能保证新图片看起来不违和。

还能多轮对话改同一张图,每次只改一点点,其它部分就像是妈生原图一样,丝毫不变。

官方的案例看起来是挺吊的,还没玩上的差友也别急,咱这就带大伙儿一起体验一下。

为了感受一下其它模型和 nano-banana 的差距,我们先上 LMArena 去抽了几波卡。

结果是,一共抽了十几轮,只要谜底里有 banana,你一定会盲选 banana。。。有些对比还是非常惨烈的。

像是让人物手里加一根香蕉,右边 seededit 的手崩了,香蕉的颜色也过于鲜艳,和整体画风不搭,但左边基本挑不出啥毛病。

再比如让鲁迅不要抽烟改拿笔,右边这个细节变了一堆不说,笔头还冒着烟呢。

这么看来,nano-banana 比现在的生图模型都强是没啥疑问的。但它具体强在哪些方面呢?我们又去谷歌 Studio 有针对性地测了测。

先说结论,我们觉得 nano-banana 最强的点,是它对图片有了更深入的理解,保证了一致性。而在强一致性的基础上,修图、换风格、做 3D 手办。。。它非常全面,啥都干得挺好。

比如这种一键试穿,需要把平铺的各种服饰 P 到人的身上,而 nano-banana 对细节的把控非常到位。

鞋本来提供的是侧面图,但它画出了正面的样子。服饰上各种 logo 拼的都是对的,甚至 T 恤上原本镜像的 ‘SAINT LAURENT’,在生图的过程中也变回来了。

我们还试了试人脸的不同角度生成,这个效果是真的很厉害。

下面这三张图,只有第一张是真实照片,后面两张都是生成的。

这种面部方向的调整在老模型里是很难实现的,因为要通过一张平面图理解一张立体的脸各个角度长啥样很难,但 nano-banana 的完成度也非常高。

另外,我们还测了一些合照拉郎配。

可以看得出,在这种合照里,它做的不只是把两个人物拼在一起,而是学习到了面部特征。这样生成的新图片即使表情不太样,还是能让人一眼看出这是小马小札。

还有大伙儿最爱的 3D 手办系列,分分钟把 100 多斤的火锅压缩成茶杯犬,化身桌面可爱小摆件,火锅群里的同事们纷纷求出货。

最牛的还属这一张 —— 火锅前阵子右后腿皮肤病剃秃了一块,而生成的图片居然注意到了这一点,一致性真拉满了。

不过有一说一,nano-banana 的图像风格变换比较中规中矩,倒是没啥特别的。

但在这个过程中,我们发现它不光在处理图片,还在偷偷 “ 认人 ”。

像是下面这张图,在我们没有告诉谁是谁的情况下,它还是认出来左边是搞火箭的马斯克,右边是 META 的扎克伯格。

我们又试了几个地标开盒,看看它有没有 GPT 那样的推理能力。

但实际上它只在地标建筑物上比较好使,更像是图像识别 + 记忆检索,只能说有一点推理能力,但不多。


左 nano-banana 答错,右 GPT 5 Thinking 答对

除了上述的优点,它的缺点其实也不少。。。最大的问题就是,谷歌好像给它做了不少安全性调教,经常这也不行,那也不行,有时候真摸不清哪个关键词又触犯天条了。

其次是对提示词要求比较高,往好了说,是 nano-banana 对提示词的遵循能力强,但实际上对用户来讲,得多花不少时间打磨提示词,有点折磨。

谷歌自己也表示,别让 Gemini 猜你的心思,有啥想要的尽管说出来。

所以要是出来的效果不好,写提示词的时候就得尽量详细一些,什么要动,什么不要动通通列明白,才能保证强一致性。

最后,比起咱心目中的 P 图白月光 FLUX,它在局部小范围修图上效果还是差了一点,所以还是建议大伙儿精修找 FLUX,上面各种整大活儿再用 nano-banana。


左原图,中 nano-banana,右 FLUX

总的来说,nano-banana 强就强在它对图片的理解能力是目前最好的,而且各种任务上的一致性都不错,没有大短板。

更大的好消息是,小香蕉已经被整合进了 2.5 Flash 版本,即使没有 pro 会员,免费的账户也可以使用。

只要左上角选择 2.5 Flash,对话框 tools 选择 Image 即可。

LMAreana 上也依然可用,只要 prompt 开头输入 “ 使用 nano-banana 模型生成 ” ,有极高概率可以抽到。

或者有些整合网站像是 LibLib,Fal-ai 等等也有第三方提供的 nano-banana。

感兴趣的差友赶紧去试试吧,欢迎回来评论区返图哦。

来源:https://news.mydrivers.com/1/1071/1071121.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
理想新车布局预测:L9L与i9上半年发布

理想新车布局预测:L9L与i9上半年发布

1月23日消息,综合权威公开信息与行业趋势研判,理想汽车2026年度新车布局规划正式曝光。此番产品线布局,不仅持续深耕SUV市场,同时加速补齐全场景覆盖的拼图。 理想L9旗舰SUV 在增程动力领域,理想L系列将迎来一位新成员——L9L,预计2026年上半年正式上市,预估售价区间为45万至55万元。与

时间:2026-07-04 12:35
三星消息应用7月停用 部分旧设备可继续使用

三星消息应用7月停用 部分旧设备可继续使用

6月29日,多家海外媒体援引三星官方消息证实,三星消息(Samsung Messages)应用将于2026年7月正式终止服务。随着这个截止日期越来越近,依然在使用该应用的Galaxy用户需要尽快迁移到新的默认信息工具。其实过去两年里,三星一直在悄悄引导用户转向谷歌信息(Google Messages

时间:2026-07-04 12:35
吉利发布2030战略:年销650万辆全面迈向全球前五

吉利发布2030战略:年销650万辆全面迈向全球前五

1月22日,吉利控股集团在北京召开战略解析大会,正式发布“一个吉利,全面领先”的2030战略蓝图。战略目标清晰明确:到2030年,全球总销量(含乘用车与商用车)突破650万辆,稳居全球车企前五。其中,新能源车型占比预计达到75%左右,海外销量占比超过三分之一。尤为关键的是,依托全新全球化架构,单车型

时间:2026-07-04 12:35
OPPO Find X9系列旗舰手机累计销量突破250万部Ultra版超12万部

OPPO Find X9系列旗舰手机累计销量突破250万部Ultra版超12万部

OPPO Find X9 Ultra 旗舰机型 回顾产品发布背景:Find X9系列于2025年10月正式登场,作为OPPO年度旗舰产品线,涵盖标准版、Pro版与Ultra版三大版本。该系列的核心竞争力十分明确——影像系统与综合性能的双重显著提升。上市以来,凭借芯片算力、屏幕显示素质、续航表现以及影

时间:2026-07-04 12:35
IntelliJ IDEA 2025.3.2 版本正式发布

IntelliJ IDEA 2025.3.2 版本正式发布

IntelliJ IDEA 2025 3 2 版本现已正式发布。除了常规的漏洞修复与功能完善,本次更新有几个修复点值得格外关注——特别是如果你经常使用终端工具执行命令,或者正在采用远程开发工作流。终端工具窗口的闪烁问题终于得到彻底解决。此前在调用支持同步输出的命令行工具(例如 Claude Code

时间:2026-07-04 12:34
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜