当前位置: 首页
AI
一夜变天:GPT-Image-2流出,昔日王者Nano Banana Pro要被拉下神坛?

一夜变天:GPT-Image-2流出,昔日王者Nano Banana Pro要被拉下神坛?

热心网友 时间:2026-04-22
转载

OpenAI下一代多模态模型疑似曝光:文字渲染能力“强到离谱”,谷歌迎来真正对手?

这几天,AI圈子又被一则泄露消息搅动了。不少眼尖的研究者发现,OpenAI似乎正在大模型竞技场Chatbot Arena,用多个略显古怪的代号,悄悄测试其新一代多模态模型。可惜的是,当你看到这篇文章时,相关测试入口已经悄然下线,给外界留下了更多的猜测空间。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

OpenAI的图像生成模型,终于要迎来重大更新了吗?算算时间,距离上一代GPT-Image-1.5的推出,已经过去了将近四个月。对于这个日新月异的领域来说,四个月足以发生很多事情。

今天,关于GPT-Image-2的各种讨论和疑似生成效果图,在海外技术社区彻底传开了。

从那些已经流传开的生成Demo来看,最让人瞠目结舌的,莫过于模型在文字渲染能力上的表现。那种精准度和自然度,确实强得有些惊人。

根据目前流出的更多信息,这款疑似GPT-Image-2的模型,曾在测试平台上使用过「maskingtape-alpha」、「gaffertape-alpha」和「packingtape-alpha」这几个充满“胶带”特色的代号。除了前面提到的惊人文字渲染力,它在世界知识理解方面的表现也相当突出。从一些测试结果看,其整体水平或许已经对谷歌的Nano Banana Pro构成了实质性挑战。

例如,它能生成高度精细的人体解剖学前视图,细节把控颇为到位:

社区里的反应相当热烈。有用户直接感叹道:“天哪,OpenAI的GPT-Image-2简直要碾压一切了。还记得以前吗?大家几乎都在嘲笑GPT的图像模型,因为它连一张准确的世界地图都画不出来。但现在,那个时代似乎真的过去了。眼下,它生成的YouTube风格界面图片,几乎已经达到了以假乱真的地步。这进步幅度,确实有些夸张。”

这种感受并非个例。另一位观察者的评论或许点出了关键:“几乎没人意识到,我们可能在一夜之间见证了一次范式转变。过去,我们测试模型还停留在生成单一对象的阶段;而现在,测试对象已经变成了信息密度极高的整张网页。更关键的是,模型居然能完成其中约90%的还原与理解。这一切,竟然都发生在2026年初。”

此外,一个长期被用户诟病的问题似乎也得到了解决。有消息指出:“OpenAI这次终于要解决GPT Image系列模型固有的‘黄色滤镜’问题了。如果属实,这一代模型很可能会一跃成为当前最好的图像模型。”

在图像编辑的一致性上,改进也相当明显。“相比前代V1.5,GPT-Image-2在编辑过程中间出现偏离原图的问题已经显著改善。从对比图可以清晰看到,除了为版权保护而添加的、肉眼不可见的背景噪声水印,编辑后的图像与原图几乎没有任何可察觉的差异。”

甚至出现了一些有趣的“民间鉴定法”。比如:“观察山姆·奥特曼的自拍图,如果生成结果看起来真的非常像他本人,那基本可以确定是Image-2;如果只是有些滑稽的粗略模仿,那大概率还是老的Image-1.5。” 从流出的对比图来看,社区的判断不无道理。

综合来看,技术社区对OpenAI这款新一代图像模型的表现,给出了相当高的认可度。

更多网友实测,Nano Banana Pro 慌了吗

除了在竞技场的集中测试,迹象表明,GPT-Image-2似乎已经开始向一部分ChatGPT用户进行小范围的灰度测试。

随着更多实测结果的流出,对比的声音也越来越强。有用户直接断言:“Nano Banana Pro被彻底碾压了,GPT-Image-2在各个方面都完成了超越。” 下面这张涉及复杂场景和文字的海报生成对比,似乎佐证了这一观点。

甚至还出现了一些 playful 的创作,比如让奥特曼与马斯克“历史性同框”,展示了模型在理解和组合概念上的能力。

更深入的评价来自业内观察者:“这个模型在图像的真实感和内置文字生成能力上,表现都极其出色。可以说,DeepMind在图像生成领域,终于迎来了一个真正重量级的竞争对手。接下来几个月,非常期待看到它与传闻中的Nano Banana Pro 2进行正面对比,那一定会相当精彩。”

另外,模型的图像增强能力也备受关注。“GPT-Image-2展现出将低分辨率图片提升为高清效果的能力,同时还能有效去除背景中的干扰纹理、异常滤镜以及水印。处理后的图像在画质和观感上,相比原图都有显著提升。” 下面的修复效果对比,直观地展示了这一进步。

尽管目前流出的仍是测试版本的信息,但足以吊起整个行业的胃口。看来,所有人都在等待它的正式登场,届时,图像生成领域的竞争格局,恐怕将迎来新的变数。

来源:https://www.51cto.com/article/839995.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
研究发现:同时使用过多 AI 工具实际上会降低工作效率,并导致“大脑疲劳”

研究发现:同时使用过多 AI 工具实际上会降低工作效率,并导致“大脑疲劳”

警惕“AI脑疲劳”:多工具并行背后的效率陷阱 人工智能工具在提升工作效率方面的潜力有目共睹,但企业管理者们似乎需要踩一脚刹车,重新审视“越多越好”的堆叠式使用策略。过度依赖和同时调度多个AI工具,反而可能将员工推入一种新型的职业困局。 这一警示并非空xue来风,其根源来自《哈佛商业评论》近期发表的一

时间:2026-04-22 18:04
美的发布“三个一”战略及 MevoX 家居智能体,未来三年将投 600 亿深耕 AI 与具身智能等前沿领域

美的发布“三个一”战略及 MevoX 家居智能体,未来三年将投 600 亿深耕 AI 与具身智能等前沿领域

美的发布“三个一”战略及MevoX家居智能体,未来三年将投600亿深耕AI与具身智能等前沿领域 3月10日,以“智美万象”为主题的美的2026全屋智能战略发布会在上海举行。这次发布会,可以说为智能家居行业勾勒出了一幅相当清晰的未来图景。会上,美的正式亮出了其全屋智能的“三个一”战略、自进化家居智能体

时间:2026-04-22 18:04
曝腾讯正开发“绝密级”微信 AI 智能体:年中启动灰测,能操控全平台数百万小程序

曝腾讯正开发“绝密级”微信 AI 智能体:年中启动灰测,能操控全平台数百万小程序

曝腾讯正开发“绝密级”微信 AI 智能体:年中启动灰测,能操控全平台数百万小程序 一则来自《The Information》的报道,在行业里激起了不小的涟漪。根据他们3月10日的消息,腾讯内部似乎正在进行一项“绝密级”的AI智能体项目,而它的主战场,正是我们每天离不开的微信。 报道援引了四位知情人士

时间:2026-04-22 18:04
谷歌首个原生多模态嵌入模型 Gemini Embedding 2 发布:能让机器“理解”信息

谷歌首个原生多模态嵌入模型 Gemini Embedding 2 发布:能让机器“理解”信息

谷歌发布首个原生多模态嵌入模型 Gemini Embedding 2:让机器真正“理解”多元信息 北京时间今天凌晨,谷歌扔出了一枚重磅技术冲击波——全新的 Gemini Embedding 2 模型正式发布。这可不是一次简单的迭代,它是谷歌首个原生的多模态嵌入模型。简单来说,从此以后,文字、图像、视

时间:2026-04-22 17:58
受 AI 及裁员等因素影响,2 月美国科技从业者信心再度下滑

受 AI 及裁员等因素影响,2 月美国科技从业者信心再度下滑

3 月 11 日消息:美国员工信心再度下滑,科技行业“寒冬”持续 据《商业内幕》今日报道,美国职场情绪在年初并未迎来回暖。今年2月,员工对公司的信心指数再次掉头向下,而其中,科技从业者的悲观情绪显得尤为突出。 招聘与职场评价平台Glassdoor每月发布的员工信心指数,一直是观察职场情绪变化的温度计

时间:2026-04-22 17:57
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程