谷歌Gemini 2.5 Flash升级AI修图,多项性能超越GPT-4o

8月27日消息,科技媒体The Decoder于昨日(8月26日)发布博文称,谷歌DeepMind推出了新一代Gemini 2.5 Flash图像编辑模型。该模型集成于Gemini应用中,用户可通过文字指令对图像进行高精度修改,同时保持人物或动物的外观一致性。
据博文介绍,与之前的原生图像生成工具相比,Gemini 2.5 Flash在基于文字修改图像方面表现出更高的准确性,甚至在多项任务中超越了ChatGPT所使用的GPT-4o模型,使其能够更出色地完成复杂文本驱动的图像编辑。
新模型的一大亮点是其“角色一致性”功能。在生成多张图像时,即便人物的姿态、背景环境或光照条件发生变化,模型仍能保持同一人物、动物或物体的外观特征不变。这一特性尤其适合用于创作系列照片、多角度产品展示,可为品牌素材和产品目录的批量制作提供便利。
Gemini 2.5 Flash支持精准的局部文本编辑,用户无需手动框选区域,即可实现背景虚化、瑕疵修复、色彩添加或物体移除等操作。
该模型还具备多图像融合能力,可一次性合并最多三张图像,例如将产品图像与室内场景结合生成逼真的视觉效果。此外,“风格迁移”功能支持将某种纹理、色彩或图案应用到另一物体上,同时保持其原有形状与细节。“现实推理”能力则可模拟简单因果关系,例如呈现气球飞向仙人掌及其后续情景。
目前,Gemini 2.5 Flash已在Gemini应用中正式上线。用户需将模型切换至“Flash”模式方可使用图像编辑功能,所有生成的图像均会附带可见水印及不可见的SynthID数字水印。
开发者现可通过Gemini API、Google AI Studio及Vertex AI平台体验该模型,其定价为每百万输出token 30美元,单张图像的处理成本约为0.039美元。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
乐道L90七座版8月29日全国60城静态品鉴,即将到店
8 月 28 日消息,乐道汽车最新昨日晚宣布,乐道 L90 七座版车型即将到店,将于 8 月 29 日 10:00 起在全国超 60 个城市开启静态品鉴。从最新公布的全国静态品鉴点位一览表来看,乐
蚂蚁森林9年种树6.19亿棵,蚂蚁集团累计捐资超45亿元
8 月 27 日消息,今日蚂蚁集团公布了生态公益项目“蚂蚁森林”的最新数据:自 2016 年 8 月项目启动以来,9 年来蚂蚁森林已在全国各地捐资种下了 6 19 亿棵树,其中 9 成以上种在“三
英伟达发布GB10超级芯片:3nm工艺、20核CPU、1000 TOPS AI算力,专为桌面AI工作站打造
8 月 27 日消息,科技媒体 WccfTech 昨日(8 月 26 日)发布博文,报道称在 Hot Chips 2025 上,英伟达详细介绍了 GB10 超级芯片,该芯片基于台积电 3nm 工艺
标致新款E-308/E-308 SW亮相:设计更动感,续航达450公里
8 月 27 日消息,标致今天推出了 E-308 和 E-308 SW 的改款车型,并在车型名称中将“E”大写,以凸显其电动车身份(注:绿色两厢车为 E-308,蓝色旅行车为 E-308 SW)。
知乎2025年Q2扭亏为盈,利润率提升成战略重心,收入降23%仍实现盈利
IT 之家 8 月 27 日消息,知乎今日发布截至 2025 年 6 月 30 日止季度未经审计财务业绩:2025 年第二季度的总收入为人民币 7 169 亿元,而 2024 年同期则为人民币 9
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
















