谷歌Gemini 2.5 Flash升级AI修图,多项性能超越GPT-4o

8月27日消息,科技媒体The Decoder于昨日(8月26日)发布博文称,谷歌DeepMind推出了新一代Gemini 2.5 Flash图像编辑模型。该模型集成于Gemini应用中,用户可通过文字指令对图像进行高精度修改,同时保持人物或动物的外观一致性。
据博文介绍,与之前的原生图像生成工具相比,Gemini 2.5 Flash在基于文字修改图像方面表现出更高的准确性,甚至在多项任务中超越了ChatGPT所使用的GPT-4o模型,使其能够更出色地完成复杂文本驱动的图像编辑。
新模型的一大亮点是其“角色一致性”功能。在生成多张图像时,即便人物的姿态、背景环境或光照条件发生变化,模型仍能保持同一人物、动物或物体的外观特征不变。这一特性尤其适合用于创作系列照片、多角度产品展示,可为品牌素材和产品目录的批量制作提供便利。
Gemini 2.5 Flash支持精准的局部文本编辑,用户无需手动框选区域,即可实现背景虚化、瑕疵修复、色彩添加或物体移除等操作。
该模型还具备多图像融合能力,可一次性合并最多三张图像,例如将产品图像与室内场景结合生成逼真的视觉效果。此外,“风格迁移”功能支持将某种纹理、色彩或图案应用到另一物体上,同时保持其原有形状与细节。“现实推理”能力则可模拟简单因果关系,例如呈现气球飞向仙人掌及其后续情景。
目前,Gemini 2.5 Flash已在Gemini应用中正式上线。用户需将模型切换至“Flash”模式方可使用图像编辑功能,所有生成的图像均会附带可见水印及不可见的SynthID数字水印。
开发者现可通过Gemini API、Google AI Studio及Vertex AI平台体验该模型,其定价为每百万输出token 30美元,单张图像的处理成本约为0.039美元。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
Redmi Note 15 Pro系列首发400%大音量模式,配备1115对称双扬声器,响度达82.5dB
8 月 19 日消息,小米 REDMI Note 15 Pro 系列手机发布会已定档 8 月 21 日晚 7 点。据最新介绍,新机具备“真抗摔”及“真防水”属性,并在屏幕、续航、通信诸多方面实现“
2026款哈弗猛龙上市:15.38万起售,搭载第二代Hi4技术
8 月 19 日消息,在今天的哈弗汽车发布会中,2026 款哈弗猛龙车型正式登场,该车主要调整外观造型,车内改用怀挡,搭载第二代 Hi4 技术,新增 35 43 千瓦时电池包,限时优惠换新价 15
鸿蒙智行享界S9T旅行车首发32.8万起,24小时订单破2万台
8 月 19 日消息,鸿蒙智行首款旅行车享界 S9T 已于昨日 10:08 开启预订,新车搭载华为乾崑智驾 HUAWEI ADS 4、全系满配空气悬架 + 连续可变阻尼减震器 CDC + 华为途灵
英伟达专为中国市场打造新款AI芯片,性能超越H20
北京时间 8 月 19 日,据路透社报道,知情人士称,英伟达正在为中国市场开发一款基于其最新 Blackwell 架构的新型 AI 芯片,这款芯片性能将强于当前获准在中国销售的 H20。美国总统特朗
OPPO Find X9 Pro相机升级:哈苏三摄+48%进光量提升,长焦达2亿像素
8 月 19 日消息,科技媒体 SmartPrix 今天(8 月 19 日)发布博文,分享了一组渲染图,展示了 OPPO Find X9 Pro 手机,国内预估 9 月或 10 月发布,印度版预估
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
















