谷歌Gemini 2.5 Flash升级AI修图,多项性能超越GPT-4o

感谢热心网友 @乌蝇哥的左手 提供的消息线索!
8月27日最新消息,科技媒体The Decoder昨日报道称,谷歌DeepMind实验室推出了全新Gemini 2.5 Flash图像生成模型。这款AI工具最大的突破在于——在Gemini应用中只需简单的文字指令,就能精准修改图片内容,同时完美保持人物面部特征和动物外貌的一致性。
据该媒体透露,相较于市面上现有的图像生成工具,Gemini 2.5 Flash在图文匹配度方面优势明显。特别是在多轮图像修改任务中,其表现甚至超越了ChatGPT采用的GPT-4o模型,使其在处理复杂图文编辑任务时更具竞争力。
此次升级最引人注目的就是"角色一致性"技术。无论生成多少张不同场景的图片,人物的面部特征、动物的外貌都能保持惊人的一致度。这项创新特别适合需要批量制作产品宣传图、电商场景图的企业用户,为品牌视觉输出带来革命性改变。
Gemini 2.5 Flash的智能修图功能尤为强大。无需繁琐的手动选区,简单输入文字就能实现背景虚化、瑕疵修复、色彩调整等专业级后期处理效果。
更令人惊艳的是其三图融合技术,能将产品照片与实景照片无缝合成逼真的商用场景图。独特的"风格迁移"功能则可以智能套用纹理、色彩方案,同时保持主体结构的完整性。最厉害的是其因果推理能力,可以模拟气球接近仙人掌后可能发生的物理变化。
目前Gemini 2.5 Flash已正式上线Gemini应用,用户需在模型选择中切换至"Flash"版本才能使用图像编辑功能。所有生成图片都会带有可见水印和隐藏的SynthID数字水印以保护版权。
开发者现在就可以通过Gemini API、Google AI Studio及Vertex AI平台体验这项新技术。按官方定价,每百万输出token收费30美元,单张图像生成成本约为0.039美元。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
苹果M5芯片前瞻:3nm工艺与AI架构驱动性能能效双突破
苹果公司正式推出新一代M5芯片,以显著提升的AI处理能力和能效表现,再次刷新自研芯片技术高度。该芯片将率先应用于新款14英寸MacBook Pro、iPad Pro及Apple Vision Pro
14英寸MacBook Pro M5版10月17日预售,12999元起入手
苹果公司今日在正式推出了搭载最新M5芯片的14英寸MacBook Pro笔记本电脑,起售价为12999元。这款新品将于10月17日上午9点开启预购,正式发售日期定在10月22日。根据苹果正式的介绍,
陈林转型AI教育,字节跳动前高管携银河智学打造小鹿爱学初高中课堂
近日,前字节跳动高级副总裁、教育业务前负责人陈林以全新身份亮相——银河智学创始人。这一消息在其现身香港城市大学为合作项目站台时得到证实,标志着这位互联网行业资深人士正式投身AI教育创业领域。根据香港
阿里AI棋局:夸克难扛大旗,C端短板成隐忧
企业叙事能力,始终是商业竞争中的隐形引擎。它不仅塑造着员工对企业的认同感,更决定了外部市场对企业的价值判断。对于上市公司而言,这种叙事与资本市场的互动尤为紧密——从故事到估值的传导链条,最终会反映在
OPPO Find X9系列加持eSIM技术:影像功能持续引领行业
近日,OPPO Find系列产品负责人通过社交平台透露,即将发布的Find X9系列将推出eSIM版本机型。这一消息正值中国电信eSIM手机业务全面商用之际——10月13日,工信部正式批复中国电信开
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















