面包屑图标 当前位置: 首页
AI资讯
热点详情

Gemini文本提示编辑图片功能上线

AI热点日报
AI热点日报时间:2026-07-03
热点解读

Google在昨天放出了Gemini 2 0 Flash Experimental的更新,这一波多模态能力的提升确实让人眼前一亮。用一句话概括:它现在可以用语言对一张图片进行持续编辑和调整,而且风格能保持高度一致,图像也不会出现畸变。更让人意外的是,Google AI Studio的产品经理还透露,

Google在昨天放出了Gemini 2.0 Flash Experimental的更新,这一波多模态能力的提升确实让人眼前一亮。用一句话概括:它现在可以用语言对一张图片进行持续编辑和调整,而且风格能保持高度一致,图像也不会出现畸变。更让人意外的是,Google AI Studio的产品经理还透露,这个模型可以直接对视频链接进行对话分析——也就是说,你扔给它一个油管链接,它能跟你聊视频里发生了什么。

下面展示几个测试案例,从实际效果来看,确实很惊艳。不仅能够持续对一张图片做修改,还能直接输入视频链接,识别链接中视频的内容。

给美女带上项链

上传一张美女照片,然后给出指令。第一次生成的项链不是珍珠项链,于是追加一条新指令:把项链改成白色珍珠。效果非常棒!

更进一步,是不是可以把两张照片组合起来?比如一张产品实物图,一张模特图,让产品佩戴在模特身上——这效果简直绝了!

它能够准确识别两张图片,并按照输入的要求进行组合。只提了一个要求:将第一张图中的项链佩戴到第二张图中的女孩脖子上。这直接抢了P图软件的饭碗啊。

油管视频链接问答

从油管上找了一个Google AdSense网站审批视频的教程链接,直接喂给Gemini。它花了一分钟总结了这个视频在讲什么。

为了验证它是不是真的理解了视频内容,而不是只提取了音轨,继续追问了一个细节:视频中间出现了几个人?他们穿的什么衣服?回答结果非常准确。看得出它确实理解了视频中的视觉信息。

如何使用

进入Google AI Studio,但需要有一个美国IP,而且不是家宽袋里,否则无法打开。地址如下:

https://aistudio.google.com/

选择Gemini 2.0 Flash Experimental,并将输出格式选为Images and text



热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Gemini文本提示编辑图片功能上线要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/MultimodalLargeModel/2025031541683.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-03 20:42
AI驱动的员工英语口语教练Lucida

LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。

AI热点2026-07-03 20:42
Screenshot2Code:截图转代码工具

Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。

AI热点2026-07-03 20:42
SpeakStruct 语音转结构化数据 可自定义模板

SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。

AI热点2026-07-03 20:41
AI驱动语音治疗应用 IzzyAI

IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。

延伸阅读