当前位置: 首页
AI
谷歌Gemini Omni全能模型发布支持任意输入输出可一句话修改视频

谷歌Gemini Omni全能模型发布支持任意输入输出可一句话修改视频

热心网友 时间:2026-05-20
转载

2026年5月20日,在备受瞩目的谷歌I/O开发者大会上,Gemini模型家族迎来了其里程碑式的新成员——Gemini Omni。正如其名“Omni”(意为“全能”)所揭示的,这款新一代人工智能模型致力于彻底打破文本、图像、音频与视频之间的模态界限,实现真正的跨模态理解与创作。

谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 AI 修改视频

Google DeepMind负责人、诺贝尔物理学奖得主德米斯·哈萨比斯(Demis Hassabis)在主题演讲中着重指出,Gemini Omni在理解和处理文字、图片、视频、音频等多种信息格式时,展现了突破性的流畅性与深度。其最核心的突破被定义为“支持任意模态输入,并生成任意模态输出”,这一特性预示着生成式AI应用场景的巨大扩展。

大会现场演示了一个生动的应用实例:对话式智能视频编辑。用户仅需向AI输入一句简单的自然语言指令(例如“将视频中的主角外套换成蓝色”或“把背景替换为都市夜景”),模型便能精准理解并执行对视频内容的修改。这标志着视频剪辑与内容创作的门槛有望被进一步显著降低。

即刻可用的轻量版本

与全能架构一同亮相的,还有该系列首个即用型模型:Gemini Omni Flash。这款轻量级模型已于发布当日,在Gemini App、Google Flow及YouTube Shorts等谷歌核心产品中集成上线,为用户提供初步却强大的多模态交互功能。谷歌同时承诺,即将面向广大开发者开放相应的API接口服务,以便将Gemini Omni的先进能力更广泛地集成到各类第三方应用与解决方案中。

此次Gemini Omni的发布,无疑为全球多模态人工智能技术的发展设立了新的标杆。其在实际应用中的性能表现与生态影响,将成为业界持续关注的焦点。

来源:https://www.ithome.com/0/952/519.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
豆包AI多文档对比分析功能使用指南

豆包AI多文档对比分析功能使用指南

工作中,你是否遇到过这样的困扰:明明把好几份文档都上传给了豆包AI,但它却只针对单个文件给出回应,完全没法帮你横向对比不同版本之间的差异?这通常是因为没有触发它的多文档协同分析机制。别急,掌握下面这几条清晰的结构化指令路径,你就能轻松让豆包AI化身高效的“文档找茬专家”。 一、上传多个文档后发起跨文

时间:2026-05-20 08:36
Vidu制作产品宣传视频的完整步骤与技巧

Vidu制作产品宣传视频的完整步骤与技巧

想用AI视频工具快速做出专业感十足的产品宣传片,但担心自己没剪辑基础、时间又紧?Vidu提供的几种路径,或许能帮你高效解决问题。它主要支持文生视频、图生视频、参考生视频以及直接套用模板库这四种方式,每种都对应不同的素材起点和创作需求。 一、使用文生视频功能制作产品宣传视频 当你已经有了清晰的文案构思

时间:2026-05-20 08:35
海螺AI写简历与求职信的实际效果评测

海螺AI写简历与求职信的实际效果评测

借助AI工具高效生成简历和求职信已成为趋势,但关键在于如何确保产出内容具备专业深度、精准匹配岗位需求,而非流于通用模板。这需要系统性地把控内容适配性、岗位关联度及行业语言的专业性。以下,我们将通过一套可操作的完整路径,系统解决这一问题。 一、从AI初稿到人工精修:构建扎实的内容基底 第一步的核心策略

时间:2026-05-20 08:35
通义万象AI写真效果实测:自然度与真实感深度解析

通义万象AI写真效果实测:自然度与真实感深度解析

通义万相推出的“写真馆”功能,已成为众多用户体验AI肖像生成的热门工具。其生成的写真整体效果出色,人物结构准确,风格一致性也把握得相当到位。然而,与多数AI图像生成工具类似,它在某些局部细节上——例如手部姿态、肢体比例、发丝过渡——仍可能出现轻微失真,露出“AI痕迹”。本文将深入解析影响AI写真自然

时间:2026-05-20 08:35
Trae Builder模式详解:从零开始构建完整功能的步骤指南

Trae Builder模式详解:从零开始构建完整功能的步骤指南

你是否曾在Trae平台输入一句简单的功能描述,好奇AI如何将其一步步转化为可直接运行的项目?这背后,正是Builder模式的分阶段智能执行机制在高效运作。它如同一位资深的全栈架构师,将一句模糊的自然语言需求,系统性地拆解、构建、组装成一个功能完备、可直接部署的完整应用。 那么,这个“一句话需求”究竟

时间:2026-05-20 08:35
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程