当前位置: 首页
AI
谷歌Gemini上线AI音乐创作功能,挑战Suno

谷歌Gemini上线AI音乐创作功能,挑战Suno

热心网友 时间:2026-02-19
转载


新智元报道

编辑:艾伦

【新智元导读】谷歌在 7.5 亿月活的 Gemini 中上线了 AI 音乐生成功能,输入一句话或一张照片,几秒就能得到一首带人声和歌词的完整歌曲。背后是 DeepMind 最新的 Lyria 3 模型,训练数据超 200 万首曲目。对 Suno 等 AI 音乐创业公司而言,竞争从此不再只是比模型,更是要比入口。

昨天,谷歌在 Gemini App 中上线了 AI 音乐生成功能。


用户输入一段文字描述,或者上传一张照片,几秒钟内就能得到一首 30 秒的完整歌曲,带人声、带歌词、带 AI 生成的封面。纯器乐当然也是支持的。

驱动这个功能的是 DeepMind 最新的音乐生成模型 Lyria 3。


谷歌对这项功能的定位,不是取代音乐人,而是让普通人获得一种全新的自我表达方式。

做 AI 音乐生成的公司不少,但把它直接塞进一个拥有超过 7.5 亿月活用户的超级应用里,谷歌是头一个。

「30 秒」背后的技术跃迁

从 2024 年发布初代 Lyria 算起,这已经是谷歌在音乐生成领域的第三代模型。

相比前代,Lyria 3 有几个明显的进步。

过去用户需要自己写歌词输入模型,现在 Lyria 3 可以根据提示词自动生成歌词。

用户对风格、人声类型、节拍速度等元素的控制也更精细了。

根据 DeepMind 最新推文,Lyria 3 输出 48kHz 立体声音频,人声表现更自然,歌词的咬字清晰度也有了明显提升。

据数字音乐媒体 Digital Music News 报道,Lyria 3 的训练数据规模从 Lyria 2 的约 50 万首曲目扩展到了超过 200 万首,音频位深从此前版本升级到了 24-bit。

这意味着它在音质维度上甚至超过了 YouTube Music 等主流流媒体平台的标准。

除了文本生成音乐,用户还可以上传照片或视频,让 Gemini 根据视觉内容的情绪来作曲配词。

比如上传一张徒步的照片,Gemini 就能创作一首与之匹配的歌曲。

封面则由谷歌的图像生成模型 Nano Banana 自动完成。

功能目前以 Beta 形式向全球 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,桌面端已率先上线,移动端将在未来几天内陆续推送。

谷歌 AI Plus、Pro 和 Ultra 订阅用户将享有更高的使用额度。

与此同时,Lyria 3 也被整合进了 YouTube 的 Dream Track 功能,帮助创作者为 Shorts 短视频生成背景音乐。这项功能此前仅限美国地区,此次正式面向全球创作者开放。

版权这张牌

谷歌打得很小心

AI 音乐生成领域的版权纠纷从未停歇。

2024 年夏天,环球音乐、索尼音乐和华纳音乐联手对 AI 音乐初创公司 Suno 和 Udio 提起了总金额达 5 亿美元的版权侵权诉讼。

到 2025 年底,Suno 与华纳达成和解并获得授权,Udio 也分别与环球和华纳签署了协议。

整个行业正在从对抗走向合作,但紧张关系远未消散。

在这个背景下,谷歌的措辞格外谨慎。

最新公告强调 Lyria 3 的设计目标是「原创表达,而非模仿现有艺术家」。

如果用户在提示词中提到某位具体艺术家的名字,Gemini 只会将其作为宽泛的创作灵感,生成风格或情绪相似的作品,而非模仿该艺术家的声音。

谷歌还表示在训练过程中「非常注意版权和合作伙伴协议」,并设置了过滤器来比对输出内容与已有作品。

在内容标识层面,所有通过 Gemini 生成的音乐都会嵌入 SynthID 水印。

更值得关注的是,Gemini 现在还新增了音频鉴别功能——用户可以上传一段音频文件,询问它是否由谷歌AI 生成,Gemini 会检测 SynthID 标记并结合自身推理给出判断。

这是继图片和视频鉴别之后,SynthID 覆盖的第三种媒体类型。

当音乐生成变成一场平台战争

如果说 Suno 和 Udio 代表了 AI 音乐的创业浪潮,谷歌此举则标志着这场竞赛正式升级为平台级别的角力。

Suno 在 2024 年 11 月完成了 2.5 亿美元融资,其付费版本已经提供了虚拟音频工作站等专业编辑功能。

但 Suno 的月活用户量级与 Gemini 的 7.5 亿相比,根本不在同一个数量级。

Tom's Guide 的编辑在体验后写道,她把丈夫的待办事项清单变成了一首朋克摇滚歌曲,然后通过短信发了出去。

这种场景可能正是谷歌想要的:音乐生成的杀手级应用也许并不在录音棚里,而是藏在日常生活的每一条消息、每一次分享中。

30 秒的长度限制、Beta 阶段的粗糙感、版权争议的暗涌——Lyria 3 显然还远谈不上完美。

但谷歌选择在这个时间点把它推向 7.5 亿用户面前,传递的信号已经足够清晰:AI 音乐生成这件事,它不打算再等了。

当每个人的口袋里都装着一个作曲家的时候,改变的或许不是音乐本身,而是我们与音乐之间的关系。

参考资料:

https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/

https://x.com/GoogleDeepMind/status/2024153067654902014

来源:https://www.163.com/dy/article/KM4NGGDG0511ABV6.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Canva可画AI文案生成器如何一键生成小红书爆款标题

Canva可画AI文案生成器如何一键生成小红书爆款标题

如果觉得Canva可画AI生成的小红书标题吸引力不足,可以通过四步来优化:一、输入包含身份、痛点、结果、情绪的场景化提示词,并加上格式指令;二、调用“小红书-种草暴击型”这类内置模板来填充参数生成;三、在开头加入强干预词,比如【上海租房党必存】,来锁定关键信息;四、跨抖音、公众号、电商等不同模板进行

时间:2026-05-18 15:42
C盘空间不足?AI智能清理工具一键释放磁盘空间实战教程

C盘空间不足?AI智能清理工具一键释放磁盘空间实战教程

电脑长期使用后,C盘空间告急几乎是每位用户都会遇到的难题。系统运行逐渐迟缓,手动清理又如同大海捞针——临时文件、日志缓存、AI任务残留等隐形“空间刺客”往往是占用元凶。此时,你需要的已不再是基础的磁盘清理,而是一位能理解你需求的智能助手。 ToClaw能够智能诊断并清理C盘冗余文件。其AI空间感知引

时间:2026-05-18 15:41
跨设备协同新方案 手机如何远程控制电脑执行任务

跨设备协同新方案 手机如何远程控制电脑执行任务

想象一下这个场景:你正躺在沙发上,用手机给远在书房的电脑发了一条指令,让它立刻开始编译代码、打包文件,或者清理一下磁盘空间。但等了几分钟,电脑那头却毫无动静。这感觉,就像对着对讲机喊了半天,结果发现根本没开机。 别急着怀疑人生,这通常不是AI助手“罢工”,而是跨设备调度的几个关键环节没打通。要让你的

时间:2026-05-18 15:41
Seedance2.0制作绿幕背景视频教程 直播间动态壁纸素材指南

Seedance2.0制作绿幕背景视频教程 直播间动态壁纸素材指南

当Seedance 2 0生成的背景视频无法满足绿幕抠像或动态壁纸的制作需求时,需系统性地调整输出参数、进行后期处理与格式转换。核心步骤包括:设置H 264 Rec 709 30fps 无B帧编码、利用FFmpeg提升绿幕纯度、转换为WebP动画与APK动态壁纸格式,或采用DaVinci Resol

时间:2026-05-18 15:41
Perplexity如何通过TLS 1.3实现端到端加密数据传输

Perplexity如何通过TLS 1.3实现端到端加密数据传输

在使用Perplexity进行AI对话与搜索时,许多用户关心其数据传输过程是否安全可靠,尤其是提问内容与个人数据是否会遭到窃听或篡改。需要明确的是,Perplexity并未在用户与用户之间提供端到端加密(E2EE),但其客户端(包括网页版与移动应用)与服务器之间的所有通信,均建立在当前最先进的传输层

时间:2026-05-18 15:41
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程