Stable Audio 2.5 企业级音频生成 AI 模型发布,号称“3 分钟曲目 2 秒钟完成”
9 月 14 日消息,Stability AI 现已正式发布企业级音频生成模型 Stable Audio 2.5,相对上一代主要围绕音频细节、生成速度方面进行提升,号称“仅需 2 秒钟即可创建 3 分钟音频曲目”。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据介绍,Stable Audio 2.5 的核心改进集中在音乐生成能力方面,号称生成结果更加贴合实际编曲逻辑,可呈现前奏、发展与结尾等完整多段式结构。同时新模型对提示词的理解更为准确,尤其在情绪描述和音乐风格词汇的把握上,响应更符合预期。
此外,新版模型还显著改进了音频生成速度,Stability AI 称这主要得益于研发团队提出的后训练方法 ARC(注:Adversarial Relativistic-Contrastive),这一技术通过结合相对式对抗训练与对比判别器,加速扩散模型的生成过程,可在保证音轨质量的同时显著降低 GPU 推理耗时,从而实现 2 秒钟生成长达 3 分钟的音频内容。
除此之外,Stable Audio 2.5 还新增了音频修补能力,用户可以导入自己的音频文件,并指定“延展位置”,模型即可根据音频前后内容及整体曲风,将音频一键“延长”,特别适合剪辑等场景。
目前,Stable Audio 2.5 已可通过 StableAudio 正式直接试用,同时支持本地化部署。不过最新规定,用户上传的音频文件不得包含受版权保护的内容,StableAudio 将利用自带的内容识别系统进行检测,以确保不侵犯他人版权。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
国产存储如何突围,一场持久战略正在展开
如果你最近打算换手机或电脑,可能会发现同样的配置,价格已经比之前贵了一截。OPPO、vivo、荣耀等手机厂商先后对部分机型调价,深圳华强北的商户们发现,一夜之间部分机型的价格变化幅度接近千元。联想部
特斯拉TeraFab项目发布,年产算力超1太瓦
3月30日,据TeslaAI微博消息,TERAFAB项目正式发布,预计将实现每年超过1太瓦(1TW)的算力产出。马斯克预测,未来人形机器人行业的潜在年产量或将达到10亿至100亿台。随着机器人进入更
抖音网红公司参半完成新一轮融资,拟上市
作者 |定焦One 李梦冉网红口腔护理品牌参半,要上市了。3月27日,参半的母公司 "小阔科技 "向港交所递交招股说明书,拟主板挂牌上市。这家诞生于深圳的新锐企业,曾凭借一款益生菌漱口水在80天内狂揽亿
Workbuddy上线小程序版:本地云端直连使用指南
今日,腾讯公关总监张军透露,腾讯版龙虾应用workbuddy推出了小程序版,不仅可以直连本机,还可以直接云上使用。据了解,WorkBuddy是腾讯云推出的桌面Agent工具,定位为职场AI智能体桌面
DeepSeek服务中断说明:当前问题与解决方案详解
3月30日, DeepSeek崩了 登上微博热搜。DeepSeek最新服务状态 显示,DeepSeek网页、App服务出现重大中断。 DeepSeek最新服务状态 截图 事件报告显示,3月29日
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

