Stability Audio 3.0发布 可生成6分钟专业级音乐
StabilityAI发布音频生成模型家族StabilityAudio3 0,其顶级模型可生成长达六分钟以上的专业级音乐。该系列包含四款不同规格模型,其中三款已开源。大型模型能维持音乐结构连贯性,较前代有显著突破。模型基于合法授权数据训练以规避版权风险,公司同时正为专业音乐人开发新产品线。
AI音乐生成技术迎来重大突破。近日,全球知名AI公司Stability AI正式发布了其新一代音频生成模型系列——Stability Audio 3.0。该系列最受瞩目的能力在于,其旗舰模型可创作出时长超过六分钟的专业水准音乐作品,显著拓展了AI音乐制作的时长与复杂度上限。

为适配多样化应用需求,Stability Audio 3.0共包含四款不同规模的模型。参数从4.59亿的轻量SFX/小型版,到14亿的中型版,再到27亿的大型版,构成了完整的产品矩阵。其中,两款小型模型专为移动端与本地设备部署优化,可生成两分钟内的音效与音乐片段,兼顾效率与便捷性。
中型与大型模型则展现了更卓越的架构控制力。它们不仅能生成总长可达6分20秒的完整曲目,还能在整个过程中稳定保持乐曲的结构框架与旋律主题,有效避免了中途风格突变或结构松散的问题。与此前发布的Stable Audio 2.0相比,此次在生成长度上实现了超过一倍的提升,是AI长音频生成连贯性的一次关键进步。
在开源政策方面,Stability AI保持了其一贯的部分开放策略。本次SFX小型版、小型版及中型版模型均已全面开源,供研究人员与开发者自由获取并调整模型权重。然而,参数最多的27亿大型模型暂未开放,仅通过API接口及付费托管服务提供。公司同时明确了商业使用条款:年收入超过100万美元的企业需获取商业授权方可使用。
版权合规是AI内容生成的核心议题。对此,Stability AI已进行前瞻性布局。公司此前已与华纳音乐、环球音乐集团等全球顶尖音乐公司建立战略合作。此次特别声明,Stability Audio 3.0全系列模型均使用经过合法授权的内容数据集进行训练,从根源上降低了版权风险。
除了面向广大开发者的工具,Stability AI也正深入专业音乐创作领域。据透露,公司正在为专业音乐人开发一套全新的产品线,具体功能虽未公开,但已体现其聚焦垂直专业场景的战略。为加速该项目,前环球音频与芬达(Fender)首席数字官、行业专家伊桑·卡普兰已加入团队,并将主导专业音乐产品业务。这或许意味着,AI辅助音乐制作正迈向更专业化、集成化的新阶段。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Stability Audio 3.0发布 可生成6分钟专业级音乐要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点在今天的数字化办公场景里,运营人员——无论是电商运营、物流调度还是财务核算——每天都要面对一个既耗时又磨人的任务:跨系统搬运数据。企业内部往往并存着多个独立的系统,比如ERP、CRM、OA以及各种自建后台,它们之间缺乏有效的API接口,导致大量数据流转只能依赖最原始的方式:人工复制、粘贴、再核对。这
在电商运营全面迈向数字化的时代,数据已成为驱动业务决策的核心引擎。然而,许多企业在引入数据采集工具以期提升效率时,却常常遭遇现实困境。麦肯锡的研究指出,超过70%的企业在搭建自动化数据管道时,会因工具选择不当,反而陷入维护成本飙升的循环。那些宣称“全平台覆盖”、“一键抓取”的诱人方案背后,究竟存在哪
你是否曾想过,直接用自然语言命令电脑完成工作?例如,只需说一句“请将桌面所有图片整理至‘素材’文件夹”,电脑便能自动执行。这正是像 Kimi Claw 这样的智能体工具的核心价值所在:它巧妙地将云端大模型的逻辑推理能力与本地自动化执行框架相结合,让自然语言指令成为操控电脑的智能“遥控器”。 接下来,
你是否希望让AI助手帮你操作电脑,自动完成那些重复、繁琐的桌面任务?阿里云无影团队推出的JVS Claw,或许正是你寻找的“智能办公瑞士军刀”。作为一款开箱即用的AI桌面智能体平台,它能将你的自然语言指令,直接转化为真实的系统操作——无论是网页数据抓取、文档批量处理,还是跨软件、跨平台的复杂工作流,
- 日榜
- 周榜
- 月榜
热点快看
