清华开源TurboDiffusion:AI视频生成提速200倍,RTX5090秒出大片
12月25日消息,清华大学TSAI实验室联合生数科技正式开源了视频生成加速框架TurboDiffusion。这款框架能够在确保生成视频画质不打折扣的前提下,将端到端的推理生成速度提升高达100至200倍。


从技术层面来看,TurboDiffusion为了追求极致的推理速度,采用了SageAttention和SLA(稀疏线性注意力机制)来加速注意力计算,有效降低了模型处理高分辨率视频时的算力开销。
此外,团队还引入了rCM(时间步蒸馏)技术,显著减少了扩散模型生成所需的采样步数。正是这些技术方案的深度融合,让模型在保证画面生成效果一致的基础上,大幅削减了计算延迟。
GitHub页面上公布的实测数据充分展现了其惊人的性能提升。在单张RTX 5090显卡上测试Wan-2.1-T2V-1.3B-480P模型,生成一段5秒视频,原版耗时长达184秒,而采用TurboDiffusion后仅需1.9秒。

对于参数更大的Wan-2.2-I2V-A14B-720P模型,原版生成耗时高达4549秒(约1.2小时),而TurboDiffusion则将其压缩至仅需38秒。相关性能对比截图如下:


即便是在Wan-2.1-14B-480P模型上,生成耗时也从1676秒骤降至9.9秒,其加速效果远超市场上已有的FastVideo等同类方案。


目前,TurboDiffusion已提供多种规格的模型权重下载,并针对不同硬件进行了针对性优化。对于RTX 5090、RTX 4090等显存有限的消费级显卡,团队提供了量化版本权重,并建议开启线性层量化功能以节省显存;而对于拥有80GB以上显存的H100等工业级显卡,则推荐使用非量化版本以获得最佳生成效果。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
蚂蚁开源万亿参数思考模型Ring-2.5-1T详解
Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构
Teamily AI:原生智能通讯平台,开启人机协作新纪元
Teamily AI是什么 想象一下,你手机里的微信群聊,除了家人朋友同事,还多了一位特殊的“成员”——它从不缺席,能瞬间理解所有对话,还能帮你处理图片、视频甚至写报告。这不再是科幻场景,而是南加州大学团队带来的现实:全球首个AI原生即时通讯平台,Teamily AI。 它的核心思路很巧妙:不再把A
字节跳动Seedream 5.0 Lite AI图像生成模型详解
Seedream 5 0 Lite是什么 在AI图像生成技术飞速发展的今天,字节跳动Seed团队正式推出了其重磅升级产品——Seedream 5 0 Lite。作为Seedream 4 0的迭代版本,这款全新的AI绘画模型在文本理解、视觉推理与图像生成三大核心维度上实现了显著突破。 该模型采用了创新
WorkAny Bot云端AI助手基于OpenClaw框架详解
WorkAny Bot是什么 想象一下,有一个永不掉线的智能助手,它住在云端,随时准备响应你的召唤。这就是WorkAny Bot——一个基于OpenClaw AI框架构建的云端智能体。它的核心价值在于,将强大的AI能力变成一项即开即用的服务。 你可以把它理解为你私人的、功能齐全的AI工作站。它支持接
KiloClaw推出全托管云服务OpenClaw
KiloClaw是什么 想快速拥有一个能接入几十个聊天平台、还能执行系统命令的AI助手,但一听到要自己部署维护就头疼?这确实是很多开发者和团队面临的现实困境。OpenClaw这个开源项目功能强大,支持50多种平台,可真要自己从零搭建,光是配置环境可能就得折腾半小时以上,后续的更新、监控更是麻烦事。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

