智谱新清影发布:10秒4K60帧视频自带音效
智谱发布CogVideoXv1 5并开源,集成CogSound音效模型,支持生成10秒4K60帧超高清视频,图生视频质量、复杂语义理解显著提升,任意比例及多通道输出,告别无声默片。
智谱技术团队今日悄然发布了一项重磅更新——最新版视频生成模型CogVideoX v1.5现已正式上线并开源。相较于前代,本次升级幅度显著:支持生成5秒或10秒时长、768P分辨率、16帧的视频,并且图生视频(I2V)模型完全解除了尺寸限制,任意比例均能处理。更重要的是,图生视频的质量与复杂语义理解能力实现了肉眼可见的飞跃。

据官方介绍,CogVideoX v1.5将同步登陆“清影”平台,并与同期推出的CogSound音效模型深度融合。至此,“新清影”的功能亮点如下:
- 品质全面升级:图生视频的整体质量、画面美学表现、运动合理性,以及对复杂提示词的语义理解能力,均较上一代显著增强。
- 超高清分辨率:支持直接生成10秒、4K分辨率、60帧的超高清视频——这已不仅关乎“流畅”,更具备了工业级输出的实力。
- 灵活比例适配:任意画面比例均可生成,从竖屏短视频到横屏宽银幕,完美适配多种播放场景,极具灵活性。
- 多通道生成:同一文本或图片可一次性输出4个不同侧重点的视频,大幅提升创作效率。
- 智能音效同步:最令人瞩目的是,新清影能够生成与画面内容精准匹配的音效——从此告别“默片”时代,AI视频真正实现了有声有色。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:智谱新清影发布:10秒4K60帧视频自带音效要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点Daetama是面向数据科学面试和SQL能力提升的练习平台,已收录超100个覆盖基础到进阶的SQL题目,求职板块与课程模块在开发中,团队保持每周更新节奏,提供系统性刷题与模拟面试场景。
SpeakMulti是一款AI驱动的配音平台,可将YouTube视频翻译成多种语言,保留原始说话者的音色和语调,降低本地化成本。用户提交视频并选择目标语言后,AI自动完成配音,并由专家团队审核,确保准确自然。
需求人群 如果你经常需要从图片中提取文字——例如整理截图内容、翻译图片里的外语文本、识别带有水印的图片信息——那么 Umi-OCR 无疑是一款相当实用的工具。它完全在本地运行,无需联网,对隐私保护极为友好。 产品特色 这款工具的核心亮点都集中在实用性上。截屏识别操作非常顺手,按下快捷键即可框选区域,
艺术创作与人工智能的融合,正在开启一个全新的创作时代。moonlightai 正是这样一款AI绘画工具,能够帮助用户通过人工智能快速生成不同风格的绘画作品——无论你想复刻文艺复兴时期的古典优雅,还是为画作注入梵高般炽热的笔触,甚至从艾沃佐夫斯基的海浪星空中汲取灵感,它都能轻松实现。 需求人群 简单来
- 日榜
- 周榜
- 月榜
热点快看
