当前位置: 首页
科技数码
硬刚Sora 2,马斯克发视频大模型,免费可玩,前英伟达何宜晖参与

硬刚Sora 2,马斯克发视频大模型,免费可玩,前英伟达何宜晖参与

热心网友 时间:2025-10-08
转载

马斯克和阿尔特曼又杠上了!

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

智东西10月8日报道,今天凌晨,马斯克的大模型独角兽xAI祭出最新视频生成模型Imagine v0.9,免费向所有用户开放。

一周前,OpenAI发布了旗舰视频和音频生成模型Sora 2,此次更新或许是马斯克对Sora 2的直接回应。

xAI并没有放出完整的技术博客,只是提到Imagine v0.9相比初代版本在视觉质量、动作、音频生成方面有所升级,并上传了几个生成视频案例。

马斯克在X上发帖称,Imagine v0.9的视频生成时间不到20秒,且用户可以基于语音优先界面,只需说话就能创建视频、图像和文本。

总结来看,Imagine v0.9的生成速度更快,在20秒以内,Sora 2生成视频可能需要一两分钟;Imagine v0.9已经免费向所有用户开放,Sora 2采用邀请制允许部分用户使用;Imagine v0.9生成的视频时长在6秒左右,Sora 2支持15秒视频生成。

智东西对比了Imagine v0.9和Sora 2的生成效果,采用OpenAI最新示例的提示词,Imagine v0.9在生成时会出现提示词理解错误、视频画面与音频不符、不提示深度伪造风险、无法说中文等情况。

值得一提的是,这也是马斯克今年7月挖走英伟达高级算法工程师何宜晖(Ethan He)之后,何宜晖在xAI参与的第一个项目。

何宜晖2018年本科毕业于西安交通大学计算机科学与技术专业,2019年在卡内基梅隆大学取得计算机视觉硕士学位,2024年加入英伟达担任高级深度学习算法工程师,曾参与英伟达世界基础模型Cosmos研发。

尽管Imagine v0.9可以免费使用,但智东西尝试后发现Web端目前无法正常工作,移动端可以体验,不过也会出现连接失败的情况。

秒生电影大片效果

还能添加自然对话

Imagine v0.9集成到了Grok中,其会根据文字先生成图片再创建视频,或者直接将用户上传的图片变成视频。

xAI在博客中提到,Imagine v0.9突破了原生音频+视频生成的界限,开箱即用,无需编辑即可创建类似电影效果的视频。如下面这段视频中的视频中还伴随实时的龙的怒吼。

Imagine v0.9另一大升级点是运动控制,如下面视频中的滑雪片段,视频中人物飞起到落下的动作丝滑。

第三点是用户可为视频添加动态相机效果,如智能焦点转移,下面视频中根据镜头位置变化,会对应虚化街景突出人物。

第四点是Imagine v0.9支持添加自然对话,或者生成具有表现力的歌声等。

对比Sora 2文字理解错误频发

有深度伪造风险

智东西使用了OpenAI演示Sora 2时的提示词,对比了Imagine v0.9和Sora 2的生成效果。

提示词:Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time(两名山地探险者穿着色彩鲜艳的专业冲锋衣,脸上结着冰霜,眼神急切地眯成一条缝,在雪地里轮流大喊)

OpenAI放出的Sora 2生成视频:

Imagine v0.9的生成视频:

可以看出,Imagine v0.9生成的视频中音频并没有包含“喊叫”,只是画面中人物在张嘴。

提示词:a guy does a backflip(一个男人后空翻)

OpenAI放出的Sora 2生成视频:

Imagine v0.9的生成视频:

智东西选择了Grok生成的第一张图创建视频,视频中主角完全无视重力开始在空中360度旋转。

最后智东西还体验了Imagine v0.9的自定义语音能力,智东西上传了马斯克的照片,让他说出“Sam’s a sharp guy, and our relationship’s always been good. OpenAI’s built some impressive stuff in the AI space, and I really hope to partner with them someday to advance AI development togethe(萨姆是个敏锐的人,我和他的关系一直都很好。OpenAI 在人工智能领域做出了不少亮眼的成果,我真心希望有一天能和他们合作,共同推动人工智能技术的发展)”这段话。

Imagine v0.9没有提示深度伪造风险,但生成的声音与马斯克本人略有区别。

目前该模型不支持中文,当智东西让马斯克说出“我和萨姆·阿尔特曼是好朋友”,其生成视频中只有“是好朋友”较为清晰。

结语:AI视频生成竞赛升级

自定义语音功能或引发深度伪造风险

一周内,OpenAI、xAI接连发布视频生成模型新进展,Sora 2不仅在模拟真实性、可控性及音效方面提升,还推出了全新Sora社交App,xAI则在功能升级的基础上,通过免费开放吸引了一大波流量。

此次Imagine v0.9的一大升级点是允许用户在视频中添加自定义语音。这项技术进一步成熟后,用户可以自行上传公众人物照片及说话内容生成逼真视频,这或带来深度伪造风险。

因此,未来如何平衡技术发展与风险防控,或许是所有视频生成模型提供商都需直面的技术难题。

来源:https://36kr.com/p/3500082032712581

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
打破外资垄断!我国300吨矿卡动力自主可控

打破外资垄断!我国300吨矿卡动力自主可控

国产动力新里程碑:300吨级矿卡成功挑战18000小时可靠运行 在大型矿山装备领域,一项新的纪录刚刚诞生。4月24日,两台搭载着我国自主潍柴12M55动力总成的300吨级矿用卡车,成功通过了可靠运行18000小时的严苛考验。这个数字,对于长期被外资品牌主导的超大型矿卡动力市场而言,无疑是一个标志性的

时间:2026-04-27 06:06
中国生物医药企业在2026AACR公布临床前研究数据,突破细胞治疗可及性

中国生物医药企业在2026AACR公布临床前研究数据,突破细胞治疗可及性

中国生物医药企业在2026AACR公布临床前研究数据,突破细胞治疗可及性 在刚刚落幕的2026年美国癌症研究协会(AACR)年会上,来自上海易慕峰生物的一项最新临床前研究数据,引起了业内的广泛关注。该公司公布了其基于自研iMAGIC平台开发的靶向BCMA体内CAR-T候选疗法IMV102的研究成果。

时间:2026-04-27 06:06
奇瑞携57款车型、31项科技展品亮相北京车展

奇瑞携57款车型、31项科技展品亮相北京车展

奇瑞携全矩阵亮相北京车展,科技与新品齐发 4月24日,第十九届北京国际汽车展览会正式拉开帷幕。奇瑞汽车(09973 HK)此次可谓阵容鼎盛,一口气带来了旗下57款车型,覆盖了从主流到高端的多个细分市场。 品牌矩阵全面开花 奇瑞品牌作为基石,展出了16款车型。其中,瑞虎X、ARRIZO S和ARRIZ

时间:2026-04-27 06:06
科技温度+创新速度:荣耀推动AI在机器人领域的消费级应用落地

科技温度+创新速度:荣耀推动AI在机器人领域的消费级应用落地

4月24日,2026(第十九届)北京国际汽车展览会盛大启幕 作为行业年度重磅盛会,这场展会早已超越了传统汽车产业的范畴,成为跨领域科技融合的前沿阵地。一个引人注目的跨界亮点,是荣耀携人形机器人“闪电”“元气仔”,以及阿尔法战略落地的首个新物种Robot Phone集体亮相。这并非简单的展台陈列,而是

时间:2026-04-27 06:06
小米汽车慕尼黑设欧洲研发中心 2027年携YU7 GT进军欧洲高端市场

小米汽车慕尼黑设欧洲研发中心 2027年携YU7 GT进军欧洲高端市场

中国新能源汽车品牌小米近日在德国慕尼黑正式启用其欧洲研发中心,标志着这家科技企业向全球化战略迈出关键一步。该中心将聚焦高性能车型开发、高端设计语言构建及底盘动力学核心技术攻关,为2027年进军欧洲市场奠定技术基础。 消息显示,这座占地超过2000平方米的研发中心,已经迅速组建起一支约50人的专业团队

时间:2026-04-26 22:49
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程