当前位置: 首页
科技数码
我国首个大模型成果登上《自然》封面背后的突破

我国首个大模型成果登上《自然》封面背后的突破

热心网友 时间:2026-01-30
转载

本讯(记者 雷嘉)近日,由北京智源人工智能研究院主导的一项多模态大模型研究成果,在国际顶级学术期刊《自然》官网正式上线,并将于2月12日在纸质版正式刊发。这是我国科研机构主导的大模型成果,首次在《自然》正刊上发表。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

自2018年以来,GPT模型采用的“预测下一个词元”自回归范式,引领了语言大模型的重大突破,开启了生成式人工智能的发展浪潮。然而,多模态模型通常依赖对比学习、扩散模型等专门技术路径,自回归方式能否作为一种通用路线来统一处理多模态数据,一直是业界探索的焦点。

智源研究院提出的Emu模型,基于“预测下一个词元”的核心思想,构建了全新的多模态架构。该模型将图像、文本和视频数据统一离散化到同一个表示空间中,并从一开始就直接在混合的多模态序列数据上,联合训练一个单一的Transformer。这一架构证明了,仅凭“预测下一个词元”这一目标,就能让模型同时具备高水平的生成能力与理解能力。此外,在此统一框架下,模型的能力还能自然地扩展到机器人操作以及多模态交互等生成任务。

实验结果表明,Emu在生成与感知任务上的整体表现,足以媲美多种成熟的专用模型:在文生图任务中,其效果达到扩散模型的水平;在视觉语言理解方面,可以与融合了CLIP与大语言模型的主流方案相匹敌。同时,Emu还具备视频生成能力。与以噪声为起点的扩散式视频生成模型不同,Emu通过自回归方式逐词元预测视频序列,实现了基于因果关系的视频生成与延续,展现出对物理世界中环境、人类与动物行为的初步模拟能力。

这项成果表明,仅采用自回归这一条路线,就可以统一多模态学习,训练出卓越的原生多模态大模型。这对于确立自回归成为生成式人工智能的统一技术路线,具有重大意义。值得一提的是,智源研究团队已将相关研究的多项关键技术及模型进行了开源,以推动该方向的持续研究与生态发展。

《自然》编辑在点评这项研究时指出:Emu仅基于预测下一个词元,就实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能与使用专门路径的模型相当。这一成果对于构建可扩展、统一的多模态智能系统意义重大。

来源:https://www.163.com/dy/article/KKG3GF6U0514R9KQ.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
探秘第四代高能同步辐射光源HEPS限时打卡指南

探秘第四代高能同步辐射光源HEPS限时打卡指南

在粒子物理与核探测技术领域,要捕捉并解析那些瞬息即逝的基本粒子和高能射线,必须依赖一种特殊的“感知之眼”——粒子探测器。而构成这双“眼睛”最核心的感光部件,往往是一块块高度纯净、性能卓越的人工闪烁晶体。这类晶体能够将高能粒子或射线所携带的能量,高效转换为可供记录与分析的光信号,从而成为现代高能物理实

时间:2026-05-12 22:49
杭州街道遭电商抵制背后:无理由退货引发的规则博弈

杭州街道遭电商抵制背后:无理由退货引发的规则博弈

近期,杭州萧山区盈丰街道被国际奢侈品牌圣罗兰列入“发货黑名单”的消息,在电商圈内引发广泛关注。业内人士分析,这很可能是商家针对特定区域恶意退货率持续偏高所采取的无奈之举。事实上,将某个地区甚至具体街道设置为限制发货区域,在技术层面已十分成熟,且近期类似操作已在全国多地悄然出现。 有电商经营者透露,尽

时间:2026-05-12 22:48
莫氏鸡煲为何开业仅一月就客流锐减无人排队

莫氏鸡煲为何开业仅一月就客流锐减无人排队

流量时代的风口,生命周期往往短得惊人,能撑过三个月都算幸运儿。这背后,是注意力经济的残酷法则。 不知道各位还记不记得,一个月前全网刷屏的那家“最不想火的鸡煲店”?当时,老板老莫对着镜头直言味道一般,劝大家别跟风,甚至贴出告示提醒“喝汤可能拉肚子”。结果呢?这股“爱来不来”的桀骜劲儿,反而引爆了网络,

时间:2026-05-12 22:48
谷歌披露黑客利用AI开发零日漏洞攻击工具

谷歌披露黑客利用AI开发零日漏洞攻击工具

谷歌安全团队近期披露了一起具有里程碑意义的网络攻击事件:一个网络犯罪组织利用人工智能技术,成功开发出一款能够自动探测并试图利用某款主流系统管理软件中未知安全漏洞的黑客工具。 这起事件的性质远超普通网络攻击。根据谷歌发布的详细报告,这是全球首次有确凿证据证实,人工智能被直接用于生成针对“零日漏洞”的自

时间:2026-05-12 22:47
2030年车企生死线:300万辆销量成行业新基准

2030年车企生死线:300万辆销量成行业新基准

当北京车展的聚光灯聚焦于新车发布时,一场关于未来生存法则的深度思考,正在行业内部引发广泛共鸣。 就在许多车企仍在为年度销量目标奋力冲刺之际,长安汽车已将战略视野投向了更具决定性的2030年。在中国长安汽车集团总裁赵非看来,那并非一个遥远的未来,而是一道严峻的行业“分水岭”。他近期明确提出了判断车企生

时间:2026-05-12 22:44
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程