当前位置: 首页
科技数码
阿里千问斩获全球AI顶会最佳论文,中国唯一获奖研究

阿里千问斩获全球AI顶会最佳论文,中国唯一获奖研究

热心网友 时间:2025-11-28
转载

11月28日,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队的最新研究成果从全球2万多篇投稿论文中脱颖而出,被评为最佳论文,成为唯一获得该奖项的中国团队。该论文首次在业内揭示了注意力门控机制对大模型性能和训练的影响,业内人士普遍认为该研究是突破当下大模型训练瓶颈的重要一步,将有力推动AI大模型技术的发展。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

中国唯一!阿里千问斩获全球AI顶会最佳论文

阿里通义千问研究成果被评为NeurIPS 2025最佳论文

NeurIPS是人工智能领域影响力最大的顶会之一,该会议诞生了Transformer、AlexNet等里程碑式研究成果。今年,谷歌、微软、OpenAI、阿里巴巴及麻省理工学院等全球顶尖科技公司和机构共有2万多篇论文投稿,仅有约25%的论文被接收,而最佳论文仅4篇,入选概率不及万分之一,代表了目前全球人工智能领域最有价值和影响力的研究。

2017年,谷歌在NeurIPS发表的论文首次提出Transformer模型架构和自注意力机制,这一研究让AI能够像人类一样具备有选择性地关注关键信息的能力,成为当下大模型研究的基础。尽管现在大模型在很多领域已经取得接近甚至超越人类的表现,但现有注意力机制仍存在诸多局限,例如当下大模型会因为过度关注特定信息而导致对其它重要信息的忽略或处理偏差,这些局限性极大地影响了模型性能和训练稳定性,为此业界开始探索对注意力进行优化的新方案。

门控机制被认为是模型的"智能闸门",可以帮助模型过滤无效信息并提升模型性能。近年来,AlphaFold2、Forgetting Transformer等学术界和工业界模型开始尝试将门控和注意力机制结合。但业界尚未破解门控在注意力中发挥作用的内在原因,也缺少大规模实践的经验。

此次,通义千问研究团队通过在1.7B稠密模型(Dense)与15B混合专家模型(MoE)上进行了数十组实验,单组实验训练最多超过 3.5 万亿 tokens,首次清晰揭示了门控注意力背后的作用原理,并全面展示使用该方案的最佳方式。

实验结果显示,对各注意力头的输出进行门控,是提升模型性能最有效的方式。使用该方式,在引入额外1%参数的情况下,可实现0.2以上困惑度下降、MMLU基准测评2个点的提升。研究还发现,该技术还能在更大规模的模型训练上实现更好的性能。

中国唯一!阿里千问斩获全球AI顶会最佳论文

使用论文方法,在引入额外1%参数的情况下,可以实现0.2以上的困惑度下降、MMLU基准测评2个点的提升

目前,该研究成果已应用于Qwen3-Next模型,并显著提升模型的性能与鲁棒性,相关技术方案、实验模型及产品级模型均已开源。NeurIPS评审委员会指出:"这项工作将被广泛应用,并极大推动AI研究人员对大语言模型中注意力机制的理解。"

通义千问团队表示:"对门控注意力机制的深入理解,不仅为大语言模型架构设计提供了新思路,也为构建更稳定、更高效、更可控的大模型奠定了基础。"据悉,目前阿里千问已开源300多款模型,覆盖全模态、全尺寸,全球下载量突破7亿次,衍生模型超过18万个,位居全球第一。

来源:https://www.leiphone.com/category/industrynews/r7Vng3L1OYiEn2Sh.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
低调传承人的抉择:红旗、华为与吉利的橄榄枝战略解析

低调传承人的抉择:红旗、华为与吉利的橄榄枝战略解析

文 金叶来源 节点财经车企争相牵手一位铜艺大师,这事听起来不太商业。但朱军岷偏偏把它做成了。红旗请他当文化大使,华为在他去国博举行捐赠仪式时做他的指定用车,吉利把铜葫芦挂件变成了门店引流的“

时间:2026-03-29 15:01
蔚来出海新动向:三大品牌首度集结开拓海外市场

蔚来出海新动向:三大品牌首度集结开拓海外市场

IT之家 3 月 29 日消息,据最新微博消息,当地时间 3 月 26 日,蔚来在哥斯达黎加的首家门店正式开业。据介绍,该门店位于圣拉斐尔德埃斯卡苏区 Combai Mercado Urbano 购

时间:2026-03-29 14:55
松山AI峰会:赋能“超级个体”,AI全产业链生态解读

松山AI峰会:赋能“超级个体”,AI全产业链生态解读

3月28日,“智汇松江-opc创新创业峰会暨ai应用实践挑战赛”举办。峰会采用“赛会结合”模式,不仅汇聚了来自政府、芯片算力、硬件制造、模型生态、应用开发及投资机构的代表同台对话,更通过ai应用实践

时间:2026-03-29 14:55
马斯克:更多人应来中国看看,首选上海

马斯克:更多人应来中国看看,首选上海

外部世界看中国科技的方式,正呈现越来越明显的转向。Sam Altman在不久前的采访里说,中国科技公司在整个技术栈上的进展“amazingly fast”。马斯克干脆发条帖子:“More peop

时间:2026-03-29 14:55
刘慈欣:AI时代未来展望与人类角色转变分析

刘慈欣:AI时代未来展望与人类角色转变分析

AI时代,人类将如何与AI共处?3月28日,在2026中国科幻大会上,科幻作家刘慈欣与嘉宾们聊起了AI时代的新变化。随着AI技术的发展,人工智能已经开始替代白领甚至科学家的部分工作,对于“普通人是否

时间:2026-03-29 14:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程