千问斩获最佳AI论文:中国团队唯一登顶顶级会议
11月28日最新消息,全球人工智能顶会NeurIPS 2025公布了论文奖项评选结果,阿里通义千问团队的最新研究成果从全球2万多篇投稿中脱颖而出,被评为最佳论文,成为获得该奖项唯一的中国团队。
该论文聚焦大模型的核心组件——注意力机制,首次在业内系统性解密了"注意力门控机制"对模型性能与训练效率的关键影响。
这一突破性发现被业内专家普遍认为是解决当前大模型训练瓶颈的重要一步,将有力推动整个AI大模型技术的进步。

作为人工智能领域的顶尖盛会,NeurIPS曾孕育出Transformer、AlexNet等里程碑式成果。本届会议吸引了谷歌、微软、OpenAI、阿里巴巴及麻省理工学院等全球顶尖机构参与,投稿竞争异常激烈,接收率仅约25%,而最终评选出的最佳论文更是凤毛麟角,仅4篇入选,概率不足万分之一,代表了当前全球人工智能领域最具价值和影响力的前沿研究。
门控机制常被喻为模型的"智能闸门",其核心作用是帮助模型高效过滤冗余信息,从而提升模型表现。近年来,从AlphaFold2到Forgetting Transformer,学术界和工业界已开始探索将门控机制融入注意力模型。然而,门控在注意力中发挥效用的深层原理及其在大规模训练中的实践效果,始终是未解之谜,缺乏系统性的实证研究。
此次,通义千问研究团队通过严谨的大规模实验填补了这一空白。他们在1.7B稠密模型(Dense)与15B混合专家模型(MoE)上进行了数十组实验,单组实验的训练数据量最高超过3.5万亿tokens。
通义千问团队表示,对门控注意力机制的深入理解,不仅为未来大语言模型的架构设计开辟了新思路,也为构建更稳定、高效和可控的大模型奠定了坚实的理论基础。
目前,阿里通义千问已开源超过300款模型,覆盖全模态、全尺寸,全球累计下载量突破7亿次,衍生模型数量超过18万个,其开源生态的规模和影响力位居全球首位。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
蔡司6月2日发布新品镜头技术迎来重大突破
蔡司宣布将于6月2日发布一款新镜头,并称其为镜头技术的重大突破,标志着全新纪元的开启。官方仅公布了产品剪影,但措辞暗示其可能带来根本性的技术升级,例如全新光学结构、先进镀膜或对焦系统改进。具体细节需待发布日揭晓。
神舟二十三号飞船将携带九项科学实验进驻中国空间站
据中国科学院空间应用工程与技术中心最新消息,神舟二十三号载人飞船即将发射升空,计划携带总计9项前沿科学实验项目进驻中国空间站。此次上行实验的样品及配套装置总重约54公斤,实验材料种类丰富,涵盖了肝脏细胞、水稻与拟南芥种子、纳米酶、放线菌以及钙钛矿太阳能电池等关键领域,旨在利用空间站独特环境开展多学科
香港女警黎家盈任载荷专家 资讯科技专长助力航天任务
5月23日上午,酒泉卫星发射中心举行神舟二十三号载人飞行任务新闻发布会,正式宣布任务计划。根据安排,神舟二十三号载人飞船将于北京时间5月24日23时08分准时发射升空。 本次飞行乘组的组成备受瞩目。神舟二十三号任务乘组由指令长朱杨柱、航天员张志远以及来自中国香港的载荷专家黎家盈共同构成。这标志着中国
苹果Beats新款头戴耳机通过FCC认证即将上市
美国联邦通信委员会数据库出现一款型号为A3577的蓝牙头戴式耳机,并非已知的AirPodsMax2。目前公开信息极少,仅有一张普通耳机耳罩图片。推测其可能属于苹果旗下Beats品牌的新一代产品,如BeatsStudioPro的更新型号,但具体身份仍有待后续信息确认。
永辉超市转型裁员三万人 CEO涨薪引争议
永辉超市因大连御锦拖欠股权转让尾款36亿余元申请强制执行,担保人王健林承担连带责任。永辉近年推行“胖改”后关店裁员约三万人,CEO薪酬却大幅上涨。追债成功与否存疑,万达自身债务压力使款项回收难度极大。此事关乎永辉现金流,已成为生存攸关的紧迫问题。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

