当前位置: 首页
科技数码
上海开源万亿参数AI模型:从解理论题到攻克科研难题

上海开源万亿参数AI模型:从解理论题到攻克科研难题

热心网友 时间:2026-02-05
转载


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈


4日晚间,上海人工智能实验室宣布,开源全球首个基于“通专融合”架构的万亿参数科学多模态大模型——Intern(书生)-S1-Pro。这是全球开源社区中参数规模最大的科学模型,其性能表现稳居全球第一梯队,为AI for Science从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代,提供创新的系统性开源基座。

值得一提的是,书生万亿科学大模型验证了从原创模型架构到国产算力基座自主技术的完整链路。通过开源开放,书生万亿科学大模型旨在降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命。

创新底层架构:突破万亿参数科学模型边界

上海人工智能实验室主任、首席科学家周伯文提出:可深度专业化通用模型是实现AGI的可行路径,其关键挑战在于:专家化模型在训练过程中需要低成本、能规模化的密集反馈;能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力;并能引入对物理世界规律的考量,兼顾多项差异化能力的学习效率与性能。

资料图:上海人工智能实验室主任、首席科学家周伯文 摄影:陶磊

新民晚报记者了解到,此次发布的书生万亿科学大模型通过多项SAGE基础模型层的技术创新,拓宽了模型应用边界、提升了超大规模训练可行性,推进了可深度专业化通用模型的探索。

为构建能更深层次理解物理世界规律的科学大模型,研究团队引入了傅里叶位置编码(FoPE)并重构时序编码器。FoPE为AI赋予双重视角:既能像看“粒子”一样捕捉文字之间的相对距离,又能像分析“波”一样把握科学信号的整体规律与频率。

研究团队还革新了内部的“路由机制”。传统方法存在训练低效和算力浪费两大痛点,新技术通过“路由稠密估计”,让模型在高效运行的同时能进行更充分的学习,提升了稳定性;进而通过“分组路由”策略,像智能交通系统一样使海量计算芯片实现负载均衡,避免了资源闲置。

“书生万亿科学大模型不仅在规模上刷新了科学多模态模型的参数规模上限,也为SAGE架构所提出的‘通用能力与专业能力协同演进’提供了可落地的实现路径。”上海AI实验室科研人员表示。


书生万亿科学大模型在评测基准中的表现:通用能力表现出色,科学能力达国际领先水平

科学能力再进化,通用能力协同演进

得益于创新的底层架构设计与万亿参数超大规模训练策略,书生万亿科学大模型的科学能力进一步升级。

在国际数学奥林匹克(IMO-Answer-Bench)和国际物理奥林匹克(IPhO2025)两大权威基准测试中,书生万亿科学大模型均展现出竞赛级别的解题能力。

而在AI for Science关键垂类领域,书生万亿科学大模型成功构建了一个跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务,不仅单学科成绩优异,更是在SciReasoner等高难度的综合学科评测基准中,取得了与顶尖的闭源商业大模型相当,甚至更优的成绩,稳居第一梯队。

新民晚报记者获悉,在基础理解维度,书生万亿科学大模型能够精准解析复杂的分子结构图及各类实验图表;深入到逻辑推理层面,书生万亿科学大模型能够处理高阶科学问答,如反应条件推断、理化性质预测,精准捕捉数据背后的因果规律等。

随着理解与推理能力的持续增强,书生万亿科学大模型的能力边界不断向真实科研场景延伸,其应用范围从微观层面的化学逆合成、蛋白质序列生成,拓展至宏观尺度的遥感图像分析等复杂任务。

“模型正展现出从‘解题’迈向‘解决问题’的科研生产力价值,为前沿科学探索提供了坚实支撑。”科研人员透露。

筑牢“算力—算法”一体化基座

在规模、性能提升的同时,书生万亿科学大模型构建了原创的“算力—算法”一体化基座。模型从架构设计之初,便与昇腾计算生态确立联合研发路线,实现了从最底层的算子、编译优化到上层的训练、推理框架的深度全栈适配。此外,它还与沐曦联合研发利用模型加速算子适配。


值得一提的是,自2024年书生大模型首次发布以来,上海AI实验室已逐步构建起丰富的书生大模型家族,包括科学多模态模型、大语言模型书生·浦语、多模态模型书生·万象、强推理模型书生·思客等;同时首创并开源了面向大模型研发与应用的全链路开源工具体系,覆盖数据处理、预训练、微调、部署、评测与应用等关键环节,形成覆盖数十万开发者参与的活跃开源社区。

自发布以来,科学多模态模型多次登顶HuggingFace全球多模态榜单,累计下载超41万次,并获得近200家科研机构和企业的合作申请。其卓越的跨模态科学理解能力不仅为科研提供了高效工具,也通过开源降低了全球科研团队迈入AGI for Science的门槛。

原标题:《从“解题”到“解决问题”!上海开源万亿参数科学大模型,AI成为科研合伙人》

栏目编辑:马丹

来源:https://www.163.com/dy/article/KL0FKHER055040N3.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
腾讯混元AI图像搜索突破 港中大联合研究提升失败学习能力

腾讯混元AI图像搜索突破 港中大联合研究提升失败学习能力

这项由腾讯混元、加州大学洛杉矶分校、香港中文大学以及香港大学联合开展的研究,以预印本形式发布于2026年5月,论文编号为arXiv:2605 05185。 研究背景:AI的“眼睛”不够用了 想象一下,你手头有一张老照片,想弄清楚画面里的建筑是什么、有什么历史。光凭肉眼,信息有限;直接上网搜索,又不知

时间:2026-05-13 07:56
中科大快手联合研发AI视频评分系统实现先思考后打分

中科大快手联合研发AI视频评分系统实现先思考后打分

2026年5月,一项由中国科学技术大学与快手技术团队(Kling Team)联合开展的研究以预印本形式发布,论文编号为arXiv:2605 05922。这项成果由来自中科大、快手技术以及中国科学院软件研究所的多位学者共同完成。 当我们在网上浏览视频时,背后总有一套隐形的“评分系统”在默默运作。它决定

时间:2026-05-13 07:56
货拉拉2025社会责任报告:算法透明化与司机安全保障升级

货拉拉2025社会责任报告:算法透明化与司机安全保障升级

货拉拉发布2025年社会价值报告,系统梳理了平台在司机权益保障与社会责任方面的实践。过去一年,平台六次主动公开核心算法规则,并成立算法向善委员会邀请司机参与研讨。同时,平台加大了对司机健康与安全的投入,成立司机健康中心、设立健康角,并累计投入超2 1亿元用于职业伤害保障。此。

时间:2026-05-13 07:55
华芢生物Pro-101-1完成深二度烧烫伤三期临床首例入组

华芢生物Pro-101-1完成深二度烧烫伤三期临床首例入组

华芢生物宣布,其用于治疗深二度烧烫伤的产品Pro-101-1已完成IIIa期临床试验首例患者入组。该试验采用随机、双盲、安慰剂对照设计,旨在评估重组人血小板源生长因子凝胶的有效性与安全性,并为后续IIIb期试验提供关键参数依据。这标志着该核心管线研发取得实质性进展。

时间:2026-05-13 07:55
澳大利亚电动汽车销量激增 充电设施建设亟待加速跟进

澳大利亚电动汽车销量激增 充电设施建设亟待加速跟进

澳大利亚电动汽车市场份额创纪录达16 4%,每六辆新车中便有一辆电动车。中国品牌表现突出,比亚迪月销量跻身全澳第二,多品牌共同推动市场格局变化。销量增长同时,充电设施建设滞后成为关键挑战,业界呼吁加快投资以匹配需求,缓解里程焦虑并保障能源安全。

时间:2026-05-13 07:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程