当前位置: 首页
科技数码
AI赋能科学发现:如何突破数据壁垒攻克研究难关

AI赋能科学发现:如何突破数据壁垒攻克研究难关

热心网友 时间:2026-01-06
转载

人工智能正在与科学研究实现深度交融,重塑着科学未来的面貌。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

去年11月,美国启动了一项名为“创世纪计划”的国家级战略,旨在整合其顶尖的超算资源与独特的数据资产,利用人工智能变革科研范式,加速科学发现进程。无独有偶,英国同期也发布了其AI for Science战略,规划了15项具体行动,以巩固其在人工智能驱动科学突破领域的全球领导地位。

近日,多位青年科学家在上海的一场AI for Science座谈会上不约而同地指出,数据壁垒已成为该领域发展的核心痛点之一。人工智能不仅需要海量数据,更需要多样化的高质量数据。缺少足够的数据“原料”,就如同巧妇难为无米之炊,难以训练出有效的模型。AI for Science的征程亦不应止步于科研发现,而应选择那些兼具产业基础、技术优势和数据积累的领域先行先试,探索从研究到应用的市场闭环。

没有数据“下锅”,就难以炼出好模型。

新能源汽车已成为我国经济发展的重要引擎,而锂电池是当前的主流技术路线。固态电池作为下一代电池技术的突破方向之一,采用固体电解质替代传统液态或凝胶电解液,具有高能量密度和高安全性的显著优势。

上海交通大学副教授、未来电池研究中心执行主任万佳雨长期从事固态电解质研发。他坦言,尽管当前新材料层出不穷,但在固态电池领域,真正有应用前景的材料不过十余种,若按大类划分仅有寥寥几类。“在模型训练中,如果没有足够的数据‘下锅’,就难以训练出一个好模型。”

在生物领域,蛋白质是生物制造的底层材料。过去,开发一款成功的蛋白质产品高度依赖科学家经验,过程漫长且试错成本高昂,成功率偏低。由于蛋白质研发设计技术门槛高,导致优质供给不足,国际垄断现象严重,我国尤其面临着工业酶70%依赖进口的困境。利用AI高效设计蛋白质,关键在于攻克蛋白质功能预测难题,而数据则是重中之重。

“人工智能需要数据,不仅要求数据量大,而且要求数据的差异化程度高。上海交通大学特聘教授、天鹜科技首席科学家洪亮团队开发了AI蛋白质设计平台Venus。他们让大模型学习极端工况下的蛋白质功能,并以此辅助蛋白质设计,进而开发出全球首款由大模型设计且实现工业化生产的蛋白质。”洪亮解释道,这一策略的成功,完全依赖于底层数据的规模与质量。

为了解决数据问题,洪亮团队组建了全球最大的蛋白质数据库,收录了150亿条蛋白质序列,其中包含67亿条私有数据,既有来自马里亚纳海沟的深海蛋白质数据,也有中国大西北盐湖的蛋白质数据。

“我们在数据层面遇到的核心痛点并非数据获取难,而在于数据高度非标准化。”洪亮表示,各方提供的数据格式各异,缺乏统一规范。为了清洗每一条序列并进行标准化标注,团队为65亿条蛋白质数据打上环境标签,才将原始的“杂乱”数据转化为可用的研究数据。

协同合作打破数据壁垒,探索市场闭环

数据采集、专业的标注与数据共享,是推进AI for Science不可或缺的关键要素。

“许多科学领域的专业数据并不公开,也缺少团队投入资源去完成那些繁琐的数据加工工作,但AI for Science的数据必须共享。”上海科学智能研究院副院长程远介绍,该院旗下的星河启智科学智能开放平台的数据广场已建成超过4万个高质量科学数据集,数据总量达12PB。

上海科学智能研究院的经验是构建多层次的人才体系:20多位专职数据工程师从事数据加工和批量化处理,200多位在校学生和聘用人员专职从事数据标注,1000多位众包人员承担数据校验和初级标注。除了丰富的科学语料资源和海量数据储备,平台的数据加工工具确保了数据质量和科研可用性,明晰的数据权属机制则推动了数据合规生产和开放共享。“我们与高校、企业合作,加工和开放了16个领域的专业数据。他们既是平台使用者,也是建设者,贡献了数据和模型。”程远说。

去年9月,上海人工智能实验室联合合肥实验室、临港实验室等12家国家实验室成立了上海科学智能战略科技力量联盟,同时吸引众多高校和科研机构加入,共同梳理联盟体系内的各学科数据,以打破数据壁垒。

上海人工智能实验室青年科学家、科学智能中心负责人白磊认为,要推动AI for Science取得实质进展,首先必须清晰界定人工智能,特别是通用人工智能(AGI)在科学领域的能力表现,系统解析不同学科和科研流程对AI能力的差异化需求,摒弃“胡子眉毛一把抓”的做法。与此同时,AI for Science在模型训练阶段投入巨大,海量数据整合与算力支撑必然要求集结更广泛的力量协同攻关,加强合作。

人工智能的赋能也不应止步于科学发现。上海大学材料基因组工程研究院副教授高兆和表示,AI for Science要从科学研究落地工程,实现从研究到产业的贯通,否则任何技术突破都只是昙花一现。

在洪亮看来,AI for Science的发展有其客观规律,不同学科的商业化程度、数据积累和技术能力各不相同,应当选择兼具产业基础、技术优势和数据积累的领域先行先试,建立以智能体为核心的科研生态,探索从研究到应用的市场闭环。AI for Science的可持续发展必然依托于强大的生态系统,要通过生态链接,有效承接技术与需求,释放AI设计能力。在这一过程中,政府的角色应是引导、搭台、共建,待模式成熟后逐步有序退出。

来源:https://www.163.com/dy/article/KIJ554LO0514R9P4.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
2026 款荣耀 MagicBook Pro 14 三色公布:月光白、青瓷绿、星辰灰

2026 款荣耀 MagicBook Pro 14 三色公布:月光白、青瓷绿、星辰灰

2026款荣耀MagicBook Pro 14三色公布:月光白、青瓷绿、星辰灰 荣耀官方今日正式揭晓了2026款MagicBook Pro 14的三种全新配色:优雅的月光白、典雅的青瓷绿以及稳重的星辰灰。这三款色彩设计精准覆盖了不同用户的个性化审美,从商务人士偏爱的经典灰调,到年轻用户青睐的清新绿色

时间:2026-04-02 20:15
TCL空调落子南沙:中国智造出海的新叙事

TCL空调落子南沙:中国智造出海的新叙事

广州南沙TCL空调超级工厂投产:智能制造如何赋能全球市场布局? 三月,广州南沙上演了一场极具视觉张力的科技演示。在TCL空调智能制造基地正式投产的现场,一台由巨型无人机吊装、刚刚下线的“小蓝翼”新风空调内机,凌空飞越整个厂区,最终精准降落在舞台后方。短短三分钟内,工程人员便完成了上墙安装,产品自动滑

时间:2026-04-02 20:07
机械革命苍龙 18 Pro正式发售,最低7904.15元起售

机械革命苍龙 18 Pro正式发售,最低7904.15元起售

机械革命苍龙 18 Pro 发售:18英寸大屏游戏本如何实现轻薄与性能兼得? 3月30日,备受关注的机械革命苍龙 18 Pro 游戏本正式上市。这款笔记本精准切入市场痛点,巧妙地将18英寸超大视野、旗舰级硬件性能与轻量化机身设计融为一体,为寻求高性能大屏体验的用户,提供了一个在主流价位段极具竞争力的

时间:2026-04-02 20:07
兮克推出全闪存 AI NAS FS5206D,搭载英特尔酷睿 Ultra 7 255H 处理器

兮克推出全闪存 AI NAS FS5206D,搭载英特尔酷睿 Ultra 7 255H 处理器

兮克震撼发布:全闪存 AI NAS 新品 FS5206D,强悍搭载英特尔酷睿 Ultra 7 255H 上周末,知名存储品牌兮克 XikeStor 正式对外发布了其年度重磅产品——全闪存 AI NAS(网络附加存储)兮甲云 FS5206D。这款设备绝非寻常的家用或办公网络存储器,它集多项尖端技术于一

时间:2026-04-02 20:06
洛斐 × QQ 音乐联名机械键盘 DOT | 432Hz 上市,999 元

洛斐 × QQ 音乐联名机械键盘 DOT | 432Hz 上市,999 元

洛斐 × QQ 音乐联名机械键盘 DOT | 432Hz 详细评测:治愈系声景与手感如何? 近日,知名外设品牌洛斐 Lofree 与 QQ 音乐达成深度合作,共同推出了一款极具创意的跨界新品——DOT | 432Hz 联名机械键盘。目前该键盘的官方售价为 999 元,现已正式发售。这款键盘最大的亮点

时间:2026-04-02 19:59
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程