西湖大学推出DeepScientist系统：AI自主科研，两周成果抵人类三年

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

西湖大学推出DeepScientist系统：AI自主科研，两周成果抵人类三年

热心网友时间：2025-10-08

转载

西湖大学自然语言处理实验室近日宣布，其研发的AI科学家系统DeepScientist在科研领域取得突破性进展。该系统首次实现了完全自主的科研探索能力，能够在无人工干预的情况下，持续提出并验证具有科学价值的假设，展现出超越人类专家的研究效率。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

在AI文本检测任务中，DeepScientist仅用两周时间就完成了相当于人类科学家三年的研究进展。系统自主生成了2472个独特研究想法，其中600个假设经过代码实现和实验验证，最终在RAID数据集上实现了7.9%的AUROC提升，同时将推理延迟降低190%，显著超越了当前最先进的人类研究成果。

与传统AI科研系统不同，DeepScientist不再局限于执行预设任务，而是能够主动识别研究领域的根本性局限，提出创新性的科学构想。系统具备完整的科研能力链条，包括自动编写代码、执行实验、分析结果、撰写论文以及开源可重现代码，实现了从问题发现到成果输出的全流程自动化。

该系统的核心机制基于分层贝叶斯优化框架，将复杂的科学发现过程转化为目标驱动的决策问题。通过多智能体协同策略，DeepScientist构建了三层级评估循环，根据不同保真度的实验结果动态分配计算资源。这种设计使系统能够在有限的预算内，精准识别最具潜力的研究方向。

在智能体失败归因任务中，DeepScientist展现了强大的结构化推理能力。面对现有方法难以解决的因果推理难题，系统自主开发了A2P（Abduction-Action-Prediction）方法，将失败归因从模式识别提升到因果推理层面。该方法在Who&When基准测试中取得47.46分，性能较人类专家基线提升183.7%。

研究数据显示，DeepScientist的实验成功率远超自动化科学发现领域的平均水平。系统通过记忆驱动的迭代机制，将成功与失败的经验都转化为后续决策的依据。这种持续学习模式使系统能够在数月内自主运行，不断优化研究策略，展现出稳定的科学发现能力。

计算资源扩展实验揭示了有趣的"科学发现缩放定律"。当GPU资源从1枚增加到16枚时，系统每周产出的前沿科学发现数量从0项跃升至11项，呈现出近乎线性的增长趋势。这表明科学突破可以通过系统化增加计算资源来实现规模化生产，为科研范式转型提供了新思路。

DeepScientist的研发团队强调，该系统并非要取代人类科学家，而是开创人机协同的新模式。人类研究者将专注于提出具有前瞻性的科学问题，AI则作为高效的探索引擎，在人类智慧的指引下加速科学发现进程。这种协作模式有望解决基础物理、新药研发等领域的重大挑战。

为推动这一范式的发展，研究团队决定开源DeepScientist的核心系统和全部实验日志。实验室现已开放免费服务申请，欢迎全球科研人员共同参与建设高效的科学发现体系。该系统特别适用于需要大规模假设验证的前沿研究领域，能够显著提升研究效率。

西湖大学自然语言处理实验室由张岳教授领导，专注于语言模型推理、泛化和通用人工智能研究。实验室近期系统撰写了AI科学家方向的综述论文，为领域发展提供理论参考。相关成果已通过开源仓库和在线平台公开，供全球科研社区使用。

来源:https://www.itbear.com.cn/html/2025-10/980202.html

上一篇：清华物理系才子姚顺宇告别Anthropic，9月29日正式加入Google DeepMind开启新程

下一篇：孙正义再拓版图：软银54亿美元收购ABB机器人业务，发力物理人工智能