面包屑图标 当前位置: 首页
AI资讯
热点详情

Claude Science助力科研10倍提速,几周完成两年工作量

AI热点日报
AI热点日报时间:2026-07-01
热点解读

过去需要两年才能完成的工作,如今只需短短几周便能收尾。 近日,艾伦研究所(Allen Institute)的神经科学家Jérôme Lecoq带领团队,将一篇长篇综述的撰写周期从将近两年大幅压缩至数周。他手头积压了大约十篇综述,许多篇幅超过100页,每一条引用都经智能体逐句验证。助力这一切实现的,正

过去需要两年才能完成的工作,如今只需短短几周便能收尾。

近日,艾伦研究所(Allen Institute)的神经科学家Jérôme Lecoq带领团队,将一篇长篇综述的撰写周期从将近两年大幅压缩至数周。他手头积压了大约十篇综述,许多篇幅超过100页,每一条引用都经智能体逐句验证。助力这一切实现的,正是Anthropic最新推出的应用——Claude Science。

2026年6月30日,Anthropic正式发布Claude Science,定位为面向科学家的AI工作台。(图片来源:Anthropic官方博客)

若是放在过去,仅这位科学家及其团队的时间投入,就需耗费整整两年。

Anthropic为Claude Science设定了清晰的定位:它并非又一个更聪明的科研模型,而是一个专为科学家打造的AI工作台。真正的突破在于,它首次将科研流程拆解为一条可逐步审计的流水线。

目前,Claude Science已在macOS和Linux平台开放beta版本,对Pro、Max、Team、Enterprise用户均可使用。

真正变革的,是整条科研工具链

做过科研的人都深知其中的繁琐。

项目进行到一半,需在数十个数据库间来回切换,每个库都有独立的schema和查询语言;文件格式五花八门,每种都必须临时搭建处理管线;手边摆着PubMed、Jupyter、R、集群终端,反复切换导致思路一次次中断。真正用于思考科学问题的时间,不知不觉就被这些搬运、拼接和调试工作消耗殆尽。

Claude Science的目标,正是将这一大堆「碎片化场景」全部收进一个工作台:文献分析、多步计算、图表打磨、论文成稿,所有环节都在同一环境中完成。你无需因更换工具而打断思路。

它可运行在本地的macOS或Linux系统上,也可通过SSH连接远程机器,或挂载到高性能计算(HPC)的登录节点。就像使用Jupyter一样,数据在哪里,它就去哪里。

就连算力调度这块,它也一并包揽。

折叠一个蛋白质结构,或在海量数据上运行一条基因组分析管线——这类繁重任务过去需要研究者自行处理:搭建计算任务、排队等待集群资源、监控成功或失败、再把结果拉回本地,来回一趟半天就没了。Claude Science接管了整个流程:先起草计划,在调用新资源前征询你的意见,编写任务、提交任务之前都允许你审查或撤销,分析规模可从1个GPU扩展至数百个。

Claude Science将一次8组scVI超参扫描派发至实验室A100集群运行,右侧Notebook与智能体共享同一个实时内核,变量和状态实时同步。(图片来源:Anthropic官方博客)

更关键的是,敏感数据不会离开原系统,仅有每一步真正需要的上下文才会发送给Claude。

每一张图,都附带可追溯的代码

科研领域天然与图像紧密相关:蛋白质三维结构、基因组浏览器轨道、化学结构式,这些都是图形。Claude Science顺着这一特点,在生成图表和稿件的同时,一并交出生成它们的代码,并能原生渲染这些图像。

更重要的在于可复现性。

每当Claude Science生成一张图表,它都会将生成该图的确切代码、运行环境、自然语言说明以及完整对话历史,一并打包「钉」在图上。

左侧是一张跨越138个物种的细胞图,右侧同屏展示生成它的确切代码,圈注一句即可让智能体修改图表。每个结果都可复现、可追溯到代码。(图片来源:Anthropic官方博客)

一篇论文从投稿到正式发表,往往间隔大半年。几个月后,如果审稿人要求重新运行某张图,你可以轻松地将输入、过程、结果整条链路当场复现。

想要改图?直接说话即可——「去掉网格线」「纵轴改为对数」,智能体便会直接修改它自己编写的代码。你还可以在任意节点将会话fork出去,同时尝试两条思路,原线程完全不受干扰。

一句话总结:科研首次被整合为一份可审计的工作流,代码(code)、环境(env)、历史(history)全部被纳入闭环之中。

一个智能体负责撰写,另一个专门挑错

Claude Science背后,并非单个智能体在单打独斗。

你面对的是一个能统筹协调的主智能体,它手中掌握着60多个预配置的技能和连接器,覆盖基因组学、单细胞分析、蛋白质组学、结构生物学、化学信息学等领域。任务增多时,它自己便能衍生出更多智能体来分工协作,同时也可随时调用你亲手创建的专家智能体。

最巧妙的设计当属审查智能体。

它专门负责核查引用和计算,揪出错误的引用、无法溯源的数字、与代码不对应的图表,一旦发现便标记出来并自行修正。

在艾伦研究所的案例中,团队采用的正是一套actor-critic配对机制:一个智能体负责撰写,另一个专门评估其准确性和引用的真实性。这套结构已初具「AI内部同行评审」的雏形。

但有一条边界必须明确:全程保持人类参与。在需要调用新资源之前,它会先征求你的授权,每个决策你都能复核、能撤销。它自动化的是流程,而非自动替你做出科学发现。

它还接入了NVIDIA的BioNeMo Agent Toolkit,能原生连接Evo 2、Boltz-2、OpenFold3等生命科学模型。你自有的模型、数据和管线,也能保存为可复用的技能挂载进来,后续会话可自动继承。

Claude Science的首个落脚点是生命科学

Claude Science将第一个应用场景选在了生命科学领域。

基因组学、单细胞分析、蛋白质组学、结构生物学、化学信息学——开箱即用。它能读取文献,能查询60多个科学数据库——UniProt、PDB、Ensembl、ClinVar、ChEMBL、GEO等规格各异的数据库,你无需逐个学习如何使用。

Claude Science为基因组学、单细胞分析、蛋白质组学、化学信息学预配置好环境,背靠60多个科学数据库。(图片来源:Anthropic官方博客)

Manifold Bio是一家专注于组织靶向药物的公司。他们利用Claude Science提名最新实验的靶点,对每个组织和靶点逐一评估表面表达、运输和安全性,再依据公司从自有数据中学习到的标准对候选靶点进行排序。Manifold表示,普通编程助手无法做到这一点,而Claude Science能够端到端地完成,获取正确的数据,做出准确的判断,同时保留过往项目的上下文。

还有更硬核的案例。加州大学旧金山分校(UCSF)脑瘤中心的一位流行病学副教授,用它开展脑胶质瘤的分子流行病学研究,分析数千个微效种系变异如何叠加并塑造个体易感性。

据Anthropic介绍,这套种系分析,Claude Science大约只用了过去十分之一的时间就跑完了,团队还独立复核过结果,确认既快又稳。

不过,这些10倍提速的场景目前仅限于综述写作、基因组分析、特定管线自动化等方面,并不等同于「科研整体提速10倍」。

与此同时,科研可信度的门槛也在被重新定义。

过去衡量一项研究是否可靠,要看同行评审,看能否被他人复现。而「可复现」恰恰是长期以来的最大痛点之一:代码丢失、环境变化,几个月后连作者自己都跑不出当初的图表。Claude Science让每张图都附带可追溯的代码,每个结果都连接着它的环境和历史。在跨越可复现这道坎上,它或许是最先迈过去的工具。

同一条赛道,三种不同的玩家打法

在生物科研这条赛道上,三大巨头都在竞相布局,但玩法各有不同。

Google押注的是独门模型,OpenAI押注的是模型的科研智商,而Anthropic押注的则是工作流。

Google手里握有AlphaFold、AlphaGenome等别人没有的自研模型,直接下场。OpenAI走的是另一条路线:今年4月推出GPT-Rosalind——一个专为生物推理和药物开发打造的前沿模型。如今更进一步,开始训练模型的「科研判断力」。它刚刚推出的GeneBench-Pro,专门测试模型能否像计算生物学家那样做出判断——129道题,从基因组学、群体遗传学到临床诊断,重点考查「数据是否足以支撑这个结论」「哪一步该推翻重来」的直觉。

最强的GPT-5.6 Sol得分28.7%,开启Pro模式后达到31.5%;而几代前的GPT-5得分还不到5%。

OpenAI自己表示,按照这个速度,年底前这个基准就有可能被刷爆。

然而,再强的模型也只解开了不到三分之一的题目。而解不开的那部分,恰恰是人类科学家的用武之地。

GeneBench-Pro暴露出的AI短板也很明显:模型能够起一个好头,却收不拢最后一环。例如,是否应该剔除一批异常数据、假设被推翻后如何调整方向——这类判断仍然需要科学家自己拍板。

Claude Science也没有绕过这一点:方案交给人审,每个决定留给人撤销,它自动化的是流程,判断权没有交给模型,人类始终在回路中。

对Lecoq这样的科学家来说,一篇综述能否被复现、几个月后是否站得住,远比榜单上多出零点几个百分点更加重要。Claude Science赌的,正是让AI科研真正落地到实验室的日常之中。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Claude Science助力科研10倍提速,几周完成两年工作量要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://36kr.com/p/3876832629714945
Claude

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-02 08:38
一加Turbo 6X系列开售 搭载天玑芯片1499元起

一加Turbo6X开售,含标准版与Pro版,起售价1499元,国补价1274 15元。搭载天玑7360SUPER和7400SUPER,144Hz屏,7000 8000mAh电池,主打长续航高性价比。

AI热点2026-07-02 08:38
蔚来三款冠军纪念版上市 租电起售价20.5万元

蔚来汽车近日上市了2026款ET5、ET5T和EC6的冠军纪念版车型。新车主打赛道竞速设计风格,提供专属外观内饰与智能座舱主题。最大的亮点在于推出了BaaS电池租用方案,ET5 ET5T租电版起售价20 5万元,EC6租电版起售价26 5万元,大幅降低了购车门槛。车辆在底盘方面进行了针对性调校,提升

AI热点2026-07-02 08:38
战争机器E-Day PC配置公布 最低要求RTX5050与RX9060

微软射击游戏《战争机器:E-Day》公布PC配置要求,将于2026年10月发售。配置清单引人注目地将尚未发布的RTX5050和RX9060显卡列为最低要求,同时兼容多款现有中端显卡。游戏需130GB固态硬盘空间,最低要求12GB内存和六核CPU。官方未明确对应画质与帧数,但推测将依赖超分辨率技术

AI热点2026-07-02 08:38
软科中国大学专业排名出炉北大清华哈工大前三

软科近日发布2026年中国大学专业排名,覆盖1132所高校的3万余个专业点。排名显示,北京大学以93个A+专业位居榜首,清华大学和哈尔滨工业大学分列二、三位。榜单同时引入“A+专业精度”指标,中国人民公安大学以93 8%的精度领先。此外,北京大学、吉林大学、武汉大学在上榜专业总数上位列前三。该排名从

延伸阅读