首页科技资讯软件教程游戏攻略手机游戏

首页

科技

FlowSearch智能体：上海AI实验室推出深度科研自动化方案

FlowSearch智能体：上海AI实验室推出深度科研自动化方案

热心网友

转载

2025-10-14

来源:https://36kr.com/p/3508669072759937

将复杂科研过程自动化落地，上海人工智能实验室推出FlowSearch！

在GAIA、HLE、GPQA以及TRQA等科研基准上，FlowSearch不仅实现了性能全面领先，还展示了AI在复杂科研任务中的动态协作与深度推理能力。

展开来说，当AI在问答基准和标准化测试中表现卓越之时，其进行科学研究的能力也在被更多关注。

科学研究不同于解题或信息检索，它是一个开放性、长期且复杂的认知过程——研究者需要提出原创问题、设计实验方案、收集并整合多源证据，并在不断迭代中形成系统结论。

这样的过程远超计算能力本身，它要求的是创新思维、动态推理能力以及对复杂知识关系的精准掌控。

而FlowSearch，正是一个由动态结构化知识流驱动的深度科研智能体。

它通过动态结构化知识流构建科研任务的多层依赖图，并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。

与传统“输入—计算—输出”的封闭式AI不同，FlowSearch更像一个理解你研究思路的伙伴——当发现新信息，它会主动调整计划；当证据链不完整，它会引导进一步探索；当推理偏离目标，它会进行自我修正。

研究团队表示，它标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段，让科学发现不再只是等待AI输出结果，而是与AI一起探索、不断前进。

FlowSearch：让AI成为你的科研探索伙伴

FlowSearch由三大核心模块组成，每个模块都像科研团队中的“关键成员”，协同完成复杂任务：

1、Knowledge Flow Planner：规划研究路线，像科学家一样拆解问题、逐层细化制定任务；

2、Knowledge Collector：执行任务、收集信息，就像勤奋的实验助理一样整理数据；

3、Knowledge Flow Refiner：反思和优化整个研究流程，确保科研思路清晰、连贯、可持续。

当你提出研究问题时，FlowSearch先由Planner构建初步的知识流——每个节点代表一个子问题或关键概念，节点之间的连接描绘了知识依赖关系。

随后，多名“智能体”同时开始执行任务，Collector不断填充节点内容，而Refiner会根据中间结果动态调整流程——增删任务、优化依赖，让科研路径像有生命一样逐步演化。

动态结构化知识流：科研的逻辑网络

FlowSearch使用有向无环图把科研任务和知识关系可视化。每个节点都携带任务类型（检索、求解、回答）、描述和知识上下文，而节点间的边定义了信息流向。

这种设计让科研推理不再依赖线性顺序，而能同时展开多条探索路径，每一步都可追踪和验证。

换句话说，它不仅让 AI 能“想清楚每一步”，也让你能随时理解科研过程的脉络。

递归式知识流规划：逐层拆解科研问题

高质量的科研规划源于逐层细化的专家式思维。Planner模块采用递归扩展策略——从总问题出发，识别每一层需要细化的子任务，生成新的节点和依赖关系。

这一过程持续进行，直到形成完整的初始知识流。FlowSearch中的InternPlanner模型经过结构化科研任务数据微调，能够学习专家的拆解方式，让AI的规划既逻辑清晰，又稳健可靠。

知识采集与动态反思：让科研像“活”起来

Knowledge Collector执行任务、收集信息，并把结果整理成节点知识，为后续推理提供输入。

任务执行完成后，Knowledge Flow Refiner会启动反思机制：它能根据新信息调整节点和依赖关系，优化任务顺序，确保知识流持续进化。

这意味着FlowSearch不只是一个执行工具，它具备自组织、自纠错、自优化能力，可以在复杂科研任务中保持全局一致性，同时灵活应对局部变化。

以上设计让FlowSearch同时具备：

层次化分解能力：仿佛每个科研问题都能被拆解到最合适的颗粒度；多路并行探索能力：智能体可以同时处理多个任务，提高效率；全局收敛能力：动态调整确保最终知识流完整、逻辑自洽。

无论是复杂跨学科研究，还是大规模数据分析，FlowSearch都能让科研不再只是“等待AI输出”，而是真正的与AI共同探索。

实验结果与分析

1、综合性能突破

FlowSearch在三大权威基准GAIA、GPQA-diamond、HLE上，全面超越现有方法。

在生物领域的专业基准TRQA上，FlowSearch依托通用工具链超越了多个领域专用模型，显示出强大的专业问题解决能力。

2、模块有效性验证

去除动态知识流建模或反思模块均导致显著性能下降，验证了结构化规划与动态调整机制在提升推理深度与系统稳定性方面的关键价值。

3、Internplanner模型训练效果

经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点，表明结构化知识训练能够显著增强模型的规划能力与任务一致性。

4、案例分析

通过FlowSearch与OWL的对比案例可以看出，FlowSearch通过显式依赖建模与中间结果整合，有效避免了证据丢失与逻辑链断裂，展现出更高的推理透明度与可解释性。

同时，FlowSearch不仅能够高质量地完成科研问答任务，还能直接适配于科学调研与报告生成任务，产出完整、全面且逻辑清晰的科学调研成果。

应用前景与科研影响

团队表示，FlowSearch的提出标志着科研智能体从“任务执行”向“知识驱动推理”的关键转变。

对于科研新人，它能够构建完整的知识探索路径，降低进入新领域的学习门槛；

对跨学科研究者，它提供了知识流整合与多模态信息融合能力；

对资深学者，它可作为智能研究助手，在假设生成、证据聚合和报告撰写阶段显著提升效率。

更重要的是，FlowSearch的动态结构化框架为未来可解释科研智能体与自演化科学发现系统奠定了通用基础——使智能体具备类研究者的思考、探索与自我反思能力，推动人工智能从工具向真正的科研伙伴演进。

论文链接：https://arxiv.org/abs/2510.08521

GitHub仓库：https://github.com/Alpha-Innovator/InternAgent

上一篇：Sora2上线或重塑抖音生态，万亿市场赛道正在开启

下一篇：2025年11月实施新车牌网办，全流程线上办理更便捷

免责声明

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

星舰十一飞圆满收官！SpaceX完成二代测试，启动三代及返场研发

马斯克旗下SpaceX公司于近日完成了星舰第十一次综合飞行测试，此次测试标志着第二代星舰研发工作进入尾声。测试中，超重型助推器与飞船均按预定程序完成关键动作，为第三代星舰技术验证积累了重要数据。本次

2025-10-14.

王宁向库克赠送苹果雕塑库克手捧LABUBU玩偶亲切互动

库克又来中国了。10月的上海，一场潮玩盛宴迎来特殊客人。苹果公司首席执行官蒂姆·库克在中国行首站，便踏入THE MONSTERS（精灵天团）十周年巡展的奇幻空间。在泡泡玛特创始人王宁与设计师龙家升陪

2025-10-14.

Meta提出推理新方法：训练AI记忆解题捷径，推理效率翻倍

Meta 又一次在 AI 推理上“开了挂”。一份新论文显示，Meta 的研究团队找到一种让大模型“用更少思维，想得更清楚”的办法。这篇论文名为《Metacognitive Reuse: Tu

2025-10-14.

CO气体检测仪：为科研实验提供高精度监测与安全保障

睿安作为生态环境与工业安全监测领域的系统服务商，始终以技术创新为核心驱动力，现已形成覆盖气体检测仪、VOC在线监测设备、粉尘检测仪等20余类环境监测仪器的研发制造体系，并累计获得50余项软件资质、1

2025-10-14.

Pika Figure03开箱实测：性价比逆袭的多模态AI

10月10日消息，Figure宣布上新，推出了第三代AI人形机器人。产品更新的主要突破点是感官套件和手部系统，Figure的工程师在软硬件领域均做了调整，用于实现 Helix - Figure 专有

2025-10-14.

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门推荐

《使徒选择指南：嘟嘟脸恶作剧阵容搭配技巧》 15款热门嘟嘟脸恶作剧神器盘点嘟嘟脸恶作剧角色全解析：强度分析与实战表现平民阵容如何搭配？不朽箴言低成本最强攻略地下城堡4墓穴704-715层通关打法全解析红桃弓起源与特色解析：不朽箴言的传奇角色地下城堡4墓穴730通关阵容推荐地下城堡4墓穴695通关攻略：最佳阵容组合及打法技巧《地下城堡4》沙丘之月评测：是否值得重点培养《女神异闻录夜幕魅影》YUI幻彩饰品评测与搭配攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

光遇有友节第二周任务2攻略：带你快速完成互动挑战

光遇有友节第二周任务2攻略：带你快速完成互动挑战发布于 2025-10-14

失控进化开荒攻略：新手快速上手技巧分享

失控进化开荒攻略：新手快速上手技巧分享发布于 2025-10-14

GTAOL快捷药房任务攻略：高效通关与全奖励获取指南

GTAOL快捷药房任务攻略：高效通关与全奖励获取指南发布于 2025-10-14

荒原曙光奇物宝箱获取途径大全 4种高效方法解析

荒原曙光奇物宝箱获取途径大全 4种高效方法解析发布于 2025-10-14

地牢战争3第十四关打法教学：3步通关技巧与塔防布局详解

地牢战争3第十四关打法教学：3步通关技巧与塔防布局详解发布于 2025-10-14

iG 1:3不敌T1创纪录，成S15全球总决赛首支17强战队

iG 1:3不敌T1创纪录，成S15全球总决赛首支17强战队发布于 2025-10-14

《黑神话》WeGame与Epic平台更新发布，Steam版即将同步更新

《黑神话》WeGame与Epic平台更新发布，Steam版即将同步更新发布于 2025-10-14

伊藤润二恐怖游戏：美女被困诡异洋楼惊悚逃生

伊藤润二恐怖游戏：美女被困诡异洋楼惊悚逃生发布于 2025-10-14

欧美玩家错失的PS1经典：吉田修平坦言日本独占佳作

欧美玩家错失的PS1经典：吉田修平坦言日本独占佳作发布于 2025-10-14

张艺谋操刀！《王者荣耀》女娲三星堆皮肤免费获取攻略

张艺谋操刀！《王者荣耀》女娲三星堆皮肤免费获取攻略发布于 2025-10-14

iPhone 17 Pro双摄同步录制：前后相机可同时拍摄视频

iPhone 17 Pro双摄同步录制：前后相机可同时拍摄视频发布于 2025-10-14

iOS 26.1 Beta 3实测体验，爱思助手详细评测来了

iOS 26.1 Beta 3实测体验，爱思助手详细评测来了发布于 2025-10-14

iOS 26.1 beta 3发布：新功能体验与升级指南

iOS 26.1 beta 3发布：新功能体验与升级指南发布于 2025-10-14

工信部：即日起全国开通eSIM手机业务线上预约

工信部：即日起全国开通eSIM手机业务线上预约发布于 2025-10-14

神经科学家指控苹果AI训练侵权盗版书籍纠纷再起

神经科学家指控苹果AI训练侵权盗版书籍纠纷再起发布于 2025-10-14

三星Q3利润创三年新高，内存价格大涨15%拉动业绩

三星Q3利润创三年新高，内存价格大涨15%拉动业绩发布于 2025-10-14

HKC新款27寸QD-OLED显示器1999元首发：2K 240Hz电竞屏

HKC新款27寸QD-OLED显示器1999元首发：2K 240Hz电竞屏发布于 2025-10-14

东芝首发12碟40TB硬盘：2027年商用，容量再破纪录

东芝首发12碟40TB硬盘：2027年商用，容量再破纪录发布于 2025-10-14

笔记本升级固态硬盘新手教程：图文详解安装步骤

笔记本升级固态硬盘新手教程：图文详解安装步骤发布于 2025-10-14

免费替换Win10，魔改Linux畅玩Steam游戏

免费替换Win10，魔改Linux畅玩Steam游戏发布于 2025-10-14

最新下载

霸御乾坤0.1折

霸御乾坤0.1折角色扮演 2025-10-14更新

查看

鬼泣巅峰之战华为

鬼泣巅峰之战华为角色扮演 2025-10-14更新

查看

死亡细胞免费

死亡细胞免费飞行射击 2025-10-14更新

查看

苍之女武神折扣

苍之女武神折扣棋牌策略 2025-10-14更新

查看

哈利波特霍格沃茨之谜

哈利波特霍格沃茨之谜角色扮演 2025-10-14更新

查看

梦西游

梦西游角色扮演 2025-10-14更新

查看

聊斋搜灵录

聊斋搜灵录角色扮演 2025-10-14更新

查看

异界修真

异界修真角色扮演 2025-10-14更新

查看

鬼泣巅峰之战国际服

鬼泣巅峰之战国际服角色扮演 2025-10-14更新

查看

有杀气童话2九游

有杀气童话2九游角色扮演 2025-10-14更新

查看

热门话题

魔术游戏鸣人的假期刀塔传奇饥荒拉布布游戏洛克王国神魔幻想思美人疯狂越野