FlowSearch智能体:上海AI实验室推出深度科研自动化方案

将复杂科研过程自动化落地,上海人工智能实验室推出FlowSearch!
在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务中的动态协作与深度推理能力。
展开来说,当AI在问答基准和标准化测试中表现卓越之时,其进行科学研究的能力也在被更多关注。
科学研究不同于解题或信息检索,它是一个开放性、长期且复杂的认知过程——研究者需要提出原创问题、设计实验方案、收集并整合多源证据,并在不断迭代中形成系统结论。
这样的过程远超计算能力本身,它要求的是创新思维、动态推理能力以及对复杂知识关系的精准掌控。
而FlowSearch,正是一个由动态结构化知识流驱动的深度科研智能体。
它通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。
与传统“输入—计算—输出”的封闭式AI不同,FlowSearch更像一个理解你研究思路的伙伴——当发现新信息,它会主动调整计划;当证据链不完整,它会引导进一步探索;当推理偏离目标,它会进行自我修正。
研究团队表示,它标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段,让科学发现不再只是等待AI输出结果,而是与AI一起探索、不断前进。
FlowSearch:让AI成为你的科研探索伙伴
FlowSearch由三大核心模块组成,每个模块都像科研团队中的“关键成员”,协同完成复杂任务:
1、Knowledge Flow Planner:规划研究路线,像科学家一样拆解问题、逐层细化制定任务;
2、Knowledge Collector:执行任务、收集信息,就像勤奋的实验助理一样整理数据;
3、Knowledge Flow Refiner:反思和优化整个研究流程,确保科研思路清晰、连贯、可持续。
当你提出研究问题时,FlowSearch先由Planner构建初步的知识流——每个节点代表一个子问题或关键概念,节点之间的连接描绘了知识依赖关系。
随后,多名“智能体”同时开始执行任务,Collector不断填充节点内容,而Refiner会根据中间结果动态调整流程——增删任务、优化依赖,让科研路径像有生命一样逐步演化。
动态结构化知识流:科研的逻辑网络
FlowSearch使用有向无环图把科研任务和知识关系可视化。每个节点都携带任务类型(检索、求解、回答)、描述和知识上下文,而节点间的边定义了信息流向。
这种设计让科研推理不再依赖线性顺序,而能同时展开多条探索路径,每一步都可追踪和验证。
换句话说,它不仅让 AI 能“想清楚每一步”,也让你能随时理解科研过程的脉络。
递归式知识流规划:逐层拆解科研问题
高质量的科研规划源于逐层细化的专家式思维。Planner模块采用递归扩展策略——从总问题出发,识别每一层需要细化的子任务,生成新的节点和依赖关系。
这一过程持续进行,直到形成完整的初始知识流。FlowSearch中的InternPlanner模型经过结构化科研任务数据微调,能够学习专家的拆解方式,让AI的规划既逻辑清晰,又稳健可靠。
知识采集与动态反思:让科研像“活”起来
Knowledge Collector执行任务、收集信息,并把结果整理成节点知识,为后续推理提供输入。
任务执行完成后,Knowledge Flow Refiner会启动反思机制:它能根据新信息调整节点和依赖关系,优化任务顺序,确保知识流持续进化。
这意味着FlowSearch不只是一个执行工具,它具备自组织、自纠错、自优化能力,可以在复杂科研任务中保持全局一致性,同时灵活应对局部变化。
以上设计让FlowSearch同时具备:
层次化分解能力:仿佛每个科研问题都能被拆解到最合适的颗粒度; 多路并行探索能力:智能体可以同时处理多个任务,提高效率; 全局收敛能力:动态调整确保最终知识流完整、逻辑自洽。无论是复杂跨学科研究,还是大规模数据分析,FlowSearch都能让科研不再只是“等待AI输出”,而是真正的与AI共同探索。
实验结果与分析
1、综合性能突破
FlowSearch在三大权威基准GAIA、GPQA-diamond、HLE上,全面超越现有方法。
在生物领域的专业基准TRQA上,FlowSearch依托通用工具链超越了多个领域专用模型,显示出强大的专业问题解决能力。
2、模块有效性验证
去除动态知识流建模或反思模块均导致显著性能下降,验证了结构化规划与动态调整机制在提升推理深度与系统稳定性方面的关键价值。
3、Internplanner模型训练效果
经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点,表明结构化知识训练能够显著增强模型的规划能力与任务一致性。
4、案例分析
通过FlowSearch与OWL的对比案例可以看出,FlowSearch通过显式依赖建模与中间结果整合,有效避免了证据丢失与逻辑链断裂,展现出更高的推理透明度与可解释性。
同时,FlowSearch不仅能够高质量地完成科研问答任务,还能直接适配于科学调研与报告生成任务,产出完整、全面且逻辑清晰的科学调研成果。
应用前景与科研影响
团队表示,FlowSearch的提出标志着科研智能体从“任务执行”向“知识驱动推理”的关键转变。
对于科研新人,它能够构建完整的知识探索路径,降低进入新领域的学习门槛;
对跨学科研究者,它提供了知识流整合与多模态信息融合能力;
对资深学者,它可作为智能研究助手,在假设生成、证据聚合和报告撰写阶段显著提升效率。
更重要的是,FlowSearch的动态结构化框架为未来可解释科研智能体与自演化科学发现系统奠定了通用基础——使智能体具备类研究者的思考、探索与自我反思能力,推动人工智能从工具向真正的科研伙伴演进。
论文链接:https://arxiv.org/abs/2510.08521
GitHub仓库:https://github.com/Alpha-Innovator/InternAgent
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
星舰十一飞圆满收官!SpaceX完成二代测试,启动三代及返场研发
马斯克旗下SpaceX公司于近日完成了星舰第十一次综合飞行测试,此次测试标志着第二代星舰研发工作进入尾声。测试中,超重型助推器与飞船均按预定程序完成关键动作,为第三代星舰技术验证积累了重要数据。本次
王宁向库克赠送苹果雕塑 库克手捧LABUBU玩偶亲切互动
库克又来中国了。10月的上海,一场潮玩盛宴迎来特殊客人。苹果公司首席执行官蒂姆·库克在中国行首站,便踏入THE MONSTERS(精灵天团)十周年巡展的奇幻空间。在泡泡玛特创始人王宁与设计师龙家升陪
Meta提出推理新方法:训练AI记忆解题捷径,推理效率翻倍
Meta 又一次在 AI 推理上“开了挂”。 一份新论文显示,Meta 的研究团队找到一种让大模型“用更少思维,想得更清楚”的办法。 这篇论文名为《Metacognitive Reuse: Tu
CO气体检测仪:为科研实验提供高精度监测与安全保障
睿安作为生态环境与工业安全监测领域的系统服务商,始终以技术创新为核心驱动力,现已形成覆盖气体检测仪、VOC在线监测设备、粉尘检测仪等20余类环境监测仪器的研发制造体系,并累计获得50余项软件资质、1
Pika Figure03开箱实测:性价比逆袭的多模态AI
10月10日消息,Figure宣布上新,推出了第三代AI人形机器人。产品更新的主要突破点是感官套件和手部系统,Figure的工程师在软硬件领域均做了调整,用于实现 Helix - Figure 专有
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















