数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

深度拆解Step-DeepResearch：阶跃星辰首个单智能体架构详解

深度拆解Step-DeepResearch：阶跃星辰首个单智能体架构详解

热心网友时间：2026-01-26

转载

转载自：阶跃星辰

比肩 gemini、成本直降 90%！

向大家介绍我们最新端到端深度研究智能体模型：step-deepresearch。

它能做什么？

会思考：懂规划、会反思、还能自主验证信息的真伪，不只是数据爬虫。

更专业：结合高质量搜索 api，内置 2000 万+ 高质量文档库和 600+ 权威站点索引，过滤低信源信息干扰。

更聪明：独特的原子能力训练法，让模型把“专家思维”内化在骨子里。

在针对真实复杂场景的 adr-bench 评测中，step-deepresearch 表现出极强竞争力，在多个维度上全面超越海内外一线 deepresearch 产品和模型，包括基于千亿级甚至万亿级参数 moe 架构的 gemini deepresearch、openai deepresearch 等模型。

而 step-deepresearch 仅基于单智能体架构实现。

在我们的技术报告全面公开后，立刻引发海内外社区热烈讨论，并入选 huggingface daily papers。

现在，我们开启 api 内测，欢迎大家踊跃体验！

论文地址：https://arxiv.org/pdf/2512.20491

github：https://github.com/stepfun-ai/stepdeepresearch

api 内测：https://wvixbzgc0u7.feishu.cn/share/base/form/shrcn8cp78pjgkjvvih2c3ef3cc

最新主页：https://www.stepfun.com/deep-research-invitation

step-deepresearch 在多项权威基准测试中都达到全球顶尖水平。

在 research rubrics 上，step-deepresearch 得分 61.42%，仅次于 gemini deepresearch（约 63.69分），且超越了 openai deepresearch。

在“引用质量”和“沟通质量”两个维度上达到了行业最高水平。

在针对真实研究场景的 adr-bench 评测中，step-deepresearch 的人类 elo 评分在多个维度处于第一梯队。

特别是在与 gemini deepresearch等顶尖模型的直接博弈中，其“胜+平”率高达67.1%，证明了其生成的报告质量已达到当前最先进水平。

step-deepresearch 引用最新行业动态（step-gui、豆包手机等），来自上百条条高质量信源，内容覆盖底层技术、应用、挑战与争议，客观全面分析议题，达到标准调深度研报告水平。

▲上下滑动查看详细内容

step-deepresearch 的主要创新可归纳为3方面：

基于原子能力的数据合成策略

渐进式智能体训练范式

自建 adr-bench 评估体系

我们将深度研究能力拆分为四个原子能力，并针对性地合成数据进行强化。

规划与任务拆解：能将模糊、宏大的用户需求拆解为可执行的子任务，并根据环境反馈动态调整路径。

深度信息搜索：具备多跳推理能力，能在信息不完整时进行“主动拓扑行走”，挖掘隐藏实体。

反思与验证：拥有“自纠错”和“事实核查”能力，能识别自身错误并区分网络信息的真伪，通过跨源验证确保逻辑严密。

报告生成：通过中期训练（mid-training）学习专家写作风格，并利用 sft 确保报告严格遵循规划结构和引用规范。

我们的智能体训练范式主要包含三个阶段：

agentic mid-training：在预训练和微调之间加入 mid-training，通过 32k 和 128k 两个阶段的上下文调度，注入原子能力，使模型内化“下一步行动”的决策逻辑，而非简单的“预测下一个 token”。

sft：侧重于长程决策轨迹的合成与领域适配，强化意图理解、规划执行及严格引用格式的遵循，解决模型在长时间研究任务中容易“分心”或“迷路”的问题。

rl：引入 checklist-style judger 奖励设计，将复杂的报告质量评估转化为细粒度的信号，进一步优化长程决策的鲁棒性。

在系统架构上，我们采用单智能体 react 架构，避免复杂多智能体系统协作带来的系统冗余。

此外，为了填补中文深度研究评估的空白，我们还构建了 adr-bench，涵盖商业调研、政策分析、软件工程等 9 大领域，包含通用和专业（法律、金融）两个维度。该基准测试不仅关注搜索结果是否正确，更加关注研究过程中的逻辑严密性、意图识别深度以及长程决策的鲁棒性。

欢迎转发，但请注明出处“上海经信委”

上观号作者：上海经信委

来源:https://www.163.com/dy/article/KK7MEQ18055040N3.html

上一篇：春节快递不打烊：多家公司宣布节日期间价格调整

下一篇：欧盟正式调查马斯克X平台：指控制造Grok生成深度伪造图片

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售，支持4K165Hz与FHD520Hz双模切换，定价1888元。采用FastIPS面板，97%DCI-P3色域，配备升降支架及双HDMI2 1和双DP1 4接口。

时间：2026-07-03 12:53

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年，DRAM与NAND闪存的供应持续紧张及价格不断攀升，正逐步传导至终端消费市场。可以预见，下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价，最终连苹果也不得不跟进，宣布提升iPad、Mac及家居设备的价格，以应对存储成本的快速上涨。 TrendForce分析指出，苹果全面

时间：2026-07-03 12:53

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz，不支持5G毫米波。因此，美版iPhone18Pro继续采用高通基带方案以支持毫米波，而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中，用户峰值速率可能显著低于美版用户。

时间：2026-07-03 12:53

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日，公司正式对外发布了两款自主研发的全新产品：一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达，另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看，此次发布直指气象监测与灾害预警领域的技术制高点。先来看这款S波段雷达

时间：2026-07-03 12:53

南航国际创新港一期交付四大专业园区打造空天产业强磁场

南航国际创新港一期交付四大专业园区打造空天产业强磁场

近日，南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用，成功串联起高校科研能量、地方产业载体与市场创新主体，为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链，提供了坚实的物理支撑。该创新港一期位于六合区雄州街道，分为3号和4号两个

时间：2026-07-03 12:52

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

灰度：比特币腰斩后已近本轮周期底部

女股神逆市抄底7500万美元无视Circle暴跌40%

乌兹别克斯坦加密挖矿特区详解：税收优惠政策与投资机遇

MOVR币与GLMR币区别解析波卡生态中Moonriver和Moonbeam关系详解

UFR币购买全攻略：新手入门指南与投资前景解析

欧易个人账号身份认证流程及常见问题解答

特朗普延长美伊停火协议正式和平协议前景渺茫

CZ宠物狗迷因币Broccoli 20分钟爆赚650万美元

年新手购买比特币避坑指南及注意事项

LGCY币未来价格走势分析深度解读LGCY币投资价值与前景

灰度：比特币腰斩后已近本轮周期底部

女股神逆市抄底7500万美元无视Circle暴跌40%

乌兹别克斯坦加密挖矿特区详解：税收优惠政策与投资机遇

MOVR币与GLMR币区别解析波卡生态中Moonriver和Moonbeam关系详解

UFR币购买全攻略：新手入门指南与投资前景解析

欧易个人账号身份认证流程及常见问题解答

特朗普延长美伊停火协议正式和平协议前景渺茫

CZ宠物狗迷因币Broccoli 20分钟爆赚650万美元

年新手购买比特币避坑指南及注意事项

LGCY币未来价格走势分析深度解读LGCY币投资价值与前景

灰度：比特币腰斩后已近本轮周期底部

女股神逆市抄底7500万美元无视Circle暴跌40%

乌兹别克斯坦加密挖矿特区详解：税收优惠政策与投资机遇

MOVR币与GLMR币区别解析波卡生态中Moonriver和Moonbeam关系详解

UFR币购买全攻略：新手入门指南与投资前景解析

欧易个人账号身份认证流程及常见问题解答

特朗普延长美伊停火协议正式和平协议前景渺茫

CZ宠物狗迷因币Broccoli 20分钟爆赚650万美元

年新手购买比特币避坑指南及注意事项

LGCY币未来价格走势分析深度解读LGCY币投资价值与前景

相关攻略

相关攻略

网络生态底层逻辑解析：开启高质量网络生活的5个关键

2026-01-28 15:01

网络生态底层逻辑解析：开启高质量网络生活的5个关键

俄亥俄州立大学联合推出首个多模态深度研究代理评估基准

2026-01-25 14:49

俄亥俄州立大学联合推出首个多模态深度研究代理评估基准

清华与阿里：生成任务中多模态理解能力的优化策略与实践

2026-02-02 19:07

清华与阿里：生成任务中多模态理解能力的优化策略与实践

甄别网络信息三步法：从理论到实践的核心指南

2026-02-03 11:46

甄别网络信息三步法：从理论到实践的核心指南

扩散模型如何预测？独立研究者揭秘最佳目标策略

2026-02-04 10:31

扩散模型如何预测？独立研究者揭秘最佳目标策略

淘宝闪购代际差距：AI如何改写外卖竞争维度

2026-01-16 17:01

淘宝闪购代际差距：AI如何改写外卖竞争维度

字节Seed大模型：未来推理新抓手，为何优先押注下一代令牌

2026-01-05 14:49

字节Seed大模型：未来推理新抓手，为何优先押注下一代令牌

openPangu-R-72B：登顶中文大模型深度搜索榜单SuperCLUE+

2025-12-10 17:25

openPangu-R-72B：登顶中文大模型深度搜索榜单SuperCLUE+

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

光与影33号远征队全收集标注地图完整版

光与影33号远征队全收集标注地图完整版发布于 2026-07-03

鸣潮丽贝卡声骸套装选择推荐

鸣潮丽贝卡声骸套装选择推荐发布于 2026-07-03

鸣潮丽贝卡武器选择攻略

鸣潮丽贝卡武器选择攻略发布于 2026-07-03

鸣潮丽贝卡值得抽取吗

鸣潮丽贝卡值得抽取吗发布于 2026-07-03

机器人角斗场手机版弓箭挑战玩法攻略

机器人角斗场手机版弓箭挑战玩法攻略发布于 2026-07-03

梦幻西游落宝金钱有什么用效果详细解析

梦幻西游落宝金钱有什么用效果详细解析发布于 2026-07-03

年男生女生互动小游戏推荐，增进感情精选合集

年男生女生互动小游戏推荐，增进感情精选合集发布于 2026-07-03

愤怒的小鸟经典归来与耐玩归来冠军小鸟玩法教程

愤怒的小鸟经典归来与耐玩归来冠军小鸟玩法教程发布于 2026-07-03

Win11频繁断网提示默认网关不可用怎么办

Win11频繁断网提示默认网关不可用怎么办发布于 2026-07-03

Mac如何取消正在进行的系统备份任务

Mac如何取消正在进行的系统备份任务发布于 2026-07-03

电脑显示器刷新率锁死60Hz无法调整的解决方法

电脑显示器刷新率锁死60Hz无法调整的解决方法发布于 2026-07-03

Linux系统下Systemd服务管理从零开始方法步骤详解完整教程

Linux系统下Systemd服务管理从零开始方法步骤详解完整教程发布于 2026-07-03

Google Chrome浏览器官方下载入口

Google Chrome浏览器官方下载入口发布于 2026-07-04

电脑正版Excel软件下载安装步骤

电脑正版Excel软件下载安装步骤发布于 2026-07-04

Excel电脑版免费下载安装

Excel电脑版免费下载安装发布于 2026-07-04

傲游浏览器安卓手机版官方免费下载安装

傲游浏览器安卓手机版官方免费下载安装发布于 2026-07-04

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集