数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI

首个Deep Research评测基准：视频理解与开放网络搜索

首个Deep Research评测基准：视频理解与开放网络搜索

热心网友时间：2026-01-25

转载

由 QuantAlpha、兰州大学、香港科技大学（广州）、北京大学等机构的研究者联合推出了首个视频深度研究（Video Deep Research）评测基准 VideoDR。

在传统的视频问答（VideoQA）任务中，答案通常都直接蕴含在视频画面里。

然而，真正智能的视频 Agent 必须具备深度研究（Deep Research）的能力。

想象这样一个场景：你在视频中看到博物馆的一件展品，想知道“在这家博物馆推荐的展品中，距离这件展品最近的那个，它的注册编号是多少？”

这不仅需要看懂视频内容（识别展品、定位位置），还需要跳出视频本身，去博物馆官网查找地图、推荐列表和编号信息。

论文可在 arXiv 平台获取。

代码已在 GitHub 开源。

VideoDR (Video Deep Research) 正是为此而生，它定义了一种全新的任务模式：

多帧视觉线索：从多个连续视频帧中准确识别关键信息并进行推理。交互式网络搜索：在真实浏览器环境中进行交互，执行多跳深度搜索。多跳推理验证：结合视频线索与网络证据，提供可验证的事实性答案。

为了保证评测的含金量，VideoDR 并未采用自动化生成，而是进行了严格的人工标注与质检。

双重依赖性测试：剔除了那些“只看视频就能答”或“只搜文字就能答”的样本，确保模型必须具备结合两者信息的能力。

六大领域覆盖：涵盖日常生活、经济、科技、文化、历史、地理。

Workflow vs. Agentic

研究人员对比了两种主流范式：

工作流模式：先将视频内容转化为结构化文本线索，再进行搜索推理。代理模式：模型端到端地直接处理视频和搜索任务，自主决定何时搜索、何时思考。

评测模型：

闭源模型：GPT-5.2, GPT-4o, Gemini-3-pro-preview开源模型：Qwen3-Omni-30B-a3b, InternVL3.5-14B, MiniCPM-V 4.5

核心发现与洞见

谁是目前的王者？

Gemini-3-pro-preview 和 GPT-5.2 处于第一梯队，准确率达到 69% - 76%，显著领先于其他模型。

Agentic 模式一定更强吗？

答案是：不一定。

虽然 Agentic 模式更灵活，但在处理长视频或高难度任务时，模型容易出现目标漂移现象。

工作流模式的优势：显式的中间文本线索充当了“外部记忆”，防止模型在漫长的搜索链路中忘记最初视频里的关键视觉细节。代理模式的短板：一旦初始的视觉感知出现偏差，且无法回看视频，错误的搜索路径会被不断放大。

长视频是“照妖镜”

在长视频场景下，模型保持长期一致性（Long-horizon Consistency）的能力成为瓶颈。

强大的模型如 Gemini-3 在 Agentic 模式下能利用长上下文获得提升，而部分开源模型在长视频任务中性能反而大幅下降。

总结

VideoDR 将视频理解的战场从封闭的测试集延伸到了无限的开放网络。

评测结果深刻地揭示了“端到端”并非万能灵药：在面对长链路搜索任务时，模型往往会陷入“记忆衰退”的困境。

未来的视频 Agent 只有在保持视觉线索的长程一致性上取得突破，才能真正胜任现实世界中的复杂调研任务。

来源:https://www.51cto.com/article/834771.html

上一篇：腾势N9中保研碰撞测试获高分，解密中国SUV安全性能突破

下一篇：如何用ChatGPT进行头脑风暴？AI生成50个可执行创意筛选指南

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

商汤科技获评中国AI咨询服务市场领导者

商汤科技获评中国AI咨询服务市场领导者

IDC报告将商汤科技定位为中国AI咨询服务市场领导者。其凭借“大装置-大模型-应用”战略与全流程专家服务，帮助企业应对AI落地中的成本、适配与安全挑战，实现从战略规划到持续运营的全周期支持。目前服务已扩展至金融、能源、交通等多个领域。

时间：2026-05-16 08:43

趋境科技携手金航数码深化AI合作，共促空天领域数字化转型

趋境科技携手金航数码深化AI合作，共促空天领域数字化转型

趋境科技与金航数码签署人工智能合作框架协议，将前期成功实践深化为战略伙伴关系。双方基于已验证的大模型私有化解决方案，聚焦航空等复杂装备工业，通过算力底座与行业场景深度融合，共同推动智能化技术在研发、生产等环节的落地应用，助力工业数字化转型升级。

时间：2026-05-16 08:30

城市智能最后一公里难题的论文解决方案

城市智能最后一公里难题的论文解决方案

郑宇教授提出跨域多模态知识融合框架，整合空气质量、交通、气象等多领域数据，通过数据选择、知识对齐、模型构建与数据转换四个阶段，解决了数据稀疏与异构难题，显著提升了预测精度与异常识别能力，为智慧城市应用提供了可行路径。

时间：2026-05-16 08:30

ATEC2025科技精英赛落幕机器人自主技术成焦点

ATEC2025科技精英赛落幕机器人自主技术成焦点

第五届ATEC科技精英赛在香港收官，赛事以“无遥操”为核心，要求机器人在户外复杂地形中完全自主完成吊桥穿越、垃圾分拣等任务。来自全球的13支队伍参赛，浙江大学凭借全自主智能表现夺冠。比赛旨在推动机器人从实验室走向真实应用，通过真实场景挑战测试机器人的感知、决策与执行能力，促。

时间：2026-05-16 08:30

Recraft AI设计草稿如何保存与云端同步方法

Recraft AI设计草稿如何保存与云端同步方法

RecraftAI采用自动云端同步实时保存设计草稿，无需手动操作。用户可通过项目列表中“Lastedited”时间戳的实时更新验证同步状态，并需保持网络稳定与登录有效。必要时可刷新页面或进行微小操作触发同步。跨设备核对内容一致性是确认草稿安全存储于云端的最终方法。

时间：2026-05-16 08:30

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

我的世界基岩版难度调整指令difficulty使用教程

红色沙漠延长飞行距离技巧与实用方法详解

三角洲行动电脑配置要求与最低配置推荐指南

王者荣耀世界零氪开荒阵容搭配攻略

Poki官方网页版免费小游戏大全在线即玩入口

云鸣潮网页版免费在线玩官方正版直接进入

红色沙漠勇武之步套装获取方法全攻略

三角洲行动陷阱拆除与战术道具使用全攻略

深海迷航手游控制台开启方法详细教程

三国志幻想大陆刘备命魂觉醒攻略与技能解析

小米汽车推出寻天子品牌增程车型将改变家用车市场格局

鸣潮赛博朋克联动角色全名单与获取指南

阴阳师5月8日补偿公告内容与领取方法详解

刺客信条影下载安装教程与新手入门指南

崩坏星穹铁道4.2下半卡池抽取指南与角色分析

牧场物语风之集市快速赚钱攻略与技巧分享

崩坏星穹铁道绯樱全面培养指南光锥遗器阵容搭配详解

艾尔登法环黑夜君临蓝量提升方法详解

王者荣耀世界英雄强度排行榜最新榜单

帕帕拉猩红辣妹强度解析吉星派对角色实战评测

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

爱的种子成就解锁指南与全成就获取方法

爱的种子成就解锁指南与全成就获取方法发布于 2026-05-16

王者荣耀世界撼地狂木打法教学技能连招与实战攻略详解

王者荣耀世界撼地狂木打法教学技能连招与实战攻略详解发布于 2026-05-16

霓虹深渊无限武器强度排行榜最新一览

霓虹深渊无限武器强度排行榜最新一览发布于 2026-05-16

洛克王国世界许愿星作用详解与获取使用指南

洛克王国世界许愿星作用详解与获取使用指南发布于 2026-05-16

宝可梦冠军录用功能详解与使用方法介绍

宝可梦冠军录用功能详解与使用方法介绍发布于 2026-05-16

王者荣耀世界签到册奖励内容与领取方法详解

王者荣耀世界签到册奖励内容与领取方法详解发布于 2026-05-16

坎公骑冠剑比什巴赫强度解析与实战评测

坎公骑冠剑比什巴赫强度解析与实战评测发布于 2026-05-16

王者荣耀世界轮椅战神有哪些英雄角色介绍

王者荣耀世界轮椅战神有哪些英雄角色介绍发布于 2026-05-16

镭明闪击双境终焉通关攻略机制详解与实战教程

镭明闪击双境终焉通关攻略机制详解与实战教程发布于 2026-05-16

极限竞速地平线6车库自定义指南：打造专属座驾空间

极限竞速地平线6车库自定义指南：打造专属座驾空间发布于 2026-05-16

极限竞速地平线6全宝藏车辆位置收集攻略

极限竞速地平线6全宝藏车辆位置收集攻略发布于 2026-05-16

极限竞速地平线6点数速刷攻略与高效获取方法

极限竞速地平线6点数速刷攻略与高效获取方法发布于 2026-05-16

地平线黎明时分结局解析不同选择如何影响最终剧情

地平线黎明时分结局解析不同选择如何影响最终剧情发布于 2026-05-16

极限竞速地平线6全房屋位置与解锁条件详解

极限竞速地平线6全房屋位置与解锁条件详解发布于 2026-05-16

夜幕之下公测定档6月5日代号砰砰定档PV正式发布

夜幕之下公测定档6月5日代号砰砰定档PV正式发布发布于 2026-05-16

蹦床公测上线时间确定正式开服日期预告

蹦床公测上线时间确定正式开服日期预告发布于 2026-05-16

Win11桌面小组件添加与自定义设置教程

Win11桌面小组件添加与自定义设置教程发布于 2026-05-15

Win10磁盘配额设置教程如何限制用户磁盘使用空间

Win10磁盘配额设置教程如何限制用户磁盘使用空间发布于 2026-05-15

Windows 11 超级任务栏预览开启教程提升窗口悬停显示速度

Windows 11 超级任务栏预览开启教程提升窗口悬停显示速度发布于 2026-05-15

Win11多时区时钟设置教程添加显示多个地区时间

Win11多时区时钟设置教程添加显示多个地区时间发布于 2026-05-15

Windows 11 高性能图形加速设置教程强制系统调用独立显卡方法

Windows 11 高性能图形加速设置教程强制系统调用独立显卡方法发布于 2026-05-15

Windows 11游戏崩溃怎么解决优化显存设置提升3A大作稳定性

Windows 11游戏崩溃怎么解决优化显存设置提升3A大作稳定性发布于 2026-05-15

Win10查看磁盘使用情况与各分区容量方法详解

Win10查看磁盘使用情况与各分区容量方法详解发布于 2026-05-15

Win10文件夹视图设置教程统一显示方式详细步骤

Win10文件夹视图设置教程统一显示方式详细步骤发布于 2026-05-15

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集