Browser Use 团队最新发布一款开源 AI 视频剪辑智能体工具 video-use

AI热点日报时间：2026-07-04

热点解读

BrowserUse团队开源的AI视频剪辑Agent，支持自然语言对话式剪辑，自动完成口癖清除、调色、字幕、动画叠加及自评估修复。通过音频转录文本（约12KB）降低LLM成本，适用于口播、教程、访谈等结构化内容的高效自动化剪辑。

video-use是什么

Video-use 是 Browser Use 团队最新推出的一款开源 AI 视频剪辑 Agent，其最大亮点在于：你只需用自然语言与它对话，就能让它替你完成剪辑，完全无需接触传统的时间线。操作方式也非常直观——将原始视频素材放入文件夹，然后告诉它你的剪辑需求，Agent 便会自动盘点素材、清除口癖、调色、添加字幕、叠加动画，最后还会自我检查一遍，并输出最终成片。其核心创新在于：通过音频转录文本（大约 12KB）来理解视频内容，从而大幅降低 LLM 的 token 成本。简单来说，它非常适合口播、教程、访谈这类结构化内容的高效自动化剪辑。

video-use的主要功能

具体能做什么？我们来盘点一下它的功能列表：

口癖与死寂清除：自动识别并删除“嗯”“啊”这类填充词、长时间停顿，以及拍摄多次但表现不佳的重复 take，帮你省去手动筛选素材的时间。
自动调色：内置了 warm_cinematic（暖色电影感）、neutral_punch（中性增强）等预设，若有特殊需求，你也可以自行编写 ffmpeg 滤镜链。
30ms 音频淡变：每个切点会自动添加 30 毫秒的淡入淡出，彻底避免切点爆音这类让人头疼的问题。
烧录字幕：默认采用“两词大写”的短视频风格，同时也支持长句自然显示、大字幕强调等自定义选项，字体、颜色、位置均可调整。
动画叠加：可调用 HyperFrames、Remotion、Manim、PIL+ffmpeg 等引擎来生成 B-roll 和动画卡片，而且由独立的子 Agent 并行生成，效率颇高。
自评估循环：渲染完成后会自动检查切点跳帧、音频爆音、字幕遮挡、叠加层对齐等问题，最多可自动修复 3 次，避免反复返工。
会话记忆：每次剪辑决策都会追加到 project.md 文件中，下次接续之前的工作时，它会保留之前的偏好和策略，不会丢失记忆。

如何使用video-use

上手步骤也不算复杂，按照以下操作即可：

克隆仓库：在终端执行 git clone https://github.com/browser-use/video-use ~/Developer/video-use，将项目代码下载到本地开发者目录。
安装依赖：进入项目目录后运行 uv sync 或 pip install -e . 安装 Python 依赖，同时别忘了用 brew install ffmpeg 安装音视频处理工具，因为后续所有剪辑操作都离不开它。
配置 API Key：复制环境变量模板文件 cp .env.example .env，然后编辑 .env 文件，填入你的 ElevenLabs API Key，用于音频转录服务。
注册 Skill：创建符号链接，将 video-use 注册到 Agent 的 skills 目录。例如如果你用的是 Claude Code，就执行 ln -sfn ~/Developer/video-use ~/.claude/skills/video-use。
开始使用：进入存放原始视频素材的文件夹，启动编程 Agent，对它说一句 “edit these into a launch video”，就会自动触发剪辑流程。

video-use的核心优势

对话式交互替代手动剪辑：用自然语言描述需求，Agent 就能自动完成整个流程，无需学习专业剪辑软件的操作。
通用兼容不受 API 限制：不依赖官方开放接口，只要拥有网页版视频工具，理论上都能被 AI 驱动操控，灵活性极高。
极低 token 成本理解视频：通过音频转录文本（约 12KB）替代逐帧视觉分析，让 LLM 高效“阅读”视频内容而非“观看”，成本自然大幅降低。
自动化机械劳动：口癖清除、调色、字幕、动画叠加等重复性工作，Agent 全部代劳，你只需在关键策略上确认即可。
标准化输出可复现：剪辑规则固化在代码中，同类型视频输出风格高度一致，避免了人工操作时忽好忽坏的差异。
自评估质量保障：渲染后 Agent 自动检查跳帧、爆音、遮挡等问题，还能自动修复，确保最终成片质量合格。

video-use的项目地址

GitHub仓库：https://github.com/browser-use/video-use

video-use的同类竞品对比

为了让你更直观地了解它的定位，我们将其与另一同类项目 OpenStoryline（来自小红书 Super Intelligence 团队 / FireRedTeam）进行对比：

维度	video-use	OpenStoryline
开发团队	Browser Use（海外）	小红书 Super Intelligence / FireRedTeam（国内）
开源协议	MIT	Apache-2.0
Stars	13,749	2,817
核心定位	编程 Agent 对话式剪辑 raw footage	意图驱动式视频创作，从素材搜索到成片
交互方式	命令行对话（Claude Code / Codex）	自然语言对话 + Web 界面 + CLI
内容来源	本地 raw footage（口播、访谈素材）	支持本地素材 + 在线媒体搜索下载
智能脚本	基于音频转录文本理解内容	自动生成故事线、旁白、Few-shot 风格迁移
动画/特效	HyperFrames / Remotion / Manim / PIL	内置 BGM 智能推荐、AI 转场生成、字体风格匹配

video-use的应用场景

这套工具最适用的场景其实非常明确：

技术博主口播剪辑：录制了多段 raw footage，想快速剪成连贯的发布视频？它会自动清除口癖和停顿。
教程制作团队：批量处理大量重复性剪辑任务，字幕、调色、动画叠加等流程均可标准化执行。
产品发布视频：多个素材按策略自动拼接，统一视觉风格，还能生成配套的 B-roll 动画。
访谈/播客后期：自动识别最佳 take，清除冗余内容，输出带字幕和淡变处理的成片。
内容创作者标准化工作流：将剪辑流程从手动操作转为策略确认，释放更多时间，让你专注于内容创作本身。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：Browser Use 团队最新发布一款开源 AI 视频剪辑智能体工具 video-use要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://ai-bot.cn/video-use/

上一篇：跃迁维度一站式国产AI模型API聚合平台

下一篇：一张照片即可克隆自己 Butterflies AI带你玩转虚拟人生

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本周AI驱动配音平台 Speakmulti 03 / 本周Umi-OCR图片转文字识别软件 04 / 本周用AI生成你最爱的画家或艺术运动风格绘画 05 / 本周创一AI短视频脚本工具，专为创作者与编导设计

01 / 本月Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本月AI驱动配音平台 Speakmulti 03 / 本月Umi-OCR图片转文字识别软件 04 / 本月用AI生成你最爱的画家或艺术运动风格绘画 05 / 本月创一AI短视频脚本工具，专为创作者与编导设计

热点快看

07-04 19:00Daetama数据科学完整准备工作系统指南与精选学习资源汇总 07-04 19:00AI驱动配音平台 Speakmulti 07-04 18:59Umi-OCR图片转文字识别软件 07-04 18:59用AI生成你最爱的画家或艺术运动风格绘画 07-04 18:59创一AI短视频脚本工具，专为创作者与编导设计

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别