当前位置: 首页
AI资讯
微软开源Webwright智能体实现代码式网页自动化

微软开源Webwright智能体实现代码式网页自动化

热心网友 时间:2026-05-26
转载

微软研究院近日正式开源了一款创新的网页智能体框架——Webwright。该框架采用了一种突破性的设计思路:它摒弃了当前主流的“视觉识别-点击DOM元素”的交互模式,转而让AI模型直接在终端环境中编写Playwright自动化脚本并执行Bash命令,通过更高效、更具逻辑性的编程方式来执行复杂的网页操作任务。

微软 Webwright 开源:网页智能体从“点击式”进化为“代码式”

为何智能体需要从“点击操作”转向“代码生成”?

目前,大多数网页自动化智能体的工作模式,是持续预测下一个交互动作,例如“点击哪个坐标”、“滚动多少像素”或“输入什么文本”。这种方法不仅执行效率较低,而且在处理多步骤任务时难以保持稳定的状态。相比之下,Webwright所采用的代码驱动范式,展现出多方面的显著优势:

  • 脚本可复用性高: 每次任务执行后生成的是一段完整的、可重复使用的Playwright脚本(类似于RPA机器人流程自动化脚本),而非一次性的点击序列。这些标准化脚本未来可直接被Claude Code、GitHub Copilot等代码生成工具调用与集成。

  • 复杂逻辑处理能力强: 代码天然支持循环、条件分支、函数封装等编程结构。对于需要处理表单填写、多页面导航、条件判断等长链条任务场景,代码的表达能力与灵活性远胜于简单的动作堆叠。

  • 具备工程化的错误修复流程: 当脚本执行出现错误时,模型能够自动解析错误堆栈信息,并进入“编码-运行-报错-调试”的迭代循环。这套自我修正机制显著提升了任务执行的最终成功率与鲁棒性。

核心技术突破:有效应对“伪成功”与“上下文膨胀”难题

针对网页智能体长期存在的两大挑战——误判任务完成(伪成功)与长上下文信息过载,Webwright框架引入了针对性的工程解决方案:

  • 门控自检机制: 该机制旨在防止模型产生“任务已完成”的幻觉判断。其流程是:模型必须先生成一份“自检验证配置”,随后在一个全新的隔离环境中运行最终脚本,并通过预设的检查点进行结果验证。只有经过自我反思并确认目标达成后,系统才会输出任务完成标志。

  • 历史对话压缩技术: 为解决长周期任务导致的上下文令牌膨胀问题,系统每执行20个步骤,便会自动将之前的对话历史压缩成一段精炼的进度摘要。这确保了模型的注意力始终聚焦于当前最核心的任务状态与后续步骤。

基准测试表现:性能大幅领先行业基准

根据2026年5月公布的基准测试结果,Webwright框架在多项评测中均取得了卓越成绩:

  • Online-Mind2Web基准测试: 基于GPT-5.4模型的Webwright,在100步的操作预算限制下,实现了86.67%的任务准确率,在同期开源网页智能体解决方案中排名领先。

  • Odysseys(长链路复杂任务)基准测试: 面对平均指令长度达272个单词的复杂场景,Webwright结合GPT-5.4取得了60.1%的综合得分。这一成绩相较于基础版GPT-5.4(33.5%)实现了约81.5%的性能飞跃,并且超越了同年4月榜单的冠军模型Opus4.6(44.5%)。

行业影响与未来展望

Webwright的出现标志着一个重要趋势:随着大模型代码生成能力的持续进化,智能体正逐步向“开发者范式”演进。它不再将浏览器视为简单的图形交互界面,而是将其作为一个可编程的端点来对待。这种根本性的视角转换,成功地将AI执行网页任务的效率、可靠性与可扩展性提升至新的高度。

对于开发者和企业而言,Webwright不仅是一个先进的网页自动化框架,更如同一位能够自动编写、调试、维护并打包自动化脚本的“AI工程师助手”。该项目代码已在GitHub平台全面开源,为社区提供了构建下一代网页智能体的强大基础设施。

来源:https://news.aibase.com/zh/news/28336

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Notion AI批量创作社交媒体文案教学指南

Notion AI批量创作社交媒体文案教学指南

通过五种方法充分发挥NotionAI的结构化生成能力,可高效批量创作多平台社交媒体文案。包括使用斜杠命令即时生成单条文案、基于已有文本进行上下文改写、在数据库配置AI属性实现批量生产、利用多轮对话功能链式创作不同版本,以及调用内置快捷指令快速完成摘要提炼等高频任务。

时间:2026-05-26 20:58
教宗方济各呼吁监管人工智能 防范武器化风险维护人类尊严

教宗方济各呼吁监管人工智能 防范武器化风险维护人类尊严

在全球热议人工智能技术突破的浪潮中,一个源自古老精神殿堂的声音,为这场科技盛宴注入了至关重要的冷静思考。教宗利奥十四世近日发布重要宣言,对人工智能潜在的武器化应用与伦理风险发出明确警示,并呼吁全球建立强有力的AI监管框架。其核心主张清晰而坚定:在追求商业利润与技术效率之上,必须将人的尊严与价值置于不

时间:2026-05-26 20:58
Vidu制作科幻特效视频的实际能力评测

Vidu制作科幻特效视频的实际能力评测

ViduQ3模型专为科幻场景设计,强化六大特效系统协同控制。使用Q3版本时需优化提示词,将视觉动词前置并绑定物理属性,配合参考图激活特效模块。通过代码调用内置预设库可精准调控参数,生成后借助帧分析工具局部重绘异常帧,确保视频一致性。

时间:2026-05-26 20:57
AI视频翻译全链路解析从语音识别到字幕压制全流程

AI视频翻译全链路解析从语音识别到字幕压制全流程

做一套真正能落地的AI视频翻译系统,关键不在于简单地把ASR、翻译、配音、字幕几个模型串起来。真正的挑战在于,如何把“输入、音频切分、转写、说话人识别、翻译、语音合成、对齐、导出”这一系列环节,打造成一条稳定、可控的数据管线。一个比较稳健的架构,通常可以拆解为七个层次:输入层、ASR层、说话人分离层

时间:2026-05-26 20:52
湖南科技职院人工智能学院教师团队荣获省黄炎培创业大赛一等奖

湖南科技职院人工智能学院教师团队荣获省黄炎培创业大赛一等奖

近日,2026年湖南省黄炎培职业教育奖创业规划大赛高职教师赛道的决赛在湘西圆满结束。来自湖南科技职业学院人工智能学院的艾琼龙、刘奕、王磊、朱孟龙四位老师组成的《深度学习应用》课程教学团队,凭借其扎实的专业基础、创新的教学理念以及卓越的现场发挥,在竞争激烈的电子信息大类中脱颖而出,一举夺得团体组一等奖

时间:2026-05-26 20:51
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程