苹果Ferret-UI Lite端侧AI模型上线:3B参数读懂复杂界面
2月21日消息,苹果研究团队在最新发表的论文中,推出了一款专为移动端打造的轻量化AI模型Ferret-UI Lite。令人惊讶的是,这个仅有30亿参数的“小个子”,在多项性能测试中竟能与体积大它24倍的巨型模型一较高下,甚至在某些方面实现了超越。
简单来说,Ferret-UI Lite是一款专门为移动设备优化的多模态大语言模型。它属于典型的“轻量级”选手,参数规模控制在30亿,却能在手机端有限的算力下,精准理解和操作复杂的图形用户界面。

但小身材蕴藏着大能量。在多项基准测试中,Ferret-UI Lite的表现不仅追平了那些需要庞大服务器支持的巨型模型,甚至在部分任务上实现了超越,展示了极高的效率。

那么,它是如何做到的呢?关键在于一项名为“推理时裁剪”的核心技术。传统的大模型往往难以看清手机屏幕上微小的图标和文本细节,而这项技术完美解决了这一痛点。

在处理任务时,模型会先进行一次粗略的全局预测,然后智能地“裁剪”并放大屏幕上的关键区域,就像人眼凑近观察细节一样,再进行精准识别。这种策略让小模型无需处理海量图像数据,也能准确捕捉界面中的核心信息,从而更好地理解屏幕上的每一个元素。

为了在数据稀缺的情况下训练出高质量的模型,研究团队构建了一套创新的合成数据生成系统。该系统设置了“任务生成器”、“规划器”、“执行者”和“评审者”四个角色,让AI在模拟环境中不断尝试操作、犯错并自我修正。

这种机制不仅生成了海量、多样的训练样本,更重要的是让模型学会了如何应对现实操作中可能出现的各种错误与意外情况(例如点击无反应或弹出干扰窗口)。其训练效果远优于单纯依赖人工标注的“洁净”数据,让模型更加贴近真实使用场景。
测试结果显示,该模型在执行短流程、基础的UI操作任务时表现优异,但在处理复杂的多步骤长任务方面仍有提升空间。
最重要的是,Ferret-UI Lite能够完全在设备本地运行,无需将屏幕截图上传至云端服务器。这在赋予手机“自动化操作App”能力的同时,最大限度地保障了用户的隐私安全。

参考资料
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
阿里通义千问发布Qwen3.7-Max全栈智能体基座
2025年5月20日,通义千问重磅推出新一代旗舰模型——Qwen3 7-Max。这款被定位为“面向智能体时代”的先进大语言模型,即将通过API全面开放,其核心使命是成为一个卓越的全能智能体基座模型。无论是高效编写与调试代码、实现办公流程深度自动化,还是稳健执行涉及数百乃至数千步骤的长周期复杂任务,Q
阿里云发布全新芯云模型体系 全面升级Agentic时代技术架构
阿里云宣布完成 "芯片-云-模型-推理 "全栈智能化升级,推出AI产品 "千问云 ",搭载自研AI芯片真武M890的超节点服务器及旗舰模型Qwen3 7-Max。
阿里云智算系统优化助力AI模型推理性能跃升
阿里云宣布其全栈产品已为智能体时代做好准备,围绕“芯-云-模型-推理”推出系列升级。这是业内首次针对智能体的系统性全栈发布。智能体一旦突破临界点,将实现全天候工作,对人工智能与云计算资源的需求近乎无限。阿里云正推动从底层芯片到推理平台的全栈技术革新。
英伟达谷歌推进液冷服务器 市场需求强劲拉动股价
液冷服务器板块市场行情火热,关注度与投资热情持续走高。同飞股份、申菱环境盘中涨幅均超14%,川润股份、宏盛股份、银轮股份等个股早盘已强势涨停,英维克、大元泵业、飞龙股份、依米康等相关概念股也同步跟涨。 此番上涨行情背后,拥有坚实的行业数据作为支撑。TrendForce集邦咨询最新研究报告指出,在AI
AI红利来临企业老板分享转型成功的经历与启示
许多企业管理者都曾有过类似经历:斥资引入的“智能体”不仅未能提升效率,反而因操作失误或功能不匹配成为业务负担,甚至可能引发数据安全风险。问题的核心往往不在于人工智能技术本身,而在于企业是否为其部署做好了充分准备。 将AI智能体视为真正的“数字员工”而非简单工具,是成功落地的关键一步。企业在应用智能体
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

