苹果Ferret-UI Lite端侧AI模型上线:3B参数读懂复杂界面
2月21日消息,苹果研究团队在最新发表的论文中,推出了一款专为移动端打造的轻量化AI模型Ferret-UI Lite。令人惊讶的是,这个仅有30亿参数的“小个子”,在多项性能测试中竟能与体积大它24倍的巨型模型一较高下,甚至在某些方面实现了超越。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
简单来说,Ferret-UI Lite是一款专门为移动设备优化的多模态大语言模型。它属于典型的“轻量级”选手,参数规模控制在30亿,却能在手机端有限的算力下,精准理解和操作复杂的图形用户界面。

但小身材蕴藏着大能量。在多项基准测试中,Ferret-UI Lite的表现不仅追平了那些需要庞大服务器支持的巨型模型,甚至在部分任务上实现了超越,展示了极高的效率。

那么,它是如何做到的呢?关键在于一项名为“推理时裁剪”的核心技术。传统的大模型往往难以看清手机屏幕上微小的图标和文本细节,而这项技术完美解决了这一痛点。

在处理任务时,模型会先进行一次粗略的全局预测,然后智能地“裁剪”并放大屏幕上的关键区域,就像人眼凑近观察细节一样,再进行精准识别。这种策略让小模型无需处理海量图像数据,也能准确捕捉界面中的核心信息,从而更好地理解屏幕上的每一个元素。

为了在数据稀缺的情况下训练出高质量的模型,研究团队构建了一套创新的合成数据生成系统。该系统设置了“任务生成器”、“规划器”、“执行者”和“评审者”四个角色,让AI在模拟环境中不断尝试操作、犯错并自我修正。

这种机制不仅生成了海量、多样的训练样本,更重要的是让模型学会了如何应对现实操作中可能出现的各种错误与意外情况(例如点击无反应或弹出干扰窗口)。其训练效果远优于单纯依赖人工标注的“洁净”数据,让模型更加贴近真实使用场景。
测试结果显示,该模型在执行短流程、基础的UI操作任务时表现优异,但在处理复杂的多步骤长任务方面仍有提升空间。
最重要的是,Ferret-UI Lite能够完全在设备本地运行,无需将屏幕截图上传至云端服务器。这在赋予手机“自动化操作App”能力的同时,最大限度地保障了用户的隐私安全。

参考资料
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Sora暂停开放,国产视频大模型的机遇与未来在哪里?
1两年前横空出世的Sora,曾给AI业界和全球网民带来巨大的震撼。到2026年,它突然退场,没能再掀起那样大的波澜。从商业决策的角度看,这其实早就是意料之中的事。极高的视频生成成本、少得可怜的付费用
中国电动车强势入局柏林,德国汽车产业遇挑战
【文 观察者网专栏作者 扬之】过去十多年里,德国政府对电动车产业的态度,可以用“战略上高度重视,战术上反复摇摆”来概括。它的宏观目标非常清晰:一方面要落实欧盟层面的减排目标和气候承诺,另一方面要保障
宁德时代如何稳居榜首:穿越周期挑战的“薄冰”策略
【文 观察者网 心智观察所】 1 2026年1月,密歇根州共和党籍众议员约翰·穆莱纳尔给福特汽车CEO吉姆·法利写了一封信。这位“美中战略竞争特别委员会”的主席在信中言辞激烈,要求福特解释为什么要
3大运营商提升算力收入,全面转向Token服务经营主线
近日,三大电信运营商2025年年报陆续出炉。总的来看,运营商主要业绩指标高位运行,但就总量而言,增长乏力的状况并没有显著改善,算力服务、创新业务、国际业务等结构性收入增长仍是主要亮点。2025年,三
苹果或向第三方开放Siri;Meta增投百亿建美国AI数据中心
Meta将美国得州AI数据中心投资额增至100亿美元Meta当地时间3月26日宣布,将对美国得州埃尔帕索AI数据中心的投资额增加至100亿美元,目标在该设施预计于2028年投运前达到1吉瓦容量。Me
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

