4B参数轻量GUI模型实测对比AutoGLM及部署教程
仅4B参数却能匹敌9B模型,这款GUI小模型实测效果惊人,资源占用更低!
昨天刚聊完智谱的AutoGLM,就有朋友深夜发来消息,说阶跃也搞了一个GUI模型,参数只有4B。一看,果然是GELab-Zero-4B-preview。这模型有意思——自家台式机4070 Super 12G就能部署,相比AutoGLM那种动辄需要更高规格硬件的方案,资源门槛低了一大截。而且还能做量化,进一步压缩资源占用,不过真要部署到手机端做端侧推理,速度恐怕还是撑不住。
项目信息如下:
Github:https://github.com/stepfun-ai/gelab-zero
HF:https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview
对4B这个数字敏感的朋友应该已经猜到了——没错,它是在Qwen3-VL-4B-Instruct基础上增量训练出来的。整个Agent控制手机的原理和AutoGLM如出一辙,也是通过截图识别元素、ADB操控。
直接上测试结果。
昨天AutoGLM没能搞定的蚂蚁森林能量收集任务,GELab-Zero-4B花了7分钟完成了。不过说真的,模型还是偏小,加上页面上有个“1t”能量的干扰,中间重复了好多轮,做了些错误的决策,但最终所有能量球还是全部收齐了。
中等任务:打开小红书,发一篇大字报内容。同样顺利搞定,而且是完全自动发布。这个任务本身不复杂,但4B模型能一次走通,还是有点意外——毕竟比AutoGLM-9B小了一半。
高阶任务:打开12306,订一张本周六从苏州到南京的高铁票,时间在早上9点左右。从执行过程来看,GELab-Zero-4B每一步都很快,但执行轮数比AutoGLM要多一些。
整体测试下来的感觉:
- 4B确实很强,非常能打;
- 这个模型完全不输9B的AutoGLM,某些复杂任务甚至处理得更好;
- 但参数规模太小,过于复杂的任务容易陷入循环;
- 整体执行步骤普遍偏多;
- 资源消耗更少,但速度上仍然达不到端侧部署的要求。
和AutoGLM一样,GELab-Zero的GitHub文档也写得很详细,基本上跟着走一遍就能跑通。昨天AutoGLM部署流程中的vLLM模型部署、ADB安装部分可以直接复用。
这次在本地台式机上部署,就用Ollama来走一遍。
Ollama部署步骤:
先去Ollama官网下载对应安装包。Windows系统直接下载Windows版本:
https://ollama.com/download
下载完成后,双击OllamaSetup.exe,点击Install开始安装。注意,Ollama默认装在C盘,不支持自定义路径。
安装后,把启动程序所在路径添加到Path环境变量:
C:\Users\admin\AppData\Local\Programs\Ollama快捷键Windows+R打开运行,输入sysdm.cpl回车;高级→环境变量→系统变量→Path,新增上述路径。
然后命令行验证版本:
ollama --version
下载模型,推荐用ModelScope,速度真的快:
modelscope download --model stepfun-ai/GELab-Zero-4B-preview --local_dir ./GELab-Zero-4B-preview进入下载好的GELab-Zero-4B-preview文件夹,创建Ollama模型:
ollama create gelab-zero-4b -f Modelfile
如果需要量化以进一步减小资源占用,可以用以下命令(注意精度损失):
# int8量化
ollama create -q q8_0 gelab-zero-4b
# int4量化
ollama create -q Q4_K_M gelab-zero-4b启动Ollama服务:
ollama serve
通过Postman测试请求:

接下来是PC端和手机端ADB的安装,可以参照AutoGLM保姆级教程的那一部分,完全一致。不过GELab-Zero项目里,输入法不需要选择“ADB Keyboard”。
最后把项目clone到本地,启动服务:
python examples/run_single_task.py "打开微信,给老婆大人发helloword"缺什么包就装什么包,也可以直接安装requirements:
pip install -r requirements.txt有几个地方记得修改:
model_config.yaml中的api_base,默认Ollama端口是11434,如果改了端口就对应修改;examples/run_single_task.py中的local_model_config字典,模型名称按实际填写,比如这里用的是gelab-zero-4b,官方默认是gelab-zero-4b-preview。
如果想用WebUI而不是命令行,也可以自己vibe一段代码出来。
最后总结一下:GELab-Zero-4B这个模型算是又刷新了认知。简单和中等任务执行得都很好,复杂任务偶尔会陷入循环——这毕竟只有4B参数,但不少场景上真不比9B的AutoGLM差,甚至执行得更利落。看来手机上部署GUI Agent的脚步声越来越近了,端侧,未来可期。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
修Bug被Gemini追删代码致宕机修复报告现编
最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修
Notion AI运营指南:自动归纳用户反馈
其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构
AI给出的答案为何总不符期望?原因解析
大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4
2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解
如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

