4B参数轻量GUI模型实测对比AutoGLM及部署教程

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

4B参数轻量GUI模型实测对比AutoGLM及部署教程

热心网友时间：2026-05-28

转载

仅4B参数却能匹敌9B模型，这款GUI小模型实测效果惊人，资源占用更低！

昨天刚聊完智谱的AutoGLM，就有朋友深夜发来消息，说阶跃也搞了一个GUI模型，参数只有4B。一看，果然是GELab-Zero-4B-preview。这模型有意思——自家台式机4070 Super 12G就能部署，相比AutoGLM那种动辄需要更高规格硬件的方案，资源门槛低了一大截。而且还能做量化，进一步压缩资源占用，不过真要部署到手机端做端侧推理，速度恐怕还是撑不住。

项目信息如下：

Github：https://github.com/stepfun-ai/gelab-zero
HF：https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview

对4B这个数字敏感的朋友应该已经猜到了——没错，它是在Qwen3-VL-4B-Instruct基础上增量训练出来的。整个Agent控制手机的原理和AutoGLM如出一辙，也是通过截图识别元素、ADB操控。

直接上测试结果。

昨天AutoGLM没能搞定的蚂蚁森林能量收集任务，GELab-Zero-4B花了7分钟完成了。不过说真的，模型还是偏小，加上页面上有个“1t”能量的干扰，中间重复了好多轮，做了些错误的决策，但最终所有能量球还是全部收齐了。

中等任务：打开小红书，发一篇大字报内容。同样顺利搞定，而且是完全自动发布。这个任务本身不复杂，但4B模型能一次走通，还是有点意外——毕竟比AutoGLM-9B小了一半。

高阶任务：打开12306，订一张本周六从苏州到南京的高铁票，时间在早上9点左右。从执行过程来看，GELab-Zero-4B每一步都很快，但执行轮数比AutoGLM要多一些。

整体测试下来的感觉：

4B确实很强，非常能打；
这个模型完全不输9B的AutoGLM，某些复杂任务甚至处理得更好；
但参数规模太小，过于复杂的任务容易陷入循环；
整体执行步骤普遍偏多；
资源消耗更少，但速度上仍然达不到端侧部署的要求。

和AutoGLM一样，GELab-Zero的GitHub文档也写得很详细，基本上跟着走一遍就能跑通。昨天AutoGLM部署流程中的vLLM模型部署、ADB安装部分可以直接复用。

这次在本地台式机上部署，就用Ollama来走一遍。

Ollama部署步骤：

先去Ollama官网下载对应安装包。Windows系统直接下载Windows版本：

https://ollama.com/download

下载完成后，双击OllamaSetup.exe，点击Install开始安装。注意，Ollama默认装在C盘，不支持自定义路径。

安装后，把启动程序所在路径添加到Path环境变量：

C:\Users\admin\AppData\Local\Programs\Ollama

快捷键Windows+R打开运行，输入sysdm.cpl回车；高级→环境变量→系统变量→Path，新增上述路径。

然后命令行验证版本：

ollama --version

下载模型，推荐用ModelScope，速度真的快：

modelscope download --model stepfun-ai/GELab-Zero-4B-preview --local_dir ./GELab-Zero-4B-preview

进入下载好的GELab-Zero-4B-preview文件夹，创建Ollama模型：

ollama create gelab-zero-4b -f Modelfile

如果需要量化以进一步减小资源占用，可以用以下命令（注意精度损失）：

# int8量化
ollama create -q q8_0 gelab-zero-4b
# int4量化
ollama create -q Q4_K_M gelab-zero-4b

启动Ollama服务：

ollama serve

通过Postman测试请求：

接下来是PC端和手机端ADB的安装，可以参照AutoGLM保姆级教程的那一部分，完全一致。不过GELab-Zero项目里，输入法不需要选择“ADB Keyboard”。

最后把项目clone到本地，启动服务：

python examples/run_single_task.py "打开微信，给老婆大人发helloword"

缺什么包就装什么包，也可以直接安装requirements：

pip install -r requirements.txt

有几个地方记得修改：

model_config.yaml中的api_base，默认Ollama端口是11434，如果改了端口就对应修改；
examples/run_single_task.py中的local_model_config字典，模型名称按实际填写，比如这里用的是gelab-zero-4b，官方默认是gelab-zero-4b-preview。

如果想用WebUI而不是命令行，也可以自己vibe一段代码出来。

最后总结一下：GELab-Zero-4B这个模型算是又刷新了认知。简单和中等任务执行得都很好，复杂任务偶尔会陷入循环——这毕竟只有4B参数，但不少场景上真不比9B的AutoGLM差，甚至执行得更利落。看来手机上部署GUI Agent的脚步声越来越近了，端侧，未来可期。

来源:https://www.53ai.com/news/LargeLanguageModel/2026011281562.html

上一篇：青岛10所高校新增42个本科专业点

下一篇：远景公布三大关键支柱技术开创AI电力系统