当前位置: 首页
AI资讯
4B参数轻量GUI模型实测对比AutoGLM及部署教程

4B参数轻量GUI模型实测对比AutoGLM及部署教程

热心网友 时间:2026-05-28
转载

仅4B参数却能匹敌9B模型,这款GUI小模型实测效果惊人,资源占用更低!

昨天刚聊完智谱的AutoGLM,就有朋友深夜发来消息,说阶跃也搞了一个GUI模型,参数只有4B。一看,果然是GELab-Zero-4B-preview。这模型有意思——自家台式机4070 Super 12G就能部署,相比AutoGLM那种动辄需要更高规格硬件的方案,资源门槛低了一大截。而且还能做量化,进一步压缩资源占用,不过真要部署到手机端做端侧推理,速度恐怕还是撑不住。

项目信息如下:

Github:https://github.com/stepfun-ai/gelab-zero
HF:https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview

对4B这个数字敏感的朋友应该已经猜到了——没错,它是在Qwen3-VL-4B-Instruct基础上增量训练出来的。整个Agent控制手机的原理和AutoGLM如出一辙,也是通过截图识别元素、ADB操控。

直接上测试结果。

昨天AutoGLM没能搞定的蚂蚁森林能量收集任务,GELab-Zero-4B花了7分钟完成了。不过说真的,模型还是偏小,加上页面上有个“1t”能量的干扰,中间重复了好多轮,做了些错误的决策,但最终所有能量球还是全部收齐了。

中等任务:打开小红书,发一篇大字报内容。同样顺利搞定,而且是完全自动发布。这个任务本身不复杂,但4B模型能一次走通,还是有点意外——毕竟比AutoGLM-9B小了一半。

高阶任务:打开12306,订一张本周六从苏州到南京的高铁票,时间在早上9点左右。从执行过程来看,GELab-Zero-4B每一步都很快,但执行轮数比AutoGLM要多一些。

整体测试下来的感觉:

  • 4B确实很强,非常能打;
  • 这个模型完全不输9B的AutoGLM,某些复杂任务甚至处理得更好;
  • 但参数规模太小,过于复杂的任务容易陷入循环;
  • 整体执行步骤普遍偏多;
  • 资源消耗更少,但速度上仍然达不到端侧部署的要求。

和AutoGLM一样,GELab-Zero的GitHub文档也写得很详细,基本上跟着走一遍就能跑通。昨天AutoGLM部署流程中的vLLM模型部署、ADB安装部分可以直接复用。

这次在本地台式机上部署,就用Ollama来走一遍。

Ollama部署步骤:

先去Ollama官网下载对应安装包。Windows系统直接下载Windows版本:

https://ollama.com/download

下载完成后,双击OllamaSetup.exe,点击Install开始安装。注意,Ollama默认装在C盘,不支持自定义路径。

安装后,把启动程序所在路径添加到Path环境变量:

C:\Users\admin\AppData\Local\Programs\Ollama

快捷键Windows+R打开运行,输入sysdm.cpl回车;高级→环境变量→系统变量→Path,新增上述路径。

然后命令行验证版本:

ollama --version

下载模型,推荐用ModelScope,速度真的快:

modelscope download --model stepfun-ai/GELab-Zero-4B-preview --local_dir ./GELab-Zero-4B-preview

进入下载好的GELab-Zero-4B-preview文件夹,创建Ollama模型:

ollama create gelab-zero-4b -f Modelfile

如果需要量化以进一步减小资源占用,可以用以下命令(注意精度损失):

# int8量化
ollama create -q q8_0 gelab-zero-4b
# int4量化
ollama create -q Q4_K_M gelab-zero-4b

启动Ollama服务:

ollama serve

通过Postman测试请求:

接下来是PC端和手机端ADB的安装,可以参照AutoGLM保姆级教程的那一部分,完全一致。不过GELab-Zero项目里,输入法不需要选择“ADB Keyboard”。

最后把项目clone到本地,启动服务:

python examples/run_single_task.py "打开微信,给老婆大人发helloword"

缺什么包就装什么包,也可以直接安装requirements:

pip install -r requirements.txt

有几个地方记得修改:

  • model_config.yaml中的api_base,默认Ollama端口是11434,如果改了端口就对应修改;
  • examples/run_single_task.py中的local_model_config字典,模型名称按实际填写,比如这里用的是gelab-zero-4b,官方默认是gelab-zero-4b-preview

如果想用WebUI而不是命令行,也可以自己vibe一段代码出来。

最后总结一下:GELab-Zero-4B这个模型算是又刷新了认知。简单和中等任务执行得都很好,复杂任务偶尔会陷入循环——这毕竟只有4B参数,但不少场景上真不比9B的AutoGLM差,甚至执行得更利落。看来手机上部署GUI Agent的脚步声越来越近了,端侧,未来可期。

来源:https://www.53ai.com/news/LargeLanguageModel/2026011281562.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程