GLM-5实力实测：24小时自主编程，700次工具调用与800次上下文切换

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

GLM-5实力实测：24小时自主编程，700次工具调用与800次上下文切换

热心网友时间：2026-02-12

转载

当看到GLM-5正式发布后的能力，才惊觉前几天神秘模型Pony Alpha的热度还是有点保守了。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

因为这一次，GLM-5直接把开源AI也拽进了长任务时代。

瞧，GLM-5直接身兼数职，自己连续跑代码超过24小时，700次工具调用、800次上下文切换之后……

它直接用JavaScript，从零手搓了一个Game Boy Advance模拟器！

外观渲染画面是这样的：

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

屏幕里是这样的：

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

在没有渲染情况下的动态效果如下：

自动播放

要知道，这对于AI来说，是一个绝对无法取巧的工程任务。

因为GBA模拟器涉及到了500多条CPU指令集、内存分页机制、音频子系统和图形渲染时序等任务。

哪怕一条指令遵循出错，或者一次文件写入偏差，整个项目就会在几个小时后崩盘。

并且GLM-5面对的还是无并行、无任何参考代码、关闭网络搜索的那种。

即便如此，从视频给出的结果中我们也不难发现，GLM-5确实是发挥非常稳定：

工具调用稳定：第700次和第一次在语法、格式、准确度上没有差异；

指令遵循持久：上下文即使切换了800次，依旧遵守Meta-Prompt的规范、约定和流程；

工作判断稳定：GLM-5知道自己什么时候该测试、信息记录、切换策略等；

上下文够可靠：每次上下文清空后，GLM-5能从笔记和文件中准确恢复工作状态。

这也难怪不少网友在看完之后直呼：

它可以制作精美的CAD模型！

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

并且目前GLM-5的评测结果也已出炉，在权威榜单Artificial Analysis中，直接到了与Claude Opus 4.5比肩的水平。

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

在业内公认的主流基准测试中，GLM-5的编程能力也是实现了与Claude Opus 4.5对齐：

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

并且在衡量模型经营能力的Vending Bench 2中，GLM-5取得了开源第一的成绩：

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

但毕竟Claude Opus是闭源，护城河一下子被GLM-5这个开源模型给端掉，也是引得不少网友欢呼：

感谢开源！

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

那么GLM-5这位开源界的第一位“全栈架构师”，还有什么样的实力？

接下来，一波深度实测开源版Opus级别的模型，走起~

已经有人申请上架App Store了

我们的测试将在Claude Code中调用GLM-5 API的方式展开。

因此，我们第一个测试就是做最考验模型的逻辑闭环能力的游戏——要求GLM-5从零生成一个3D版大富翁：

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

接下来，我们直接来看下效果：

自动播放

可以看到，面对如此复杂的需求，GLM-5稳稳地把所有功能都实现了出来。

若是Prompt更加精细，我们就可以得到一个OpenClaw对战的《龙虾版3D大富翁》：

自动播放

而且已经有用户使用GLM-5做了个学术版“抖音”，并且提交上架苹果App Store！

自动播放

10余款APP都要上架了：

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

实测继续。

这一次，我们要测试GLM-5对复杂物理规律描述的理解能力，请听Prompt：

创建一个玻璃十二面体，每个面是一个遮罩，显示中央相同旋转基底环结的不同设计。应用一些细微的泛光效果。在它外面再加一层大约两倍大小的第二层玻璃壳，并让每个面透过时改变内部玻璃的外观成不同类型，比如透过外层的某一面，整个内壳看起来像是染色玻璃、彩绘玻璃或线框等，仅供参考。使用 three.js，……

自动播放

GLM-5依旧是精准地捕捉到了Prompt中的关键词，生成的HTML文件打开后，一个光影交错的十二面体悬浮在空中。

除此之外，包括像全栈类型任务，例如制作一个完整、有设计感的电商，GLM-5也是可以拿捏。

以及有人也用GLM-5手搓了个3D版可交互的《我的世界》！

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

开源，Win Again

GLM-5的出现，不论是从实测还是网友们的反响来看，都在标志一件事情：

开源大模型完成了一次从助手到独立工程师的质变。

以前，我们用AI是写一句Prompt，但需要不断地去做调试的工作；但现在，用GLM-5可以是给它一个目标，然后去喝咖啡，偶尔回来看看它有没有跑偏。

更宏观地来看，这对于SaaS行业来说，也可能是一场风暴。

毕竟就在前几天，随着Claude Opus等具备长任务能力的闭源模型展现威力，国外市场已经出现了恐慌。

例如当时金融数据服务商FactSet最惨盘中暴跌10%，S&P Global、穆迪、纳斯达克公司纷纷下跌，各大指数全线跳水。

Fortune和CNBC报道称，SaaS软件类股票遭到抛售，投资者担心，如果AI能现场手搓一个CRM系统，谁还去买年费软件。

虽然黄仁勋安抚说AI会增强现有工具，但GLM-5的实测表现告诉我们：重塑或许已经在发生。

更重要的是，之前这种能力是闭源巨头的特权。现在，GLM-5把这把钥匙交到了所有开发者手里。

或许这次开源模型24小时不间断自己跑代码只是一个起点，未来会更长、更快、更好、更强。

Two More Things：

GLM其实从4.5版本开始就死磕AI编程这件事，现在这个国产AI的coding套餐在国内外也是相当火爆；这次智谱一上来就限售，外国网友们都是在“求”的状态。

以及，智谱公司的大楼，现在也是成了个打卡点：

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

开头我们提到的GBA模拟器，由于GLM-5一直在跑，程序员小哥哥下班打车是这样的：Agent乘客

。

GLM-5真够顶的：超24小时自己跑代码，700次工具调用、800次切上下文

GitHub：

https://github.com/zai-org/GLM-5

Hugging Face：

https://huggingface.co/zai-org/GLM-5

ModelScope：

https://modelscope.cn/models/ZhipuAI/GLM-5

GameBoy Advance体验：

https://e01.ai/gba

来源:https://tech.ifeng.com/c/8qgcNg47vpL

上一篇： AI应用争相烧钱，谁能扛住千亿算力成本？

下一篇： MiniMax双模型实战测评：与Claude的技术较量与突破

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

盗宝小妖高分通关攻略与实战技巧详解

魔兽世界凄凉之地前往路线与交通指南

无限火力剑魔最强出装符文搭配攻略

和平精英最新版更新教程卡顿下载慢解决方法汇总

DNF皇女艾莉婕身份背景与剧情详解

梦幻西游东海湾蜃境入口选择攻略与路线推荐

魔兽世界巫妖王怀旧服裁缝专业速冲450级指南

DNF女枪手职业推荐：哪个职业最强最好用

三角洲行动M82狙击枪改装方案配件搭配与实战技巧

极限竞速地平线6豪华版与标准版详细区别对比

小米汽车推出寻天子品牌增程车型将改变家用车市场格局

洛克王国独角仙踪地图位置详解与寻找攻略

洛克王国博得材料屋具体位置与寻找攻略

洛克王国枫雪镇现在还能进入吗最新情况说明

175魔化生寺装备选择与搭配全攻略

暗黑破坏神4熔岩殉道者钓鱼位置详解

异环娜娜莉爬墙技巧与详细操作步骤解析

红色沙漠漆黑射手板金披风获取方法全攻略

暗黑破坏神4食尸鬼蠕虫钓鱼位置与获取方法

炉石传说滋养自然卡牌效果与使用指南

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

Roblox帽子获取方法详解头部配件装备指南发布于 2026-05-15

云鸣潮网页版在线试玩官方入口免下载秒开体验发布于 2026-05-15

云鸣潮手柄连接设置教程从入门到进阶操作指南发布于 2026-05-15

三国志幻想大陆刘备命魂觉醒攻略与技能解析发布于 2026-05-15

深海迷航手游控制台开启方法详细教程发布于 2026-05-15

三角洲行动陷阱拆除与战术道具使用全攻略发布于 2026-05-15

红色沙漠勇武之步套装获取方法全攻略发布于 2026-05-15

云鸣潮网页版免费在线玩官方正版直接进入发布于 2026-05-15

受枷者三套满分阵容推荐平民玩家通关攻略详解发布于 2026-05-14

Warframe指挥官新手入门第一关操作技巧完全指南发布于 2026-05-14

澜最强出装铭文搭配刀刀致命轻松收割战场发布于 2026-05-14

免费追剧软件推荐高清无广告影视APP合集发布于 2026-05-14

夜灵平野隐藏区域银光林地探索全攻略发布于 2026-05-14

伊什梅尔技能解析与实战使用指南发布于 2026-05-14

双神破核阵容推荐：高效克制核心怪物的实战指南发布于 2026-05-14

植物大战僵尸阳光经济攻略防御布局与火力配置详解发布于 2026-05-14

Mac清理系统字体与磁盘优化技巧发布于 2026-05-14

Win10硬盘分区表查看方法：快速确认GPT与MBR格式发布于 2026-05-14

Mac清理Flutter构建缓存教程苹果电脑释放磁盘空间发布于 2026-05-14

苹果电脑Mac快速合并视频片段剪辑教程发布于 2026-05-14

统信UOS鼠标宏设置教程提升办公效率实用指南发布于 2026-05-14

Linux端口占用解决方法与强制结束进程命令教程发布于 2026-05-14

Windows 11 如何开启 AV1 硬件编码以提升视频处理效率发布于 2026-05-14

Mac清理Google Drive缓存教程苹果电脑释放存储空间方法发布于 2026-05-14

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

GLM-5实力实测：24小时自主编程，700次工具调用与800次上下文切换

AI图像处理训练数据存在色差问题 16种算法经小改动全面提升

人工智能会隐藏真实意图成为卧底吗Anthropic最新研究揭秘

中科院与新加坡国大合作研发高效AI推理模型实现智能优化

华东师范大学突破AI记忆瓶颈实现机器学习大脑

手机语音助手为何难懂外国口音卡内基梅隆大学研究揭秘