当前位置: 首页
科技数码
智谱IPO前推出旗舰大模型GLM-4,能力全面升级

智谱IPO前推出旗舰大模型GLM-4,能力全面升级

热心网友 时间:2025-12-23
转载

在推进IPO的关键节点,智谱AI正式上线并开源其最新旗舰模型GLM-4.7,新版本针对Coding场景着重强化了编码能力、长程任务规划与工具协同,标志着该公司技术产品线的又一次重要迭代。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

12月23日,智谱正式上线并开源其最新旗舰模型GLM-4.7,在多项主流公开基准测试中,GLM-4.7展现了具有竞争力的性能,部分指标超越了目前市场的领先模型。数据显示,在全球百万用户参与盲测的专业编码评估系统Code Arena中,GLM-4.7位列开源第一、国产第一,并超越了GPT-5.2。同时,该模型在SWE-bench-Verified和LiveCodeBench V6等测试中均取得了开源SOTA(当前最佳)分数,对齐Claude Sonnet 4.5。

在架构上,GLM-4.7引入了“保留式思考”与“轮级思考”机制,显著提升了复杂任务的稳定性与可控性。在前端生成质量方面,模型对UI设计规范的理解得以增强,能够生成审美更佳的网页与PPT。目前,该模型已通过BigModel.cn提供API服务,并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划。

此次更新标志着国产大模型在“思考”与“行动”协同能力上的进一步突破。随着Coding能力的增强,开发者能够更自然地以“任务交付”为核心组织开发流程,这一进展也被视为智谱在资本市场动作前夕展示技术肌肉的重要举措。

编码与推理能力刷新基准

根据公布的测试数据,GLM-4.7在编程和推理能力上实现了显著提升。在HLE(“人类最后的考试”)基准测试中,该模型获得42.8%的成绩,较上一代GLM-4.6提升41%,并超越了GPT-5.1。

在代码生成领域,GLM-4.7展现了在多语言编码方面的优势。具体评测数据包括:

SWE-bench-Verified:获得73.8%的开源SOTA分数。LiveCodeBench V6:达到84.9%的开源SOTA分数,超过Claude Sonnet 4.5。Terminal Bench 2.0:达到41%,提升幅度达16.5%。

此外,在工具调用能力方面,GLM-4.7在τ²-Bench交互式工具调用评测中得分87.4分,刷新开源记录。

引入可控“思考”模型

为解决复杂任务中的稳定性问题,GLM-4.7强化了思考能力的可控进化,具体体现在三个维度:

交错式思考:模型在每次回答或工具调用前进行预先思考,以提升对复杂指令的遵循能力及代码生成质量。保留式思考:支持在多轮对话中自动保留思考块,提升缓存命中率,从而降低长程任务的推理成本。轮级思考:允许在该会话内按“轮”控制推理开销,简单任务关闭思考以降低时延,复杂任务开启思考以确保准确性。

这种机制使得GLM-4.7能够在Claude Code、TRAE、Kilo Code、Cline和Roo Code等主流编程框架中实现“先思考、再行动”的逻辑,在实际编程任务的稳定性和可交付性上优于前代版本。

前端审美与全栈交付

针对前端开发场景,GLM-4.7提升了对视觉代码的理解力。在实际应用中,模型能够更好地遵循UI设计规范,在布局结构、配色和谐度及组件样式上提供具备美感的默认方案,减少人工微调时间。

据最新演示,该模型在办公创作中的版式审美显著升级,PPT 16:9的适配率从52%跃升至91%,生成结果基本达到“即开即用”标准。


在实际案例演示中,GLM-4.7已能独立完成如“植物大战僵尸”、“水果忍者”等高交互小游戏的开发,显示出较强的任务拆解与技术栈整合能力。


市场反馈:性价比与实战表现

GLM-4.7上线后迅速引起了全球开发者社区的关注,用户反馈主要集中在其实际解决问题的能力与极高的性价比上。

在社交媒体上,网友Diego分享了使用GLM-4.7编写Python代码来可视化单行道红绿灯的案例,评价称结果“整体运行良好”,仅指出车辆颜色随红绿灯变化的细微瑕疵。


网友Alex Fazio则表示在WebDev Arena上的表现令其震惊,直言“GLM-4.7超越了GPT-5.2”。

价格策略也成为市场讨论的焦点。网友Bessi指出,订阅一年GLM-4.7的费用仅相当于Codex或Claude Code最高级计划一个月的价格,并认为这种极具竞争力的定价模式将对西方AI公司构成挑战,直言“无论你是否喜欢,这就是未来”。


针对模型进化速度,网友Chubby评论称,HLE基准测试原本被设计为极其复杂、难以在短期内拟合的最终测试,但业界在短短12个月内通过各类工具将成绩从8%(o1)提升至45.8%,GLM-4.7此次取得的突破表明技术迭代速度正“超出预期”。

来源:https://www.163.com/dy/article/KHF984EU05198NMR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
智现未来联合晶合集荣获SEMICON China良率提升奖

智现未来联合晶合集荣获SEMICON China良率提升奖

3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A

时间:2026-03-28 22:58
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业

珠海金湾引进30亿航空整机制造项目,布局载人飞行产业

南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天

时间:2026-03-28 22:58
神州写真:中国机器人租赁升温,二次开发成关键新赛道

神州写真:中国机器人租赁升温,二次开发成关键新赛道

来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年

时间:2026-03-28 22:58
京东翻新打印机避雷指南:警惕以旧充新三大陷阱

京东翻新打印机避雷指南:警惕以旧充新三大陷阱

大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确

时间:2026-03-28 22:58
马斯克母亲分享长城游览视频:赞叹“令人惊叹”

马斯克母亲分享长城游览视频:赞叹“令人惊叹”

来源:九派新闻、环球网版权归原作者所有,如有侵权请及时联系据环球网:美国企业家埃隆·马斯克的母亲梅耶·马斯克3月27日在社交平台X上发帖,分享自己在长城游览的视频。梅耶·马斯克当天在帖子中称,此次旅

时间:2026-03-28 22:58
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程