当前位置: 首页
科技数码
智谱IPO前推出旗舰大模型GLM-4,能力全面升级

智谱IPO前推出旗舰大模型GLM-4,能力全面升级

热心网友 时间:2025-12-23
转载

在推进IPO的关键节点,智谱AI正式上线并开源其最新旗舰模型GLM-4.7,新版本针对Coding场景着重强化了编码能力、长程任务规划与工具协同,标志着该公司技术产品线的又一次重要迭代。

12月23日,智谱正式上线并开源其最新旗舰模型GLM-4.7,在多项主流公开基准测试中,GLM-4.7展现了具有竞争力的性能,部分指标超越了目前市场的领先模型。数据显示,在全球百万用户参与盲测的专业编码评估系统Code Arena中,GLM-4.7位列开源第一、国产第一,并超越了GPT-5.2。同时,该模型在SWE-bench-Verified和LiveCodeBench V6等测试中均取得了开源SOTA(当前最佳)分数,对齐Claude Sonnet 4.5。

在架构上,GLM-4.7引入了“保留式思考”与“轮级思考”机制,显著提升了复杂任务的稳定性与可控性。在前端生成质量方面,模型对UI设计规范的理解得以增强,能够生成审美更佳的网页与PPT。目前,该模型已通过BigModel.cn提供API服务,并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划。

此次更新标志着国产大模型在“思考”与“行动”协同能力上的进一步突破。随着Coding能力的增强,开发者能够更自然地以“任务交付”为核心组织开发流程,这一进展也被视为智谱在资本市场动作前夕展示技术肌肉的重要举措。

编码与推理能力刷新基准

根据公布的测试数据,GLM-4.7在编程和推理能力上实现了显著提升。在HLE(“人类最后的考试”)基准测试中,该模型获得42.8%的成绩,较上一代GLM-4.6提升41%,并超越了GPT-5.1。

在代码生成领域,GLM-4.7展现了在多语言编码方面的优势。具体评测数据包括:

SWE-bench-Verified:获得73.8%的开源SOTA分数。LiveCodeBench V6:达到84.9%的开源SOTA分数,超过Claude Sonnet 4.5。Terminal Bench 2.0:达到41%,提升幅度达16.5%。

此外,在工具调用能力方面,GLM-4.7在τ²-Bench交互式工具调用评测中得分87.4分,刷新开源记录。

引入可控“思考”模型

为解决复杂任务中的稳定性问题,GLM-4.7强化了思考能力的可控进化,具体体现在三个维度:

交错式思考:模型在每次回答或工具调用前进行预先思考,以提升对复杂指令的遵循能力及代码生成质量。保留式思考:支持在多轮对话中自动保留思考块,提升缓存命中率,从而降低长程任务的推理成本。轮级思考:允许在该会话内按“轮”控制推理开销,简单任务关闭思考以降低时延,复杂任务开启思考以确保准确性。

这种机制使得GLM-4.7能够在Claude Code、TRAE、Kilo Code、Cline和Roo Code等主流编程框架中实现“先思考、再行动”的逻辑,在实际编程任务的稳定性和可交付性上优于前代版本。

前端审美与全栈交付

针对前端开发场景,GLM-4.7提升了对视觉代码的理解力。在实际应用中,模型能够更好地遵循UI设计规范,在布局结构、配色和谐度及组件样式上提供具备美感的默认方案,减少人工微调时间。

据最新演示,该模型在办公创作中的版式审美显著升级,PPT 16:9的适配率从52%跃升至91%,生成结果基本达到“即开即用”标准。


在实际案例演示中,GLM-4.7已能独立完成如“植物大战僵尸”、“水果忍者”等高交互小游戏的开发,显示出较强的任务拆解与技术栈整合能力。


市场反馈:性价比与实战表现

GLM-4.7上线后迅速引起了全球开发者社区的关注,用户反馈主要集中在其实际解决问题的能力与极高的性价比上。

在社交媒体上,网友Diego分享了使用GLM-4.7编写Python代码来可视化单行道红绿灯的案例,评价称结果“整体运行良好”,仅指出车辆颜色随红绿灯变化的细微瑕疵。


网友Alex Fazio则表示在WebDev Arena上的表现令其震惊,直言“GLM-4.7超越了GPT-5.2”。

价格策略也成为市场讨论的焦点。网友Bessi指出,订阅一年GLM-4.7的费用仅相当于Codex或Claude Code最高级计划一个月的价格,并认为这种极具竞争力的定价模式将对西方AI公司构成挑战,直言“无论你是否喜欢,这就是未来”。


针对模型进化速度,网友Chubby评论称,HLE基准测试原本被设计为极其复杂、难以在短期内拟合的最终测试,但业界在短短12个月内通过各类工具将成绩从8%(o1)提升至45.8%,GLM-4.7此次取得的突破表明技术迭代速度正“超出预期”。

来源:https://www.163.com/dy/article/KHF984EU05198NMR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
比亚迪确认收购欧洲闲置工厂计划属实

比亚迪确认收购欧洲闲置工厂计划属实

一则关于比亚迪加速欧洲本土化布局的最新动态,近日引发了汽车行业广泛关注。据权威财经媒体报道,这家全球领先的中国新能源汽车制造商正在与Stellantis集团等多家欧洲主流汽车制造商进行深入接触,核心议题是商讨接管后者在欧洲地区利用率不足或闲置的工厂设施。 今日,比亚迪官方通过中证金牛座等渠道证实了谈

时间:2026-05-15 18:33
成都机器人吸引爱尔兰议员驻足互动海外嘉宾纷纷点赞

成都机器人吸引爱尔兰议员驻足互动海外嘉宾纷纷点赞

2026年成都国际友城合作与发展大会现场,一股源自本土的“硬核”科技风潮成为全场瞩目的焦点。来自成都的“智元”远征A2机器人、“四川具身”情感交互机器人等前沿产品集中展示,其创新形态与智能交互能力迅速吸引了众多与会嘉宾的关注。 会议期间,爱尔兰统一党议员基兰·丹尼森对这些成都制造的机器人表现出浓厚兴

时间:2026-05-15 18:32
东华测试在可控核聚变结构强度测试中的应用与进展

东华测试在可控核聚变结构强度测试中的应用与进展

可控核聚变,被誉为解决人类未来能源需求的终极方案。然而,从科学构想到工程实现,需要坚实而渐进的技术积累。近期,在一次专业的技术研讨中,东华测试分享了其在核能测试领域的最新动态,为我们洞察这一尖端行业的进展提供了具体视角。 从战略布局分析,公司的技术能力已全面覆盖核能发展的两大主流路径。在面向未来的可

时间:2026-05-15 18:32
美股科技股普遍下跌英伟达连续七日创新高白银价格大跌近5

美股科技股普遍下跌英伟达连续七日创新高白银价格大跌近5

5月14日晚,美股市场开市呈现高开态势,三大股指全线飘红。然而,市场的乐观情绪并未能持续蔓延至所有板块。 大型科技股普遍承压下行。截至当晚22:00左右,芯片巨头英伟达却逆势上扬,涨幅接近3%,股价连续第七个交易日刷新历史纪录,总市值攀升至5 63万亿美元。回顾过去两个月,其累计涨幅已接近24%,势

时间:2026-05-15 18:32
马斯克携幼子访华引热议 孩子穿中式服装学普通话

马斯克携幼子访华引热议 孩子穿中式服装学普通话

5月14日,特斯拉CEO埃隆·马斯克现身北京人民大会堂,其6岁儿子X AE A-XII(昵称小X)的造型成为全场焦点。这位小男孩身着复古中式马甲与虎头帽,手拎精致虎头包,活泼可爱的模样迅速在各大社交平台引发热议,收获无数网友点赞。 当晚,马斯克本人在社交媒体上用中文发文,分享了一个温馨细节:“我的儿

时间:2026-05-15 18:31
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程