当前位置: 首页
AI
GLM-4闪电发布:性能焕新,迭代提速

GLM-4闪电发布:性能焕新,迭代提速

热心网友 时间:2025-12-23
转载

GLM-4.7现已作为GLM Coding Plan的默认模型,该计划提供多种订阅选项,起价为每月3美元,并兼容Claude Code、Cursor等十余种主流编程工具。

GLM-4.7官方基准测试GLM-4.7基准测试表现

经过多日预热,智谱AI于12月22日正式发布了新一代旗舰模型GLM-4.7。其在编程能力与复杂逻辑推理方面实现了显著突破,直接对标当前顶尖的开源模型。

基准测试表现亮眼

根据Z.ai团队发布的信息,GLM-4.7在编程、复杂推理和工具调用等多个技术维度均有显著提升。同时,在常规对话、创意写作及角色扮演等场景下的表现也更为出色。

最新公布的测试结果显示,GLM-4.7在多项关键基准测试中表现优异:

在LMArena代码竞技场(盲测)中,位列开源模型榜首,表现超越GPT-5.2LiveCodeBench V6测试:得分达84.8,领先于Claude 4.5 SonnetAIME 2025(数学测试):表现优于Claude 4.5 Sonnet与GPT-5.1人类终极考试(HLE):得分率达到42%,相较GLM-4.6提升38%,逼近GPT-5.1水平τ²-Bench:在模拟真实世界交互的任务中,与Claude 4.5 Sonnet表现持平

LM Arena测试结果LM Arena测试数据

在实际开发场景的横向对比中,GLM-4.7在前端开发任务中以64.6%的胜率领先GLM-4.6,后端任务胜率为46.7%,而在指令遵循任务上的胜率达到58.3%。

图片实际任务胜率对比

技术规格与特性

GLM-4.7支持高达200K的上下文长度,最大可输出128K tokens,处理速度达到每秒55+ tokens。该模型进一步优化了其交织思维推理模式,并引入了保留思维与回合级思维功能。通过在具体操作步骤之间进行系统性思考,并保持跨回合任务的一致性与连续性,使得处理复杂任务时更加稳定而可控。

图片

定价策略

GLM-4.7现已成为GLM Coding编程计划的默认模型。该计划提供灵活的月付与年付方案,起价为每月3美元,并全面支持与Claude Code、Cursor等十余款热门编程IDE及工具的深度集成。

小结

尽管基准测试数据相当亮眼,但部分早期用户的实际测试反馈则相对保守。有用户表示,在有限的测试中,GLM-4.7的表现并未明显优于Claude 4.5 Sonnet或GPT-5.2,甚至在部分场景下可能不及Minimax M2.1。

智谱近期密集的模型发布节奏,让不少用户直呼“应接不暇,GLM-4.6还没来得及熟悉,GLM-4.7就来了”。这背后的原因,或许与智谱立志成为国内大模型领域领导者的战略目标有关。智谱AI刚刚宣布将于明年1月在香港启动IPO。而市场亦有消息称,其国内竞争对手Minimax也计划在港股上市。相较而言,Minimax的产品布局更为多元,在海外市场的影响力也更强,其应用已拥有超过2.12亿个人用户,覆盖全球200多个国家和地区,海外市场贡献了超过70%的收入。从这个角度来看,为了提升国际影响力与市场声量,频繁推出新模型的动作也就不难理解了。

来源:https://www.51cto.com/article/832538.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
特斯拉德州工厂部署14辆无方向盘自动驾驶出租车

特斯拉德州工厂部署14辆无方向盘自动驾驶出租车

特斯拉的机器人出租车,终于从概念驶入了现实。就在最近,其位于德州的超级工厂完成了首批14辆无方向盘Cybercab的部署。这可不是简单的测试车,而是标志着特斯拉酝酿已久的Robotaxi战略,正式迈入了规模化验证的关键一步。 仔细观察这批车辆,你会发现它们与去年10月“We Robot”活动上亮相的

时间:2026-05-18 22:40
魏牌V9X搭载归元S平台引领AI豪华出行新时代

魏牌V9X搭载归元S平台引领AI豪华出行新时代

4月17日,一场以“契约”为核心的技术盛宴在保定拉开帷幕。魏牌归元S技术发布会暨V9X预售发布会,不仅揭开了长城汽车36年造车智慧的集大成之作——归元S平台,也宣告了其首款旗舰车型魏牌V9X以37 18万元起的预售价,正式开启全球征程。这个平台,与其说是一套技术方案,不如说是一次以“用户价值”为锚点

时间:2026-05-18 22:39
DeepSeek估值680亿融资20亿 梁文锋首次回应

DeepSeek估值680亿融资20亿 梁文锋首次回应

本周五,人工智能行业迎来一则关键动态。 据The Information、路透社等多家权威媒体援引知情人士消息,中国AI明星企业深度求索(DeepSeek)正与投资方展开洽谈,计划以约100亿美元估值进行新一轮融资,目标筹集至少3亿美元资金。 从行业渠道获悉,DeepSeek接触投资机构的情况属实,

时间:2026-05-18 22:38
WorkBuddy Tabbit OpenCLI 三角协同高效使用指南

WorkBuddy Tabbit OpenCLI 三角协同高效使用指南

做AI工具调研时,有个现象挺有意思:网上文章要么说Tabbit是OpenClaw的最佳搭档,要么夸OpenCLI是新一代浏览器自动化神器,但很少有人把这三者放在一起讨论。 今天要聊的,正是WorkBuddy、Tabbit和OpenCLI这三者如何协同工作,形成一个高效的闭环。 一、为什么需要三角协同

时间:2026-05-18 22:37
Mythos推动AI进入行动时代从语言理解迈向动手操作

Mythos推动AI进入行动时代从语言理解迈向动手操作

4月8日,Anthropic的一则官宣,在看似平静的AI湖面上投下了一颗深水冲击波。他们发布了Claude Mythos Preview,但紧接着,又以一种近乎“自我封印”的姿态,亲手为这颗冲击波套上了层层枷锁。 这完全不像一场常规的发布会。没有庆祝,没有香槟,也没有宣布全面开放。相反,Anthro

时间:2026-05-18 22:37
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程