GLM-4.7登顶开源王座,这回挖塌了闭源的墙角?
GLM-4.7的横空出世,为2025年AI竞赛的收官之战增添了新的变数。对我们这些用户而言,这无疑是最好的时代。闭源的高墙依然矗立,但开源铁锹挖开的地基,已经越来越松动。
2025年岁末并不平静。就在大家准备迎接双旦假期之际,智谱AI像是故意给行业投下了一枚“深水炸弹”,发布了最新的GLM-4.7。
说实话,这两年国产大模型的发布会我看累了,各种刷榜参数的消息也听麻了。但这次的情况有点不一样。这次拿出的成绩单,不再是自家做的PPT,而是来自权威评测机构Artificial Analysis。在这个被OpenAI、谷歌奉为金标准的评测里,GLM-4.7干了一件让开源社区炸锅的事:它拿到了全球开源模型的第一名。
图片
这也太“卷”了
先看一张更有说服力的成绩单。在AAII刚刚更新的榜单里,GLM-4.7拿到了68分的综合得分。
这个分数意味着什么?
往上看,它在全球总榜里排第六。排在它前面的,全是GPT-5.2、Gemini 3 Pro这种闭源巨头,也就是那种你每个月得掏20刀甚至更多才能用上的“贵族”模型。
往下看,这才是最有意思的地方。它把Claude 4.5 Sonnet、Grok 4这些名声在外的模型甩在了身后。而在开源这个赛道上,它直接登顶。就连同样表现生猛的DeepSeek V3.2,这次也以两分之差排在第十。
如果不谈开源闭源,单论国产模型,GLM-4.7和Kimi K2、DeepSeek共同构成的第一梯队,已经将国产AI的水准线硬生生拉到了国际一线。

它到底强在哪?
很多开发者,包括我在内,最关心的其实不是分数,而是手感。GLM-4.7这次明显是奔着“解决难题”去的,它被定义为一款专注于推理的模型。
首先是写代码。对于我们这些靠代码吃饭的人来说,Code Arena的排名就是风向标。GLM-4.7在这个榜单上拿了开源第一,甚至在综合性能上压过了GPT-5.2。在LiveCodeBench测试里,它也超过了Claude Sonnet 4.5。虽然在某些特定测试集上还有偏科,但你让它写个复杂脚本或者查Bug,它的表现已经不再是“像个AI”,而是“像个初级工程师”。
其次是它变“聪明”了。这里的聪明指的是逻辑推理。在研究生级别的GPQA Diamond测试里,它拿了84%的高分。为了达到这个效果,智谱给它引入了更长的思维链。简单说,就是它在回答你之前,会像人一样在肚子里打草稿,反复推演。虽然这会让计算成本稍微增加一点,但为了那个准确的答案,这点等待是值得的。
还有一个亮点是“听指挥”。在考察智能体工具调用的测试中,它刷新了开源模型的纪录。这意味着,你可以更放心地把API接给它,让它去操作复杂的系统,而不是担心它听不懂指令乱搞一通。

不仅是榜单,更是风向
GLM-4.7发布后的反应很有趣。它不仅在国内火,在国外的Hugging Face上也迅速冲上了全球趋势榜第一。
这说明了什么?说明好东西是没有国界的。美国的AI推理平台Fireworks直接把它称作“了不起的假期礼物”,Vercel这种极客聚集的平台也第一时间宣布接入。
这不仅是一个模型的胜利,更像是一个信号。直到2024年,我们在讨论大模型时,还在说“追赶GPT-4”。到了2025年底,当我们看到国产模型在Hard模式的基准测试里,和谷歌、OpenAI的旗舰产品打得有来有回,甚至在开源领域领跑时,这种感觉是很微妙的。
对于开发者和企业来说,这意味着选择权的转移。你不需要再为了高质量的推理能力去忍受昂贵的闭源API,GLM-4.7提供了一个高性价比、甚至可以说是廉价的替代方案——每百万token不到1美元的推理成本,配上开源第一的能力,这笔账谁都会算。
总而言之,GLM-4.7的出现,让2025年的AI竞赛在收官阶段又充满了变量。对于我们使用者来说,这无疑是最好的时代。闭源的高墙还在,但地基已经被开源的铁锹挖得越来越松动了。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
智谱 GLM-5.1 高速版 API 发布 每秒处理 400tokens 刷新全球纪录
智谱推出GLM-5 1高速版API,输出速度达400tokens s,刷新全球纪录。该模型将旗舰级能力与极致低延迟结合,用户无需为速度牺牲质量。其性能得益于与TileRT联合开发的静态编排高性能推理引擎,通过编译期优化、细粒度任务拆分与多卡协同,大幅减少数据搬运与调度开销。该服务适用于AI编程、实时交互等高延迟敏感场。
特朗普暂停AI行政令背后监管与竞争的博弈
美国一项针对前沿AI模型的自愿安全测试行政令在签署前数小时被叫停。总统特朗普因担心监管阻碍技术领先地位而拒绝批准,凸显出美国在管控AI风险与维持竞争优势之间的政策矛盾。这一温和的自愿评估框架,仍在安全治理与竞争焦虑的拉扯中被暂时搁置。
OpenAI 2026年第一季度营收达57亿美元 领先Anthropic
OpenAI在2026年第一季度营收达57亿美元,较竞争对手Anthropic同期高出约10亿美元。其收入主要来自ChatGPT消费级产品,付费用户持续增长,但业务重心正转向企业服务。尽管营收亮眼,公司调整后营业利润率仍为负值,面临显著亏损。为应对竞争与盈利压力,OpenAI正加速推进上市进程,最早或于今年9月进行IPO。
马斯克AI助手Grok在美国政府遇冷使用率极低
马斯克旗下xAI的聊天机器人Grok在美国联邦政府市场遇冷。数据显示,在400多个政府AI应用案例中,Grok仅占三例,远落后于OpenAI等竞争对手。其低价策略未能推动普及,使用多限于基础任务。专家指出,这可能因模型难以满足政府安全需求,对SpaceX依赖AI业务的高估值构成挑战。
马斯克SpaceX星舰V3成功发射 NASA局长盛赞史上最强火箭
北京时间5月23日,SpaceX星舰V3火箭成功首飞并溅落印度洋。该火箭为史上最大最强,配备33台全新猛禽3发动机,运力超100吨,并集成在轨燃料加注系统。它已被选为NASA重返月球计划的载人着陆器,其成功标志着人类深空探索能力迈出重要一步。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

