智谱DeepSeek-MLA模型实测:M5芯片跑起来效果如何
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
智谱AI上市之后,再推重磅新成果。
全新开源的轻量级大语言模型GLM-4.7-Flash正式登场,无缝接替上一代GLM-4.5-Flash,并提供免费API调用服务。

这是一款采用混合专家(MoE)架构的模型,其核心特点是仅激活少量参数——虽然总参数量达300亿,但实际推理时仅动用约30亿参数。智谱将其定位为“本地编程与智能助手”,专注于实际场景的效率与实用性。
在SWE-bench Verified代码修复测试中,GLM-4.7-Flash以59.2分的表现展现了其编程能力。在“人类最后的考试”等综合评测中,它也显著超越了同规模的通义千问和GPT-OSS等模型。

作为去年12月发布的旗舰模型GLM-4.7的精简版本,GLM-4.7-Flash完整继承了GLM-4系列在代码生成与逻辑推理方面的核心优势,并专门针对效率和资源占用进行了优化。
除了编程辅助,官方也推荐将该模型用于创意写作、翻译、长文本理解等任务,甚至可用于角色扮演等互动场景。
首次上线MLA架构,30亿总参数仅激活3亿
GLM-4.7-Flash延续了该系列“混合思考模型”的设计理念。
模型总参数量为300亿,但在实际推理过程中仅激活大约30亿参数。这一设计让模型在保持强大能力的同时,大幅降低了计算资源的消耗。
上下文窗口长度支持高达20万token,既可以通过云端API调用,也支持在本地环境中进行部署。
目前官方尚未发布详细的技术报告,更多实现细节需要开发者从配置文件中去探索和挖掘。

有开发者注意到了一个关键的技术细节:智谱团队这次首次采用了MLA(多头潜在注意力)架构。这一架构此前由DeepSeek-v2率先应用并验证了其有效性,如今智谱也跟进了这项技术。
从具体结构来看,GLM-4.7-Flash的深度与GLM-4.5-Air和通义30B-A3B等模型接近,但在专家数量配置上有所不同——它采用了64个专家而非128个,推理时激活其中5个(含共享专家)。

模型发布不到12小时,HuggingFace、vLLM等主流平台就已提供了即时的支持。


智谱也在第一时间提供了对华为昇腾NPU的适配支持。

在本地部署方面,经过开发者实测,在配备32GB统一内存、M5芯片的苹果笔记本上,推理速度可以达到每秒43个token。

在官方API平台上,基础版本的GLM-4.7-Flash完全免费开放(限1个并发),高速版的GLM-4.7-FlashX定价也相当亲民。

与同类模型相比,GLM-4.7-Flash在上下文长度支持和输出token定价方面具备一定优势,不过其响应延迟和吞吐量仍有进一步优化的空间。

智谱新模型也采用DeepSeek的MLA架构,苹果M5芯片就能流畅运行
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
大疆ROMO 2系列AI扫拖机器人发布 超强清洁力
大疆发布ROMO2系列扫拖机器人,包含旗舰款P2与高性价比A2。该系列搭载36000Pa聚能吸力、雷达自适应超幅外摆机械臂及全链路AI决策系统,能智能应对边角清洁与复杂地面环境。配合进阶基站自清洁功能,实现了从清洁到维护的高度自动化,展现了其在空间智能技术向家庭清洁场景的深度迁移。
Waymo自动驾驶出租车服务范围扩大超20% 覆盖面积已超罗德岛州
Waymo自动驾驶出租车服务覆盖面积已超1400平方英里,遍及全美11个城市。此次扩张聚焦现有市场深耕,服务网络较此前显著扩大。公司运营约3000辆全无人驾驶车辆,并获巨额融资支持业务增长。与特斯拉相比,Waymo在覆盖范围、车辆规模及无人化程度上优势明显。
大众电动高尔夫何时上市最新消息与时间预测
大众纯电高尔夫上市时间再度推迟,原定2028年发布计划取消。品牌CEO表示现有ID系列车型阵容已能满足市场需求,无需急于推出。推迟原因还包括与Rivian合作开发的新一代电动车平台延期,以及应对中国品牌竞争带来的市场压力。新车计划于本十年末在德国沃尔夫斯堡工厂生产。
舍弗勒与Humanoid合作 数千人形机器人将进驻工厂
英国Humanoid公司与舍弗勒达成协议,计划在2032年前向后者全球工厂部署数千台轮式人形机器人。首批将于2026年底在德国工厂投入运营,初期执行搬运任务,未来拓展至装配等复杂工序。合作采用机器人即服务模式,舍弗勒同时成为Humanoid关节执行器的优先供应商。
Petlibro Scout宠物摄像头评测:基础功能强大,AI订阅非必需
PetlibroScout是一款入门级宠物摄像头,定价约70美元。其基础功能扎实,1080p画质清晰,云台旋转灵活,支持多种安装方式并配备物理隐私挡板。AI识别需额外订阅但实测表现不稳定,性价比低。设备安全性曾有漏洞但已修复。总体而言,它是一款适合基础监控、无需依赖订阅服务的实用选择。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

