当前位置: 首页
AI
智谱DeepSeek-MLA模型实测:M5芯片跑起来效果如何

智谱DeepSeek-MLA模型实测:M5芯片跑起来效果如何

热心网友 时间:2026-01-21
转载

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

智谱AI上市之后,再推重磅新成果。

全新开源的轻量级大语言模型GLM-4.7-Flash正式登场,无缝接替上一代GLM-4.5-Flash,并提供免费API调用服务。



这是一款采用混合专家(MoE)架构的模型,其核心特点是仅激活少量参数——虽然总参数量达300亿,但实际推理时仅动用约30亿参数。智谱将其定位为“本地编程与智能助手”,专注于实际场景的效率与实用性。

在SWE-bench Verified代码修复测试中,GLM-4.7-Flash以59.2分的表现展现了其编程能力。在“人类最后的考试”等综合评测中,它也显著超越了同规模的通义千问和GPT-OSS等模型。



作为去年12月发布的旗舰模型GLM-4.7的精简版本,GLM-4.7-Flash完整继承了GLM-4系列在代码生成与逻辑推理方面的核心优势,并专门针对效率和资源占用进行了优化。

除了编程辅助,官方也推荐将该模型用于创意写作、翻译、长文本理解等任务,甚至可用于角色扮演等互动场景。

首次上线MLA架构,30亿总参数仅激活3亿

GLM-4.7-Flash延续了该系列“混合思考模型”的设计理念。

模型总参数量为300亿,但在实际推理过程中仅激活大约30亿参数。这一设计让模型在保持强大能力的同时,大幅降低了计算资源的消耗。

上下文窗口长度支持高达20万token,既可以通过云端API调用,也支持在本地环境中进行部署。

目前官方尚未发布详细的技术报告,更多实现细节需要开发者从配置文件中去探索和挖掘。



有开发者注意到了一个关键的技术细节:智谱团队这次首次采用了MLA(多头潜在注意力)架构。这一架构此前由DeepSeek-v2率先应用并验证了其有效性,如今智谱也跟进了这项技术。

从具体结构来看,GLM-4.7-Flash的深度与GLM-4.5-Air和通义30B-A3B等模型接近,但在专家数量配置上有所不同——它采用了64个专家而非128个,推理时激活其中5个(含共享专家)。



模型发布不到12小时,HuggingFace、vLLM等主流平台就已提供了即时的支持。





智谱也在第一时间提供了对华为昇腾NPU的适配支持。



在本地部署方面,经过开发者实测,在配备32GB统一内存、M5芯片的苹果笔记本上,推理速度可以达到每秒43个token。



在官方API平台上,基础版本的GLM-4.7-Flash完全免费开放(限1个并发),高速版的GLM-4.7-FlashX定价也相当亲民。



与同类模型相比,GLM-4.7-Flash在上下文长度支持和输出token定价方面具备一定优势,不过其响应延迟和吞吐量仍有进一步优化的空间。



智谱新模型也采用DeepSeek的MLA架构,苹果M5芯片就能流畅运行

来源:https://www.163.com/dy/article/KJNVGH570511DSSR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
大疆ROMO 2系列AI扫拖机器人发布 超强清洁力

大疆ROMO 2系列AI扫拖机器人发布 超强清洁力

大疆发布ROMO2系列扫拖机器人,包含旗舰款P2与高性价比A2。该系列搭载36000Pa聚能吸力、雷达自适应超幅外摆机械臂及全链路AI决策系统,能智能应对边角清洁与复杂地面环境。配合进阶基站自清洁功能,实现了从清洁到维护的高度自动化,展现了其在空间智能技术向家庭清洁场景的深度迁移。

时间:2026-05-15 17:15
Waymo自动驾驶出租车服务范围扩大超20% 覆盖面积已超罗德岛州

Waymo自动驾驶出租车服务范围扩大超20% 覆盖面积已超罗德岛州

Waymo自动驾驶出租车服务覆盖面积已超1400平方英里,遍及全美11个城市。此次扩张聚焦现有市场深耕,服务网络较此前显著扩大。公司运营约3000辆全无人驾驶车辆,并获巨额融资支持业务增长。与特斯拉相比,Waymo在覆盖范围、车辆规模及无人化程度上优势明显。

时间:2026-05-15 17:15
大众电动高尔夫何时上市最新消息与时间预测

大众电动高尔夫何时上市最新消息与时间预测

大众纯电高尔夫上市时间再度推迟,原定2028年发布计划取消。品牌CEO表示现有ID系列车型阵容已能满足市场需求,无需急于推出。推迟原因还包括与Rivian合作开发的新一代电动车平台延期,以及应对中国品牌竞争带来的市场压力。新车计划于本十年末在德国沃尔夫斯堡工厂生产。

时间:2026-05-15 17:15
舍弗勒与Humanoid合作 数千人形机器人将进驻工厂

舍弗勒与Humanoid合作 数千人形机器人将进驻工厂

英国Humanoid公司与舍弗勒达成协议,计划在2032年前向后者全球工厂部署数千台轮式人形机器人。首批将于2026年底在德国工厂投入运营,初期执行搬运任务,未来拓展至装配等复杂工序。合作采用机器人即服务模式,舍弗勒同时成为Humanoid关节执行器的优先供应商。

时间:2026-05-15 17:15
Petlibro Scout宠物摄像头评测:基础功能强大,AI订阅非必需

Petlibro Scout宠物摄像头评测:基础功能强大,AI订阅非必需

PetlibroScout是一款入门级宠物摄像头,定价约70美元。其基础功能扎实,1080p画质清晰,云台旋转灵活,支持多种安装方式并配备物理隐私挡板。AI识别需额外订阅但实测表现不稳定,性价比低。设备安全性曾有漏洞但已修复。总体而言,它是一款适合基础监控、无需依赖订阅服务的实用选择。

时间:2026-05-15 17:14
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程