智谱GLM-5发布:7450亿参数多模态大模型震撼登场

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
2月10日,业内传来消息,春节假期期间国产人工智能领域迎来多款重要模型发布。继备受关注的DeepSeek V4之后,智谱公司新一代大语言模型GLM-5也已正式上线,成为近期市场焦点之一,推动该公司股价在短期内上涨约两倍。
此前,一款代号为“Pony Alpha”的匿名模型悄然登陆全球主流模型服务平台OpenRouter,迅速引发广泛关注。该模型在多项基准测试中表现突出,尤其在代码生成任务上,能力接近当前业界顶尖水平的Claude Opus。
围绕Pony Alpha的归属问题,社区曾展开大量推测与验证。目前综合多方线索,基本可确认其即为智谱即将发布的GLM-5。一方面,系统内部提示词明确标识其属于GLM系列;另一方面,研究人员复现了GLM家族一个标志性行为特征——当输入“锅内倒入植物油烧热”这类中式烹饪指令时,模型会输出逻辑混乱、不符合常识的结果,而Pony Alpha同样呈现这一现象,进一步佐证了身份。
随着更多技术细节被披露,GLM-5的整体架构也逐渐清晰。该模型延续了DeepSeek-V3及V3.2所采用的稀疏注意力机制,总参数量达7450亿,约为上一代GLM-4.7的两倍。
除DSA外,GLM-5另一项关键技术突破是引入多Token预测机制。模型共78层隐藏层,包含256个专家模块,每次推理激活其中8个,对应激活参数量约为440亿,整体稀疏度为5.9%。上下文窗口最大支持202000个token,显著提升长文本处理能力。
复用DeepSeek架构带来诸多工程优势:可直接兼容vLLM、SGLang等主流推理框架的既有优化成果,大幅降低部署难度与运维成本。
值得注意的是,GLM-5首次拓展至多模态能力范畴。此前DeepSeek系列主要聚焦纯文本理解与生成,未支持视频等模态输入。而在2026年,具备跨模态理解能力已成为新一代大模型的基本要求,GLM-5在此方向的进展标志着智谱技术路线的重要升级。
伴随GLM系列在全球范围内的持续落地与用户增长,智谱公司资本市场表现强劲,当前总市值已攀升至约1500亿港元,较数月前首次公开发行时增长约三倍。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
基普乔格代言君乐宝:马拉松之神的品牌选择
3月27日,全球“马拉松之神”埃鲁德·基普乔格走进君乐宝乳业集团,在深度探访全产业链后,正式签约成为君乐宝全球品牌代言人,同时成为君乐宝奶粉肯尼亚市场战略合作伙伴。君乐宝的乳业马拉松坚守品质创新,突
MINI吉设计上海2026:跨界创新如何重塑都市出行体验
MINIJ小吉登陆“设计上海”2026:打造沉浸式美学空间,以“共生之美”谱写生活旋律2026年3月19日,全球美学科技家电品牌MINIJ小吉携手国际家居设计媒体《家居廊ELLE DECORATIO
聚焦中国科学十大进展:柔性超平金刚石薄膜产业化新路径
近日,国家自然科学基金委员会发布了2025年度“中国科学十大进展”,“创新方法实现规模化制备柔性超平金刚石薄膜”入选。这一方法有望加速金刚石薄膜在下一代高性能电子、柔性光电子和量子技术等领域的应
宗馥莉掐断娃哈哈部分产线,“逼宫”风波撕裂脸面
一波未平一波又起,在娃哈哈身上体现得淋漓尽致。“负债上班”的余温还在,停工、停产的消息被再次爆出。 从26日晚间开始,有关“娃哈哈”部分工厂停产的消息便不胫而走。今日,《财新》报道称,“宏胜通知部
三层硬核架构焊死龙虾安全,开发者生存指南
AI开始集体“搞事情”了。 随着OpenClaw等高权限智能体应用的集体爆发,Agentic AI正以前所未有的速度,从实验室的Demo幻觉走向生产力的“大规模杀伤性”落地。 但硬币的另一面也随
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

