GLM-4.6V多模态AI模型发布,宣布开源并降价API 50%
12月8日消息,智谱 AI 今日宣布正式推出并开源 GLM-4.6V 系列多模态大模型,具体包括以下两个版本:
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
GLM-4.6V(106B-A12B):该版本是面向云端与高性能集群场景的基础版;
GLM-4.6V-Flash(9B):这是一个面向本地部署与低延迟应用的轻量级版本。

作为 GLM 系列在多模态方向上的一次重要迭代,GLM-4.6V 将训练时上下文窗口提升至 128k tokens,其在视觉理解精度上达到了同参数规模的 SOTA 水平。尤为值得一提的是,该模型首次在架构中,将 Function Call(工具调用)能力原生融入视觉模型,打通了从“视觉感知”到“可执行行动(Action)”的链路,旨在为真实业务场景中的多模态 Agent 提供统一的技术底座。
除了性能优化,GLM-4.6V 系列相较于 GLM-4.5V 实现了高达 50% 的降价,API 调用价格已降至输入 1 元 / 百万 tokens,输出 3 元 / 百万 tokens。
同时,GLM-4.6V-Flash 版本已免费开放使用。
GLM-4.6V 即日起融入 GLM Coding Plan,针对用户八大类场景定向开发了专用 MCP 工具,模型可自主调用最匹配的接口。

智谱 AI 介绍称,传统的工具调用大多基于纯文本,在面对图像、视频、复杂文档等多模态内容时,往往需要多次中间转换,容易造成信息损失和工程复杂度上升。GLM-4.6V 从设计之初就围绕“图像即参数,结果即上下文”的理念,构建了原生的多模态工具调用能力:
输入多模态:图像、截图、文档页面等内容可以直接作为工具参数,无需先转为文字描述再解析,有效减少了链路损耗。
输出多模态:对于工具返回的统计图表、渲染后网页截图、检索到的商品图片等结果,模型能够再次进行视觉理解,并将其纳入后续推理链路。
这种模型原生支持基于视觉输入的工具调用,完整打通了从感知到理解再到执行的闭环。这使得 GLM-4.6V 能够处理图文混排输出、商品识别与好价推荐、以及辅助型 Agent 场景等更为复杂的视觉任务。

GLM-4.6V 在 MMBench、MathVista、OCRBench 等 30 多个主流多模态评测基准上进行了验证,较上一代模型取得了显著提升。在同等参数规模下,该模型在多模态交互、逻辑推理和长上下文等关键能力上均取得了 SOTA 表现。其中,9B 版本的 GLM-4.6V-Flash 整体表现超越 Qwen3-VL-8B,而 106B 参数、激活12B 的 GLM-4.6V 表现更是比肩参数量为其 2 倍的 Qwen3-VL-235B。

智谱 AI 已开放 GLM-4.6V 的模型权重、推理代码与示例工程,其开源地址如下:
GitHub:https://github.com/zai-org/GLM-V
Hugging Face:https://huggingface.co/collections/zai-org/glm-46v
魔搭社区:https://modelscope.cn/collections/GLM-46V-37fabc27818446
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI 的记忆不是硬盘——从 40 个真实 Bug 说起
这是 AI 认知架构实战笔记 系列的第 2 篇 上一篇我们聊了「给 AI 写灵魂文件」这件事,这一篇,我们来看看,当这份灵魂文件真正运转起来之后,现实究竟会给我们带来多少“惊喜”——或者更准确地说,是漏洞。项目名为 WorkBuddy-Configure,已部署在 gitee 和 gitcode 上
OpenClaw给每个Agent单独指定workspace
OpenClaw中为每个Agent配置独立工作区的最佳实践 在大模型智能体协作平台上,实现多个Agent之间的文件隔离是确保项目管理井然有序的关键需求。如果您正在使用OpenClaw平台,为不同角色的智能体分配专属工作空间可以有效避免文件冲突、权限混乱等问题。本指南将详细介绍在OpenClaw中为每
OpenClaw更新操作
前言 对于 OpenClaw 的忠实用户而言,每一次版本迭代都意义非凡。新功能密集、改动幅度大是它的显著特点,这固然令人欣喜,但伴随而来的更新操作也时常会遇到一些预料外的状况。本文旨在系统梳理我们在升级过程中遇到的常见问题与解决方案,帮助您在下次更新时更加顺畅,有效规避不必要的麻烦。 一、OpenC
openclaw源码
项目资源与开源社区 对于希望深入研究OpenClaw技术生态的开发者与研究者,以下几个核心的开源仓库提供了关键的切入点和持续更新的资源集合。 首先,OpenClaw项目的主仓库位于: https: github com openclaw openclaw 这里是所有核心代码、文档和官方进展的枢纽,
关停 Sora 后 OpenAI 转身收购 TBPN 播客,亲自下场做媒体
OpenAI关闭Sora后战略转向:收购TBPN播客,深度布局内容生态 四月初的科技界新闻不断,一则来自科技媒体9to5Mac的报道引发了行业的强烈关注。OpenAI在近期宣布正式收购知名科技商业播客品牌The Browser Pane。这一战略动作紧随其视频应用Sora的停止运营之后,被外界普遍视
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

