当前位置: 首页
AI
探秘GLM-4-6V开源发布:多模态AI模型API降价50%开放商用

探秘GLM-4-6V开源发布:多模态AI模型API降价50%开放商用

热心网友 时间:2025-12-09
转载

12月8日,智谱AI正式宣布发布并开源GLM-4.6V系列多模态大模型,具体包含两款:

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

GLM-4.6V(106B-A12B):专为云端服务与高性能集群场景打造的基础版本;

GLM-4.6V-Flash(9B):面向本地部署与低延迟应用场景的轻量化版本。

作为GLM系列在多模态方向上的一次重要升级,GLM-4.6V将训练时上下文窗口提升到128k tokens,其视觉理解精度达到了同参数规模的SOTA水平。此次迭代首次在模型架构中将Function Call(工具调用)能力原生融入视觉模型,打通了从“视觉感知”到“可执行行动(Action)”的链路,为真实业务场景中的多模态Agent提供了统一的技术底座。

除了性能优化,GLM-4.6V系列相较GLM-4.5V价格下降50%,API调用价格低至输入1元 / 百万tokens,输出3元 / 百万tokens。

同时,GLM-4.6V-Flash将免费开放使用。

GLM-4.6V即日起融入GLM Coding Plan,针对用户8大类场景定向开发了专用MCP工具,模型可自主调用最匹配的接口。

智谱AI介绍称,传统工具调用大多基于纯文本,在面对图像、视频、复杂文档等多模态内容时,往往需要多次中间转换,容易导致信息损耗和工程复杂度上升。GLM-4.6V从设计之初就围绕“图像即参数,结果即上下文”的理念,构筑了原生多模态工具调用能力:

输入多模态:图像、截图、文档页面等可以直接作为工具参数,无需先转为文字描述再解析,减少了链路损耗。

输出多模态:对于工具返回的统计图表、渲染后网页截图、检索到的商品图片等结果,模型能够再次进行视觉理解,并将其纳入后续推理链路。

模型原生支持基于视觉输入的工具调用,完整打通从感知到理解再到执行的闭环。这使得GLM-4.6V能够应对图文混排输出、商品识别与好价推荐,以及辅助型Agent场景等更复杂的视觉任务。

GLM-4.6V在MMBench、MathVista、OCRBench等30多个主流多模态评测基准上进行了验证,较上一代模型取得显著提升。在同等参数规模下,模型在多模态交互、逻辑推理和长上下文等关键能力上均取得了SOTA表现。其中,9B版本的GLM-4.6V-Flash整体表现超过Qwen3-VL-8B,而106B参数12B激活的GLM-4.6V表现则比肩2倍参数量的Qwen3-VL-235B。

智谱AI开放了GLM-4.6V的模型权重、推理代码与示例工程,附开源地址如下:

GitHub:https://github.com/zai-org/GLM-V

Hugging Face:https://huggingface.co/collections/zai-org/glm-46v

魔搭社区:https://modelscope.cn/collections/GLM-46V-37fabc27818446

来源:https://www.itbear.com.cn/html/2025-12/1045332.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点

OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点

OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点分析 最近,圈子里的讨论热度明显聚焦在一个词上:OpenClaw。无论是开发者,还是正在推进AI项目的团队,都在打听它。这工具到底是什么?能解决什么问题?配上那些中转Token,真的就高枕无忧了吗?今天,我们就来把这事儿掰

时间:2026-04-07 08:02
OpenClaw教程(八)—— 为OpenClaw打造记忆系统

OpenClaw教程(八)—— 为OpenClaw打造记忆系统

上一篇我们探讨了OpenClaw的自动化能力,今天的话题,可以说是一个AI助手能否真正“进化”的关键——如何为它构建一套有效的记忆系统。 随着助手能力的不断扩展,它每天处理的事务会越来越多,产生的信息量也会急剧增长:例行检查、异常发现、你下达的各种指令……如果没有记忆,每次唤醒它都如同面对一张白纸,

时间:2026-04-07 07:21
OpenClaw创建 Skills

OpenClaw创建 Skills

SKLL md 在构建AI助手自定义技能的过程中,一个基础的“打招呼”功能看似简单,却是理解整套开发流程的绝佳入口。这个名为 hello_world 的技能模板,完整展示了一个规范的技能描述文件应如何构成,是所有复杂功能开发的基石。 ---name: hello_worlddescription:

时间:2026-04-07 07:21
让 AI 替你叫车,哈啰顺风车上线出行行业首个 MCP 服务

让 AI 替你叫车,哈啰顺风车上线出行行业首个 MCP 服务

让 AI 替你叫车:哈啰顺风车上线出行行业首个 MCP 服务 4月3日,哈啰顺风车推出一项业内瞩目的创新举措:正式上线名为MCP的新型服务。通俗来讲,这项服务将顺风车从寻找车主、智能匹配到最终下单支付的完整流程能力,封装成了一套标准化的技术接口,直接向各类大语言模型和AI智能体开放调用权限。 这一变

时间:2026-04-07 07:16
QQ接入openclaw的几个步骤

QQ接入openclaw的几个步骤

2026年4月新版OpenClaw QQ机器人接入全攻略:实践步骤、问题排查与深度解读 随着2026年4月OpenClaw重要更新的发布,其原生集成QQ平台支持的功能引起了大量开发者的关注。这一特性意味着用户无需借助任何第三方插件,即可将智能AI助手便捷地部署为QQ私聊或群聊机器人。本文将系统性地解

时间:2026-04-07 07:05
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程