GLM:通用语言模型框架
本次查询GLMAI 热词解释结果
中文解释通用语言模型
热词类型模型架构
常见场景当需要理解一个同时具备强大文本理解与生成能力的国产大模型(如ChatGLM)背后的技术原理时 / 会接触到GLM。
GLM(General Language Model)是由智谱AI等机构提出的通用预训练框架,通过自回归空白填充技术,统一了自然语言理解与生成任务,是ChatGLM等知名模型背后的核心架构。
一句话解释
GLM是一个通过“自回归空白填充”技术,将文本理解和生成任务统一起来的通用语言模型预训练框架。
为什么会被关注
GLM作为ChatGLM系列模型的基石,其优秀的性能让国产大模型受到广泛关注。它提出的统一框架挑战了传统上区分“编码器”和“解码器”的范式,为构建多功能大模型提供了新思路,在学术和产业界都颇具影响力。
核心逻辑
GLM的核心是“自回归空白填充”。模型会随机挖去输入文本中的一些片段(空白),然后以自回归的方式,根据所有上下文(包括被挖空位置前后的文本)来预测并填充这些空白。这个过程同时学习到了文本的内部信息(理解)和连贯生成(生成)能力。
常见场景
GLM主要作为基础架构用于预训练阶段,其衍生模型(如ChatGLM)则广泛应用于对话、文本摘要、代码生成、知识问答等场景。研究人员也常基于GLM框架进行模型架构的改进和创新实验。
容易混淆的点
GLM常与统计中的“广义线性模型”缩写混淆,但在AI领域特指此语言模型框架。另外,GLM是底层架构,而ChatGLM是在此基础上经过对话微调后的具体产品,两者是“发动机”与“整车”的关系,不应等同。
本文内容用于 AI 热词解释和概念整理,仅供学习和理解参考。若涉及表述偏差或内容修正,欢迎联系站点进行更新。
相关热词ChatGLM更新:2026-05-14
ChatGLM:国产大语言模型的代表与探索ChatGLM是由清华大学知识工程实验室(KEG)与智谱AI联合研发的系列开源双语对话语言模型,以其在中文理解和生成上的优异表现而受到广泛关注。它基于GLM(通用语言模型)架构,通过有监督微调等技术优化对话能力,是国产大模型生态中的重要一员。

