AI内部机制揭秘:理解能力的重大突破
本周,Anthropic 团队一口气发布了两篇相互关联的大模型内部机制研究报告,可以说是继去年他们首次揭开大模型黑盒之后,又一次里程碑式的进展。这次,他们搭建了一套“AI 显微镜”——一个替代模型(replacement model),然后用它仔仔细细地追踪大模型在推理时的“思维”过程。 核心内容其
本周,Anthropic 团队一口气发布了两篇相互关联的大模型内部机制研究报告,可以说是继去年他们首次揭开大模型黑盒之后,又一次里程碑式的进展。这次,他们搭建了一套“AI 显微镜”——一个替代模型(replacement model),然后用它仔仔细细地追踪大模型在推理时的“思维”过程。
核心内容其实就三块:
- 他们造出了这个“AI 显微镜”,用来追踪大模型的思维链条。
- 通过这个显微镜,他们绘制出了归因图(attribution graph),展示了模型在每一步推理中特征之间的互动。
- 最后,他们把显微镜对准了 Claud 3.5 Haiku,剖析了它在诗歌创作和多语言处理等场景下的内部工作机制。
这个替代模型就像一台高倍显微镜,能够亦步亦趋地捕获针对每一个提示语的归因图。
归因图描述的是,模型在某个特定输入提示下,生成目标词元输出时所经历的推理步骤。图中的边代表相邻节点之间的线性影响关系,节点包括激活的特征、输入提示中的词元嵌入、重构误差,以及输出逻辑值等。每个特征的活动强度,由它的输入边的权重之和来决定。
换句话说,归因图可以直观展示,在某个具体输入下,特征之间如何相互作用才产生了最终的输出。但更值得关注的,是特征在所有上下文环境中交互的全局图景——这个全局交互由模型权重决定。相邻层神经元之间的直接影响,就是它们之间的连接权重;如果神经元跨越了多个层,影响会通过中间层一步步传递。
这本质上是此前在讨论“降低大模型幻觉的必由之路”时就提到过的——Transformer 视角下的范畴中采样,即在复杂高维的对象米田嵌入图中的采样路径。
接着,研究团队在第二篇报告中,把这台“AI 显微镜”对准了自家的 Claud 3.5 Haiku,做了一次“生物学”式的内部机制探查,结果非常有趣。有两个场景尤其值得拿出来细聊。
诗歌中的规划
研究显示,大模型在写诗行时,并不是简单地把下一个词预测出来就完事。它会提前做规划:在开始写每一行之前,模型就识别出可能出现在行末尾的押韵单词,然后预先选择好押韵选项,再决定整行的构建方式。
这就彻底碘伏了行业里一个流行的错误认知——总以为大模型只是在做下一个词元预测。它确实是这么学习语料的,但推理生成时,远不止这么简单。诗词韵律规划更接近于以前在描述大模型数理原理时提到的采样过程:在外部感官输入(也就是被提示置于某种上下文)下,大模型内部会限定在相应的高维语言概率空间的子空间内推理;推理就是在这个子空间里采样,可以类比为跨范畴采样。采样不断进行,基于内部通过预训练获得的世界模型(也就是先验),针对感官输入做变分推断,最小化自由能,从而获取最佳采样分布 q*,作为对导致感官输入的外部后验的预测。
多语言电路
另一个有趣的发现是多语言电路。研究发现,大模型混合使用了两种电路:一种是“特定于语言”的,另一种是“抽象的、独立于语言”的。而且,更大的模型中,“抽象的、独立于语言”的成分会越来越突出。
这个发现与之前对 DeepSeek R1 & R2 技术原理的分析不谋而合——大模型的语言处理机制在不同层次/尺度上有着清晰的分工。人类与大模型的语言体系中,实际上具有共通的三层结构:
- 自下而上,首先是基础“信息概率分布”处理体系;
- 之上是自然语言层,比如语音、词句;
- 最上层是符号语言,比如代码、数学公式。
推理说到底,不过是在大模型构建的高维概率语言空间里,对信息概率分布做采样的变分过程。这个过程可以映射到不同的上层自然语言,以及对应的语音,甚至进一步映射到某种符号语言——代码或数学公式。而抽象的符号语言也可以用自然语言反过来描述,从而进一步转换为对信息概率分布的处理过程。
Anthropic 团队对大模型内部机制的探索,正在不断逼向模型本质的机理。这与目前来自 Nature、Science,以及学术界和企业界几十项研究成果一样,都指向了同一个数理认知框架。方向越来越清晰了。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:AI内部机制揭秘:理解能力的重大突破要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点你随手拍下一张照片,或者从相册中挑选一张图片,AI就能自动识别画面中的内容,并随即生成一句恰到好处的meme文案——这就是 MemeCam 正在实现的创意功能。它由 GPT-4o 驱动,目标非常明确:让 meme 创作变得轻松、有趣、且零门槛,人人都能成为段子手。 什么是MemeCam? MemeC
先说一个很有意思的应用——Seeing Dogs。它本质上是一款专门为视障人士打造的iPhone和iPad工具,但背后的逻辑其实很值得关注:用AI来“翻译”视觉信息,把周围的世界变得可听、可感。这个方向其实并不算新鲜,但能做到像Seeing Dogs这样把场景描述、物体识别、街道标志读取甚至菜单导航
今天我们来聊一聊名为Cargoship的产品。它的核心功能其实非常直接——为开发者提供经过预训练的AI模型,只需通过API调用即可使用。关键在于,你完全无需掌握机器学习知识,甚至不必了解模型背后的训练细节。这个工具能够直接帮助你跨越技术门槛。 目标用户群体 Cargoship精准定位了这样一类用户:
想象一下,有一个人工智能助手,它不仅能记住您上次聊到的内容,还能根据您的习惯和情绪,给出真正贴合需求的支持。不再是冷冰冰的机器人,而是像一位随时在线的朋友,用自然的语音陪伴您聊天,甚至能“读懂”您发送的图片和视频。这款Personal Voice and Vision Assistant(个人语音视
- 日榜
- 周榜
- 月榜
热点快看
