数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

DeepSeek开源的Engram：仅3%推理损失实现方法解析

DeepSeek开源的Engram：仅3%推理损失实现方法解析

热心网友时间：2026-01-13

转载

上新mHC之后，DeepSeek再出大招。1月13日凌晨，DeepSeek在GitHub开源了名为Engram的模块，并同时发布了与北京大学联合撰写的论文Conditional Memory via

继不久前发布突破性的mHC架构后，DeepSeek再次释放重磅更新。

1月13日凌晨，DeepSeek在GitHub开源了名为“记忆编码（Engram）”的模块组件。同期，他们与北京大学联合发表了论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》，系统阐述了一种新的大模型稀疏化路径：条件存储。

图片来源：GitHub

这篇论文共有十四位作者，DeepSeek创始人兼CEO梁文锋的署名列于最后。值得注意的是，就在1月初，DeepSeek发布的关于mHC架构的论文同样引发了广泛关注，梁文锋的署名也以同样的方式呈现。

这两项研究清晰地体现了DeepSeek长期坚持的技术路线：致力于打破算力成本对模型发展的硬约束，通过底层架构与算法理论的协同创新，探索更具性价比的发展道路。

如果说此前的mHC是提出一种全新的底层计算架构，那么“条件存储”就更像是架构层面的职责重构与分工优化。

根据论文描述，Engram被设计成一个可微分、可训练、并能原生嵌入模型结构的组件。它的核心思路是将那些需要记忆的负载从主干计算中剥离出来，从而避免低效的重复计算。通过一个高速检索模块，模型能够直接调用那些稳定存在且高频出现的知识。

具体来说，Engram首先提供确定性检索。模型基于当前输入及前文形成的特定文本片段，通过哈希映射，直接从一个超大规模静态嵌入表中取出对应的向量表示。这个过程无需依赖复杂的神经网络计算，因此速度更快、路径也更稳定。

之后，Engram会通过一个轻量化的门控机制，由当前层的隐藏状态来判断这段记忆是否真正适合当下的语境，有效避免“查到就用”的生硬植入，保证了响应的灵活性。

简单来说，Engram这套机制既能解决输入端“记得住”的问题，也能优化输出端“说人话”的效果。

DeepSeek还指出，实验表明，相关机制在处理日期、专有名词等固定模式的信息时表现高度活跃，而在自由生成和复杂推理场景下则几乎不介入。这样就在强化记忆功能的同时，有效避免了不合时宜的“幻觉”出现。

在整体架构视角下，DeepSeek将大模型的能力拆解成了三个既相互独立、又彼此协作的维度。

首先是决定逻辑与抽象能力的模型深度，这是模型智能的基石。其次是以MoE为代表的“计算稀疏性”，旨在减少每次前向传播的计算负载。而这第三个维度，正是“存储稀疏性”，也就是Engram所引入的条件记忆。

以往，大模型厂商在开发记忆模块时，往往会担心影响模型主干的计算效率和推理性能。

根据论文，DeepSeek通过U型扩展定律解决了这一平衡问题。在总参数量和算力预算固定的前提下，研究团队系统性调整了MoE与Engram之间的比例，发现将20%到25%的稀疏参数分配给Engram，能达成最优的性能平衡点。

测试数据显示，即便加载了参数规模高达千亿级别的Engram记忆库，模型推理过程中的性能损失也能控制在3%以内。

另据知情人士透露，DeepSeek预计将在今年中国春节前后发布其最新的V4模型。此次的核心突破点主要在于对超长上下文提示词的处理与解析能力，以及对全流程训练中数据模式的理解力的提升。

这意味着，新模型不仅推理性能会大幅提升，在处理复杂任务时将更加得心应手。编程能力也将成为新模型的主打优势之一。内部初步测试结果显示，其表现已经超越了Anthropic当前最强的编程模型Claude。

值得注意的是，Anthropic近期为了守护其在编程能力的优势和入口，已陆续切断Claude Code在第三方平台的接入。1月12日，该公司又放出了Co-work，主打办公场景的自主助手应用落地。该应用能自动帮用户完成制作PPT、整理电子邮件、制订工作计划等各类任务，上手门槛较低。

目前，mHC和Engram在DeepSeek新模型中的具体角色与组合方式尚未完全清晰，但这艘即将到来的旗舰新作，正被市场期待它能再次带来一次“DeepSeek春节冲击波”。

来源:https://www.163.com/dy/article/KJ5SKI8U05118O92.html

上一篇： 2026年上汽大众发布7款新车，冲锋号引领电动转型

下一篇：启辰大V DD-i混动版2026年上市，新动力能否逆袭市场？

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

vivo X Fold6和荣耀折叠屏参数对比：电池续航长焦影像AI办公四个维度谁更全面

vivo X Fold6和荣耀折叠屏参数对比：电池续航长焦影像AI办公四个维度谁更全面

vivo X Fold6和荣耀折叠屏参数对比：电池续航长焦影像AI办公四个维度谁更全面一、两款万元内折叠屏的正面较量据IDC《全球折叠屏手机市场季度跟踪报告（2026年Q1）》，2025年折叠屏市场中7,000-9,000元价位段的增速显著高于万元段，成为折叠屏规模扩张的主力区间。在这个价位段，vi

时间：2026-07-14 17:25

在他人恐惧时保持贪婪 SK海力士DRAM定价与盈利依旧强劲

在他人恐惧时保持贪婪 SK海力士DRAM定价与盈利依旧强劲

最近，半导体与AI基础设施领域的一家顶级研究机构SemiAnalysis发布了一份题为《在他人恐惧时保持贪婪：SK海力士的DRAM定价与盈利依旧强劲》的报告，一下子就把市场的注意力拉回到了SK海力士身上。这份报告的核心结论相当明确：SK海力士在2026年第二季度乃至更远的未来，DRAM业务的盈利能力

时间：2026-07-14 12:45

创业板指重挫超4% 微盘股逆势涨2.5%

创业板指重挫超4% 微盘股逆势涨2.5%

7月10日尾盘，A股极端分化：创业板指与科创50均跌超4%，深成指跌逾2%，沪指跌0 8%，而微盘股逆势大涨2 5%，风格分化显著，市场避险情绪升温。

时间：2026-07-14 12:45

试驾体验对购车决策的影响动力操控舒适成关键

试驾体验对购车决策的影响动力操控舒适成关键

试驾体验直接影响购车决策，动力响应、操控精准度、座椅舒适性及NVH表现等细节决定长期用车幸福感。不同试驾感受对动力焦虑、驾驶信心和日常心情有显著差异，全面模拟真实场景的试驾有助于选到称心车辆。

时间：2026-07-14 12:45

比亚迪全球首个1700万辆新能源汽车下线里程碑

比亚迪全球首个1700万辆新能源汽车下线里程碑

比亚迪成为全球首家新能源汽车累计下线突破1700万辆的车企，第1700万辆车型为海豹08。这一里程碑得益于技术攻坚、产品矩阵完善及海外市场渗透，从刀片电池到DM-i等系统化技术为规模化铺路，展现产业链掌控力与迭代速度。

时间：2026-07-14 12:44

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门数据榜

面壁智能CTO谈端侧AI：从打字机到大模型的进化突围

印度IT巨头HCL Tech投350亿卢比建50MW AI数据中心

小米具身智能机器人新工站双侧螺母上件成功率达98%

DeepSeek梁文锋身价360亿美元成AI新首富

DeepSeek获74亿美元融资，梁文锋身家涨至360亿

AI短剧角色共用同一张脸的原因深度解析

软银与Sierra在日本推AI客服满意度升至93%

高德发布通用世界模型工坊ABot-World Studio 实时交互AI数字世界

LibTV Agent专业视频创作智能体

定制化语言学习工作簿PDF

面壁智能CTO谈端侧AI：从打字机到大模型的进化突围

印度IT巨头HCL Tech投350亿卢比建50MW AI数据中心

小米具身智能机器人新工站双侧螺母上件成功率达98%

DeepSeek梁文锋身价360亿美元成AI新首富

DeepSeek获74亿美元融资，梁文锋身家涨至360亿

AI短剧角色共用同一张脸的原因深度解析

软银与Sierra在日本推AI客服满意度升至93%

高德发布通用世界模型工坊ABot-World Studio 实时交互AI数字世界

LibTV Agent专业视频创作智能体

定制化语言学习工作簿PDF

面壁智能CTO谈端侧AI：从打字机到大模型的进化突围

印度IT巨头HCL Tech投350亿卢比建50MW AI数据中心

小米具身智能机器人新工站双侧螺母上件成功率达98%

DeepSeek梁文锋身价360亿美元成AI新首富

DeepSeek获74亿美元融资，梁文锋身家涨至360亿

AI短剧角色共用同一张脸的原因深度解析

软银与Sierra在日本推AI客服满意度升至93%

高德发布通用世界模型工坊ABot-World Studio 实时交互AI数字世界

LibTV Agent专业视频创作智能体

定制化语言学习工作簿PDF

相关攻略

相关攻略

vivo X Fold6和荣耀折叠屏参数对比：电池续航长焦影像AI办公四个维度谁更全面

2026-07-14 17:25

vivo X Fold6和荣耀折叠屏参数对比：电池续航长焦影像AI办公四个维度谁更全面

在他人恐惧时保持贪婪 SK海力士DRAM定价与盈利依旧强劲

2026-07-14 12:45

在他人恐惧时保持贪婪 SK海力士DRAM定价与盈利依旧强劲

创业板指重挫超4% 微盘股逆势涨2.5%

2026-07-14 12:45

创业板指重挫超4% 微盘股逆势涨2.5%

试驾体验对购车决策的影响动力操控舒适成关键

2026-07-14 12:45

试驾体验对购车决策的影响动力操控舒适成关键

比亚迪全球首个1700万辆新能源汽车下线里程碑

2026-07-14 12:44

比亚迪全球首个1700万辆新能源汽车下线里程碑

荣耀MagicOS 11爆料：YOYO Claw支持自定义AI大模型，安卓阵营最果液态玻璃UI

2026-07-14 12:44

荣耀MagicOS 11爆料：YOYO Claw支持自定义AI大模型，安卓阵营最果液态玻璃UI

微软CEO纳德拉警告：企业花钱用的AI可能变成竞争对手

2026-07-14 12:44

微软CEO纳德拉警告：企业花钱用的AI可能变成竞争对手

明诺高端插混商务车入局，能否在激烈竞争中突围

2026-07-14 12:44

明诺高端插混商务车入局，能否在激烈竞争中突围

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

太吾绘卷天幕心帷隐藏技巧全攻略

太吾绘卷天幕心帷隐藏技巧全攻略发布于 2026-07-14

全民萌兽激活码在哪领取

全民萌兽激活码在哪领取发布于 2026-07-14

遗忘之海金果子获取方法与实用技巧

遗忘之海金果子获取方法与实用技巧发布于 2026-07-14

贝塞斯达工会抗议Xbox裁员团结争取员工权益

贝塞斯达工会抗议Xbox裁员团结争取员工权益发布于 2026-07-14

早期升星西游卡牌手游大全 2026高人气西游手游推荐

早期升星西游卡牌手游大全 2026高人气西游手游推荐发布于 2026-07-14

幻兽帕鲁1.0正式版Steam同时在线人数突破85万大量玩家回归

幻兽帕鲁1.0正式版Steam同时在线人数突破85万大量玩家回归发布于 2026-07-14

PS6散热系统确认弃用液金采用全新设计

PS6散热系统确认弃用液金采用全新设计发布于 2026-07-14

火焰纹章万缕千丝素材复用引发玩家吐槽

火焰纹章万缕千丝素材复用引发玩家吐槽发布于 2026-07-14

麒麟系统网络唤醒功能设置方法

麒麟系统网络唤醒功能设置方法发布于 2026-07-14

Mac菜单栏如何查看当前网桥连接的详细步骤

Mac菜单栏如何查看当前网桥连接的详细步骤发布于 2026-07-14

电脑开机Missing operating system黑屏修复步骤

电脑开机Missing operating system黑屏修复步骤发布于 2026-07-14

Mac电脑屏幕缩放比例设置教程

Mac电脑屏幕缩放比例设置教程发布于 2026-07-14

AI写作润色助手手机支持哪些语言？

AI写作润色助手手机支持哪些语言？发布于 2026-07-14

AI写作润色助手手机需要联网吗？

AI写作润色助手手机需要联网吗？发布于 2026-07-14

AI写作润色助手手机支持语音输入吗？

AI写作润色助手手机支持语音输入吗？发布于 2026-07-14

AI写作润色助手手机兼容iOS吗？

AI写作润色助手手机兼容iOS吗？发布于 2026-07-14

热门话题

AI写作工具推荐_AI写作教程_论文文案内容创作指南

AI写作工具推荐_AI写作教程_论文文案内容创作指南

AI音乐生成教程_AI作曲工具推荐_歌曲创作实用指南

AI音乐生成教程_AI作曲工具推荐_歌曲创作实用指南

AI搜索工具推荐_AI搜索使用技巧_智能搜索引擎指南

AI搜索工具推荐_AI搜索使用技巧_智能搜索引擎指南

AI PPT制作教程_AI生成PPT工具推荐_演示文稿效率指南

AI PPT制作教程_AI生成PPT工具推荐_演示文稿效率指南

AI语音克隆教程_声音克隆工具推荐_语音合成实用指南

AI语音克隆教程_声音克隆工具推荐_语音合成实用指南

文生视频工具推荐_AI视频生成教程_提示词与剪辑指南

文生视频工具推荐_AI视频生成教程_提示词与剪辑指南

AI编程工具推荐_AI代码生成教程_程序员智能开发指南

AI编程工具推荐_AI代码生成教程_程序员智能开发指南

AI数字人制作教程_数字人生成工具推荐_虚拟主播应用指南

AI数字人制作教程_数字人生成工具推荐_虚拟主播应用指南

AI图片生成工具推荐_AI绘图教程_文生图模型使用指南

AI图片生成工具推荐_AI绘图教程_文生图模型使用指南