数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI

代码泄露曝DeepSeek下一代“王炸”模型架构细节

代码泄露曝DeepSeek下一代“王炸”模型架构细节

热心网友时间：2026-01-21

转载

智东西
作者江宇
编辑冰倩

智东西1月21日报道，DeepSeek-R1发布一周年之际，来自DeepSeek的神秘新模型“MODEL1”悄然现身GitHub代码库。

多位社区开发者推测，MODEL1很可能正是DeepSeek内测中的V3终极版本（V4模型），也有人猜测它可能代表一个完全独立于V系列的新模型。

▲海外开发者在X平台讨论MODEL1身份

近日，DeepSeek向其核心推理内核FlashMLA推送了一系列更新，而在这些提交中，一个此前从未公开亮相的模型命名引发了社区的高度关注——MODEL1。

▲DeepSeek代码库出现MODEL1相关（图源：X）

这一名称不仅出现在SM90架构相关的.cu内核实例化文件中，还贯穿在多个针对FP8稀疏解码路径的模板定义与内存布局注释里。

更关键的是，据海外开发者推测，MODEL1的背后将是一整套新的推理机制、算子结构与底层内存配置，会与DeepSeek现有V3.2模型呈现出完全不同的技术路径。

在相关代码文件中可以看到，MODEL1被用于核心解码函数的多个实例中，显式适配了头维度为64和128的场景，并专门部署在SM90和SM100架构上。

▲DeepSeek FlashMLA源码截图（图源：GItHub）

代码中多处调用了“ModelType::MODEL1”，与其对应的还有一套独立的持久化内核。这些文件与V32版本的持久化内核文件并行存在，这显示出DeepSeek或许已为该模型设计了与V3系列完全不同的编译路径与执行逻辑。

▲DeepSeek FlashMLA源码文件树（图源：GItHub）

更值得注意的是，在代码中，有一条特别注释写道：对于F3架构（即SM90平台）下的MODEL1模型，其KV缓存的内存stride必须是576B的整数倍。

▲海外网友推文截图（目前该条注释已于代码库内删除）

这一配置区别于V3.2的656B，暗示着MODEL1对底层内存对齐和调度有更为严格的要求，可能与其更复杂的运行时行为与动态缓存机制有关。

一位海外网友也对这部分代码进行了深入解读，他认为，MODEL1在整体结构上展现出更强的实验性特征，支持动态Top-K稀疏推理逻辑，还引入了额外的KV缓存区。

▲海外开发者的分析（图源：X）

前者通过引入一个可变的topk_length指针，允许模型在推理时根据token或请求动态决定参与计算的key数量，提升了计算资源的精细调度能力；后者则通过extra_kv缓冲区，提供了将系统提示与用户上下文分离存储的可能，为Agent架构或多段上下文场景提供支持。

据社区开发者分析，MODEL1在同步逻辑与边界控制上可能比V3.2更加复杂。其中RoPE与NoPE维度在双GEMM运算中耦合更紧，可能意味着其在位置编码与张量路径调度上做出了显著调整。

分析还提到，MODEL1引入了运行时边界检查机制，旨在规避动态Top-K推理中潜在的非法内存访问。

此外，尽管最新注释中标明MODEL1的stride应为576B，但据社区开发者基于代码结构估算，其实际内存分配逻辑可能接近584B。这种细微差异被认为反映出该分支仍处于调试或快速迭代阶段。

在更早的1月9日，外媒援引知情人士称，DeepSeek将于2月中旬，也就是春节前后发布其下一代模型，主打编程能力，并在内部测试中已经在多个基准上超越了Claude与GPT系列。

结合目前模型文件结构已覆盖64和128两个头维度、FP8稀疏解码路径已完成适配、内存规范已强制定义等迹象来看，MODEL1很可能已接近训练完成或推理部署阶段，正等待最终的权重冻结和测试验证。

在海外社交平台上，不少用户对MODEL1的曝光反应热烈。一位用户调侃道：“我已经能听见‘新模型将带来99.97%成本下降’了。”

而另一位开发者则认为，如果DeepSeek再次开放权重，势必将对闭源巨头形成压力，推动前沿模型进一步走向开放。

恰逢DeepSeek R1发布一周年，Hugging Face最新博客也发布了特别文章《One Year Since the “DeepSeek Moment”》，系统回顾了过去一年中国开源社区的集体爆发，明确提及DeepSeek的开源策略已从一次事件演化为生态策略。

▲Hugging Face最新博客：One Year Since the “DeepSeek Moment”

文章称，R1模型的开源不仅降低了推理技术、生产部署与心理三个门槛，更推动了国内公司在开源方向上形成非协同但高度一致的战略走向。

从百度、字节跳动到月之暗面、智谱AI，各大机构在过去一年中陆续加入Hugging Face并发布高质量模型，在社区下载、点赞与引用榜单上频频登顶。

与此同时，越来越多西方开源模型的底座也开始使用DeepSeek系列做微调，DeepSeek-V3更是成为Cogito v2.1等海外模型的底层基座。

结语：一年之后，DeepSeek再次站在开源演进的起点

如今，距离R1发布仅一年，DeepSeek的“MODEL1”很有可能在系统架构、执行路径与推理机制上展现出全面超越V3.2的能力。

如果接下来如传闻所述在春节前后正式发布，DeepSeek或许将再次改写国内开源格局，也可能为全球前沿开源模型树立新的标杆。

来源:https://www.163.com/dy/article/KJQ3GS95051180F7.html

上一篇：探索Node.js之父预言：人类手写代码时代的终结

下一篇：本田飞度上市疯抢，50万平民超跑购车竟需加价？

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

2026北京车展荣威家越07概念车首发 AI赋能家庭出行新方案

2026北京车展荣威家越07概念车首发 AI赋能家庭出行新方案

在2026北京国际汽车展览会上，上汽荣威正式发布了其全新“家越”序列的首款概念车型——家越07。作为一款定位大五座的智能SUV，它精准聚焦于AI技术深度赋能的家庭出行场景，通过创新的设计语言与深度融合的智能科技，旨在重新定义家用汽车的功能边界与体验标准。根据官方规划，家越07的量产版本将于今年6月正

时间：2026-05-18 16:32

吉利银河M9黑金智曜版上市豪华智能大六座SUV驾控体验升级

吉利银河M9黑金智曜版上市豪华智能大六座SUV驾控体验升级

吉利银河旗下备受瞩目的AI科技大六座旗舰SUV——银河M9黑金智曜版，现已正式上市。新车官方指导价为26 98万元，并推出限时先享价25 98万元，同时附赠价值丰厚的购车权益。作为现款银河M9的进阶版本，这款新车在豪华设计、智能驾驶与驾控性能三大核心维度实现了显著升级，其目标清晰：旨在进一步夯实其在

时间：2026-05-18 16:32

淘宝天猫上线AI假图识别模型维护商家权益

淘宝天猫上线AI假图识别模型维护商家权益

在电商行业竞争日益激烈的今天，买卖双方的权益平衡始终是平台治理的核心。然而，近年来出现了一种新型的不当牟利手段，令众多商家倍感困扰——部分消费者利用人工智能（AI）技术生成的虚假图片作为所谓“证据”，在申请售后时提出“仅退款”而拒绝退货，企图空手套白狼，导致商家遭受不必要的经济损失。面对这种利用高

时间：2026-05-18 16:32

Canva可画免费在线设计工具使用指南

Canva可画免费在线设计工具使用指南

不少朋友都在问，Canva可画这个在线设计工具的免费体验入口到底在哪？其实，它的官方地址一直很稳定。下面，我们就来全面梳理一下这个平台的核心功能与使用体验。模板资源：覆盖全面，深度优化首先，它的模板库确实够广。从节日庆典、职场办公到教育课件、社交媒体和电商海报，数十个主题场景下还有上百个细分方向

时间：2026-05-18 16:32

视觉生成模型对齐新方法TGO无需偏好对仅用标量反馈

视觉生成模型对齐新方法TGO无需偏好对仅用标量反馈

新加坡国立大学团队提出TGO方法，无需依赖成对偏好数据，可直接利用单个样本的标量评分优化视觉生成模型。该方法通过估计分数阈值划分伪正负例，并依分数距离加权训练，在图像与视频生成任务中有效提升性能，为利用真实场景标量反馈提供了新途径。

时间：2026-05-18 16:32

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

永劫无间账号购买平台推荐与安全交易指南

梦幻魔法公主善恶值系统解析与调整方法指南

茶叶蛋的冒险第14关荡秋千怎么过图文通关攻略详解

无畏契约源能行动一局游戏需要多长时间

茶叶蛋大冒险第16关怎么过相对运动图文通关攻略

蓝色星原旅谣角色强度榜与技能实战解析

蔚蓝星球零氪微氪新手攻略 20条技巧助你开局避坑

茶叶蛋大冒险第18关通关攻略图文详解隐藏关卡怎么过

文字三国志游戏评测与新手玩法指南

茶叶蛋神秘之旅第28关怎么过遵守规则通关图文攻略

NS版饿殍明末千里行今日发售全流程攻略与剧情解析

洛克王国倒影暗域地图位置与进入方法详解

洛克王国奇丽花性格选择攻略与对战搭配指南

洛克王国铁居小堡技能组合与实战搭配攻略

洛克王国水晶地穴位置与进入方法详解

洛克王国月光桃源进入条件与VIP权限详解

DNF千海天版本光枪毕业装备搭配指南

DNF千海天版本驱魔师最强毕业装备搭配指南

植物大战僵尸网页版2026最新官方入口地址与登录指南

DNF千海天混沌魔灵毕业装备搭配攻略

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

和平精英游戏贴膜位置与技巧详解

和平精英游戏贴膜位置与技巧详解发布于 2026-05-18

灵妖劫PVP对战技巧与阵容搭配攻略

灵妖劫PVP对战技巧与阵容搭配攻略发布于 2026-05-18

异环都市系统玩法攻略：新手入门与进阶技巧详解

异环都市系统玩法攻略：新手入门与进阶技巧详解发布于 2026-05-18

沐瞳全球设计大赛启动行业顶尖专家阵容助阵

沐瞳全球设计大赛启动行业顶尖专家阵容助阵发布于 2026-05-18

每日挑战棒找出21个常用字图文攻略与通关技巧

每日挑战棒找出21个常用字图文攻略与通关技巧发布于 2026-05-18

敢达古辛深度重锻型机体解析与实战攻略

敢达古辛深度重锻型机体解析与实战攻略发布于 2026-05-18

地平线6B级腕带赛车辆推荐与调校指南

地平线6B级腕带赛车辆推荐与调校指南发布于 2026-05-18

动物餐厅柴郡猫解锁条件与获取方法详解

动物餐厅柴郡猫解锁条件与获取方法详解发布于 2026-05-18

黑神话悟空线下活动古仪新歌面具艺术展详情公布

黑神话悟空线下活动古仪新歌面具艺术展详情公布发布于 2026-05-18

红色沙漠红色守卫之弓获取攻略详细入手方法与位置指南

红色沙漠红色守卫之弓获取攻略详细入手方法与位置指南发布于 2026-05-18

刺客信条黑旗重制版4月24日官宣原版销量超3400万

刺客信条黑旗重制版4月24日官宣原版销量超3400万发布于 2026-05-18

永劫无间手游第二届开振节4月23日正式开启

永劫无间手游第二届开振节4月23日正式开启发布于 2026-05-18

炉石传说2026恶魔猎手卡组搭配推荐与攻略

炉石传说2026恶魔猎手卡组搭配推荐与攻略发布于 2026-05-18

疯狂鸽子第四关通关攻略与技巧详解

疯狂鸽子第四关通关攻略与技巧详解发布于 2026-05-18

傲视传奇开服时间表最新查询与开服公告汇总

傲视传奇开服时间表最新查询与开服公告汇总发布于 2026-05-18

PS5版识质存在戴安娜皮肤变黑皮是纹理加载Bug吗

PS5版识质存在戴安娜皮肤变黑皮是纹理加载Bug吗发布于 2026-05-18

Win11语音搜索本地文件开启教程说话快速查找文档

Win11语音搜索本地文件开启教程说话快速查找文档发布于 2026-05-18

Windows 11 虚拟化技术开启指南轻松运行虚拟机

Windows 11 虚拟化技术开启指南轻松运行虚拟机发布于 2026-05-18

Mac误删文件恢复指南苹果电脑数据找回方法详解

Mac误删文件恢复指南苹果电脑数据找回方法详解发布于 2026-05-18

Mac清理大文件教程：快速查找与释放磁盘空间

Mac清理大文件教程：快速查找与释放磁盘空间发布于 2026-05-18

Linux查看磁盘扇区大小命令详解与blockdev使用指南

Linux查看磁盘扇区大小命令详解与blockdev使用指南发布于 2026-05-18

Linux统计指定后缀文件行数脚本实例详解

Linux统计指定后缀文件行数脚本实例详解发布于 2026-05-18

Mac清理Sketch历史版本释放磁盘空间详细教程

Mac清理Sketch历史版本释放磁盘空间详细教程发布于 2026-05-18

统信UOS关闭开机磁盘自检与跳过扫描方法

统信UOS关闭开机磁盘自检与跳过扫描方法发布于 2026-05-18

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集