22岁开发者开源Mythos架构解析MoE与注意力机制设计

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

22岁开发者开源Mythos架构解析MoE与注意力机制设计

热心网友时间：2026-05-19

转载

传闻中因风险过高而被封存的Mythos模型，如今竟以开源形式“重生”。一个名为OpenMythos的项目，正尝试整合当前公开的研究成果与业界对Claude Mythos架构的主流推测，致力于复现这一传说中的模型。

其核心架构是一个集成了MoE路由机制的循环深度Transformer。简而言之，该设计让同一组模型权重在推理过程中循环工作，但每次循环会通过路由机制激活不同的“专家”路径，并在一个内部的潜在空间内完成所有迭代计算，从而实现更深层次的推理。

已有研究表明，这种创新的模型架构仅需传统模型一半的参数量，即可达到同等的性能表现。

不堆参数，堆循环

将这些技术拼图整合起来的是22岁的Kye Gomez，他同时也是Swarms智能体框架的创始人。

他所设计的这套循环深度Transformer架构，其精髓主要体现在以下三个方面：

允许同一组模型权重最多循环执行16次；
每次循环会激活不同的专家路径；
整个推理过程在潜在空间内闭环完成，不对外输出任何中间结果。

这三者协同作用，其核心思想可以概括为一句话：让模型对一个问题进行“多轮深度思考”，远比单纯地堆叠更多参数要高效。

过去两年，行业的普遍做法是堆叠上百层不同的Transformer层，每层学习不同的特征，导致模型参数量爆炸式增长。而循环深度Transformer则反其道而行，它仅使用少数几层，但允许这些层反复循环运行（最高可达16次），每一轮的思考都建立在前一轮结果的基础上，不断深化。

你可能会疑惑：让同一组权重运行16遍，这不是在浪费计算资源吗？

关键在于，每次循环所激活的“专家”是不同的。循环块内部采用了混合专家层，MoE路由器在每一轮中都会动态选择激活不同的专家子集。这套MoE设计借鉴了DeepSeek-MoE的思路：使用大量细粒度的路由专家，并配合少量始终处于激活状态的共享专家。

Gomez对此有一个精妙的比喻：MoE机制提供了领域知识的广度，而循环机制则赋予了推理过程的深度。

具备了广度和深度，还需要确保循环过程的稳定性，避免思维“跑偏”或发散。来自UCSD和Together AI的一篇新论文《Parcae: Scaling Laws For Stable Looped Language Models》提出的LTI稳定循环注入技术，恰好解决了这一关键问题。

实验数据极具说服力：使用7.7亿参数的循环深度Transformer，在多项基准测试上的性能追平了13亿参数的标准Transformer。参数量减少了近一半，效果却保持一致。

最后一块关键技术拼图是“连续潜在空间推理”。这16轮推理全部在模型内部的隐藏状态向量中闭环完成，不生成任何中间的文字标记。直到最后一轮循环结束，模型才一次性输出最终答案。

这与我们熟悉的思维链推理模式截然不同。思维链是“想一步，输出一步，再基于输出想下一步”，中间过程完全暴露。而循环深度Transformer则是“在内部潜在空间中反复琢磨16遍，然后才给出最终结论”，整个深度推理过程完全内化。

循环，不是重复

为了验证这种架构的有效性，Kye还引用了俄亥俄州立大学的一篇相关论文，其中对循环Transformer架构进行了两个关键实验。

第一个实验关乎系统性泛化能力。面对训练时从未见过的知识组合问题，循环Transformer在推理时依然能够正确回答，而标准Transformer则直接失败。这证明循环机制并非简单的重复计算，而是真正实现了更深层次的信息整合与思考。

第二个实验关乎深度外推能力。在训练时只让模型学习20步的推理链，但在测试时直接给出需要30步推理的复杂问题。循环Transformer的应对策略很直接：在推理时自动增加内部循环轮数。而标准Transformer面对这种超出训练范围的题目，性能则大幅下降。

这些实验结果指向一个重要结论：当前的大型语言模型在预训练中已经记忆了海量事实知识，真正的瓶颈在于知识的灵活组合与复杂运用。模型往往难以将已知的分散事实有效地串联起来，以解答一个新颖的复合型问题。而循环推理机制，似乎为模型免费解锁了这种组合推理与深度思考的能力。

如果这些发现被广泛证实，那么AI模型扩展的主流方向，可能会从“训练参数量更大的模型”逐渐转向“让现有模型在推理时进行更多轮、更深度的思考”。

至此，Anthropic的Mythos模型是否真的采用了这套具体架构，似乎已不那么重要。关于循环Transformer的潜力与猜想，已经吸引了学术界和工业界的广泛关注。更多的理论验证与实验探索，想必已在路上。

该项目代码已在GitHub平台开源。

参考链接：[1] [2] [3]

来源:https://www.163.com/dy/article/KQVJ5H5P0511DSSR.html

上一篇： Anthropic编程大师课教你正确掌握Vibe Coding技巧

下一篇： AI替代员工是经济骗局吗拆解自动化背后的真实成本

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

明末渊虚之羽望山村女眷支线任务攻略

原神哥伦比娅配队思路与阵容搭配推荐

火焰审判手游职业解析指南与选择推荐

天羽传奇职业选择指南与全职业介绍

白金撒花成就解锁攻略与获取方法详解

中世纪建筑结构稳定性解析与建造技巧

童话师墙后装饰摆放技巧与布置方法

造梦西游4手游邮件系统使用与查看方法

三角洲行动怦然心动效果调整方法详解

王者荣耀世界共鸣系统玩法详解与实战技巧

洛克王国星之路位置与前往方法详解

洛克王国龙须小径位置与前往路线详解

洛克王国家园解锁方法详细步骤指南

洛克王国水晶神殿进入方法及问题解决

洛克王国吹笛子动作使用教程

我的世界基岩版自定义NPC制作与召唤指令教程

洛克王国雷电迷踪活动地图位置详解

光与影远征队布料获取与衣物制作材料教程

洛克王国钓鱼馆位置与前往路线详解

像素火影网页版正版免费入口官方在线畅玩地址

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

2026防线出击阵容天梯榜最强阵容搭配推荐发布于 2026-05-19

无尽花界手游破解版下载内置菜单功能免费获取发布于 2026-05-19

无尽花界平民最强阵容搭配推荐十套百搭组合发布于 2026-05-19

花园世界破解版无限元宝下载内购免费版发布于 2026-05-19

英雄联盟手游辛德拉技能连招与对线技巧详解发布于 2026-05-19

英雄联盟手游5.0版本新皮肤全览与获取攻略发布于 2026-05-19

耀西与神秘之书游戏深度评测与体验分享发布于 2026-05-19

彩世界角色强度排行榜最新节奏榜发布于 2026-05-19

哀鸿城破十日记全关卡图文攻略与通关技巧发布于 2026-05-19

赛博朋克游戏REPLACED发售支持免费试玩体验发布于 2026-05-19

洗衣店模拟器修改器下载风灵月影最新版使用教程发布于 2026-05-19

洛克王国世界酷拉位置与捕捉攻略详解发布于 2026-05-19

哈迪斯地狱之战修改器2026最新版下载与使用教程发布于 2026-05-19

Roblox PS5版正式上线免费沙盒游戏登陆主机平台发布于 2026-05-19

守望先锋第二赛季登陆Switch2平台现已正式推出发布于 2026-05-19

三角洲行动4月16日密码门摩斯电码今日最新分享发布于 2026-05-19

Windows批量修改文件创建与修改时间属性强制更改教程发布于 2026-05-19

Windows 11彻底关闭建议内容和设置页面广告教程发布于 2026-05-19

Ansible AWX安装配置教程 Linux自动化运维平台搭建指南发布于 2026-05-19

Win11查看内存双通道运行状态与效率检测指南发布于 2026-05-19

Linux系统位数查询方法快速判断32位或64位发布于 2026-05-19

麒麟系统开启高性能模式教程提升运行速度与流畅度发布于 2026-05-19

Mac磁盘工具无法修复错误的解决方法与维护指南发布于 2026-05-19

Linux SSH长连接配置教程解决远程频繁掉线问题发布于 2026-05-19

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

22岁开发者开源Mythos架构解析MoE与注意力机制设计

不堆参数，堆循环

循环，不是重复

可灵AI制作陶艺拉坯动画教程：从零到一的详细步骤

CodeBuddy代码重构实战指南：方法与步骤详解

优化Figma大文件加载慢问题：清理隐藏图层释放内存

SSH密钥配置与访问权限安全设置最佳实践

车企集体布局机器人技术如何推动汽车工业智能化变革