当前位置: 首页
AI
OpenMythos开源:基于PyTorch复现Claude深度推理架构

OpenMythos开源:基于PyTorch复现Claude深度推理架构

热心网友 时间:2026-05-18
转载

关于Anthropic那个神秘的Claude Mythos,业内一直有各种传闻。它在复杂推理和系统性泛化上的表现据说相当惊人,但始终闭源,让人只能猜测其内部机制。现在,情况有了新变化。

一个名为OpenMythos的项目刚刚出现,它从第一性原理出发,用PyTorch完整实现了一套对Claude Mythos架构的大胆理论重建。这并非简单的复制,而是基于近期循环变换器相关论文的一次深度探索,试图揭开那个“神话级”模型的面纱。

Claude Mythos 到底是什么?核心猜想:循环深度变换器(RDT)

要理解OpenMythos的假设,得先看看传统Transformer的局限。通常,想增加模型深度,就得堆叠更多层。但OpenMythos提出了一个完全不同的思路:Claude Mythos很可能是一种循环深度变换器。

它的核心想法很巧妙——让同一个Transformer块在单次前向传播中循环执行多次,权重完全共享。这样一来,就能用更少的参数,撬动更深的推理深度。具体来看,这个架构可以分为三个清晰的阶段:

前奏(Prelude):这是一个标准的Transformer层,只运行一次,负责对输入进行初始处理,打好基础。

循环块(Recurrent Block):这里是架构的心脏。同一个块会反复循环执行。为了防止循环过程中信息衰减或崩溃,每次循环都会通过一种稳定的线性时不变输入注入机制,将原始输入重新融合到隐藏状态中。这个块内部还有更多设计:前馈网络采用了混合专家模式,每次只激活稀疏的top-K专家,同时保留少量共享专家。关键在于,不同的循环深度会路由到不同的专家子集,这让每一次“思考”迭代都具有计算上的独特性,而非简单重复。注意力机制则默认采用类似DeepSeek-V2的多潜在注意力,通过低秩键值缓存,据说能大幅降低内存占用。

结尾(Coda):最后一个标准层,只运行一次,负责输出最终结果。

此外,项目还引入了多项旨在提升稳定性的机制,比如自适应计算时间,让模型自己动态决定何时停止循环;以及深度方向的LoRA适配器,为不同迭代提供额外的表达能力,又不显著增加参数总量。

为什么这可能碘伏现有 scaling law?

传统模型的扩展,主要围绕着增加参数数量和训练数据量。但OpenMythos所探索的路径,引入了一个新的维度:推理时的循环深度。根据相关论文和实验,一个仅拥有7.7亿参数的循环模型,在相同数据条件下,性能可以媲美13亿参数的标准模型。这意味着,推理深度本身成了一种可以动态调节的计算资源——模型在训练时可能只学习了20跳的推理,但在实际应用时,将循环增加到30跳依然有效。

Image

这与目前常见的思维链技术有本质区别。所有的推理过程都在连续的潜在空间中完成,不产生中间的文字标记,这有可能带来更好的系统性泛化和组合推理能力。简而言之,参数复用加上循环思考,可能等于更高效的深度推理。这或许也能解释,为什么Claude Mythos在应对硬核问题时,会给人“特别强”的直观感受。

OpenMythos 项目亮点

这个开源项目提供了一套完整且可配置的PyTorch实现,包含了混合专家、前馈网络、注意力等核心模块。它不仅提供了清晰的架构图和代码示例,还包含了用于研究的训练基线,强调可复现性,极大方便了社区对循环动态、缩放规律以及推理时深度调整进行实验和探索。

这对 AI 未来意味着什么?

尽管OpenMythos是基于理论的重建,并非Anthropic的最新机密,但它确实将“循环推理”这个前沿方向推到了舞台中央。它暗示了一种未来:模型的扩展可能不再仅仅比拼参数规模,而是比拼“如何更聪明地思考”——即在推理阶段动态、灵活地增加计算深度,而非一味地增大静态参数。

对于不同角色的从业者而言,这都意味着新的机会:AI研究者可以直接使用代码,验证循环结构与堆叠层结构的效果差异;开发者可以尝试将类似机制集成到自己的项目中,观察其在长链推理、复杂规划等任务上的提升;而对于广大AI爱好者来说,这无疑是见证开源社区快速迭代、挑战前沿的又一个生动案例。

当然,这一切都处于早期探索阶段。训练稳定性、梯度传播等工程挑战,仍需社区共同努力去攻克。但正如项目发起者所言,这是一项开放的研究努力,欢迎所有人的参与和贡献。

循环深度会成为下一代大模型的核心趋势吗?还是只是一个美好的理论猜想?这个问题,或许需要更多实践来回答。

来源:https://www.51cto.com/article/841103.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
特斯拉德州工厂部署14辆无方向盘自动驾驶出租车

特斯拉德州工厂部署14辆无方向盘自动驾驶出租车

特斯拉的机器人出租车,终于从概念驶入了现实。就在最近,其位于德州的超级工厂完成了首批14辆无方向盘Cybercab的部署。这可不是简单的测试车,而是标志着特斯拉酝酿已久的Robotaxi战略,正式迈入了规模化验证的关键一步。 仔细观察这批车辆,你会发现它们与去年10月“We Robot”活动上亮相的

时间:2026-05-18 22:40
魏牌V9X搭载归元S平台引领AI豪华出行新时代

魏牌V9X搭载归元S平台引领AI豪华出行新时代

4月17日,一场以“契约”为核心的技术盛宴在保定拉开帷幕。魏牌归元S技术发布会暨V9X预售发布会,不仅揭开了长城汽车36年造车智慧的集大成之作——归元S平台,也宣告了其首款旗舰车型魏牌V9X以37 18万元起的预售价,正式开启全球征程。这个平台,与其说是一套技术方案,不如说是一次以“用户价值”为锚点

时间:2026-05-18 22:39
DeepSeek估值680亿融资20亿 梁文锋首次回应

DeepSeek估值680亿融资20亿 梁文锋首次回应

本周五,人工智能行业迎来一则关键动态。 据The Information、路透社等多家权威媒体援引知情人士消息,中国AI明星企业深度求索(DeepSeek)正与投资方展开洽谈,计划以约100亿美元估值进行新一轮融资,目标筹集至少3亿美元资金。 从行业渠道获悉,DeepSeek接触投资机构的情况属实,

时间:2026-05-18 22:38
WorkBuddy Tabbit OpenCLI 三角协同高效使用指南

WorkBuddy Tabbit OpenCLI 三角协同高效使用指南

做AI工具调研时,有个现象挺有意思:网上文章要么说Tabbit是OpenClaw的最佳搭档,要么夸OpenCLI是新一代浏览器自动化神器,但很少有人把这三者放在一起讨论。 今天要聊的,正是WorkBuddy、Tabbit和OpenCLI这三者如何协同工作,形成一个高效的闭环。 一、为什么需要三角协同

时间:2026-05-18 22:37
Mythos推动AI进入行动时代从语言理解迈向动手操作

Mythos推动AI进入行动时代从语言理解迈向动手操作

4月8日,Anthropic的一则官宣,在看似平静的AI湖面上投下了一颗深水冲击波。他们发布了Claude Mythos Preview,但紧接着,又以一种近乎“自我封印”的姿态,亲手为这颗冲击波套上了层层枷锁。 这完全不像一场常规的发布会。没有庆祝,没有香槟,也没有宣布全面开放。相反,Anthro

时间:2026-05-18 22:37
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程