数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

GPT-5人工智能或将成为颠覆一切的革命性技术

AI热点日报时间：2026-06-29

热点解读

这是一篇关于 GPT-5 的深度好文，揭开了它背后那些不太寻常的秘密。核心内容： 1 GPT-5 可能带来的碘伏 2 相关实验室的秘密项目 3 Open AI 不发布 GPT-5 的原因传说中，GPT-5 可能会碘伏一切。这条消息最早出自 Alberto Romano 的一篇长篇分析，文

这是一篇关于 GPT-5 的深度好文，揭开了它背后那些不太寻常的秘密。

核心内容：

1. GPT-5 可能带来的碘伏
2. 相关实验室的秘密项目
3. Open AI 不发布 GPT-5 的原因

GPT-5 可能会碘伏一切！

传说中，GPT-5 可能会碘伏一切。

这条消息最早出自 Alberto Romano 的一篇长篇分析，文中详细探讨了 GPT-5 的现状。一些人工智能实验室可能正在进行一些不为人知的秘密项目——而这些信息，可能比你想象的更关键。

Alberto Romano 的核心观点很明确：GPT-5 真的会改变一切。这不是夸大其词。当你钻进细节里，你会发现，这改变是碘伏性的。因为它意味着未来这些模型的发布方式将彻底不同。

文章开头提出了一个大胆的假设：如果我告诉你，GPT-5 是真实存在的，而且它已经在你看不见的地方，塑造着这个世界，你会怎么想？这个假设贯穿始终，也是我们今天要讨论的核心。

文章指出，OpenAI 已经构建了 GPT-5，但他们选择将其保留在内部。因为这样做带来的投资回报率，远高于将其发布给数百万的 ChatGPT 用户。而且，这个投资回报率不是金钱，而是别的东西。想法很简单，但关键在于把各种线索串联起来。文章深入探讨了为什么这一切都说得通。总而言之，核心论点是：OpenAI 已经创造出了 GPT-5，它是一个令人惊叹的模型——真的非常出色。但他们决定不发布它，原因将在后面展开。

提前卖个关子：这个原因相当有意思。先来看看文章中提到的一件事——Anthropic 的 Claude Opus 3.5 的神秘消失。

在深入探讨 GPT-5 之前，我们需要先关注它的“远房表亲”——那个同样失踪的模型。众所周知，三大人工智能实验室——OpenAI、Google DeepMind 和 Anthropic——提供了各种模型，覆盖价格、性能和不同应用场景的需求。OpenAI 有 GPT-4o、GPT-4、GPT-4 Turbo，以及 o1 和 o1 mini；Google DeepMind 有 Gemini Ultra、Pro 和 Flash；Anthropic 则有 Claude Opus、Sonnet 和 Haiku。这么多模型，本质上是为了尽可能满足不同客户的偏好——有的追求极致性能，不在意成本；有的则想要性价比高的解决方案。

现在回到 Opus 3.5 的神秘失踪。2024 年 10 月发生了一件奇怪的事。当时所有人都期待 Anthropic 发布 Claude Opus 3.5 来回应 GPT-4o，然而他们却发布了 Claude Sonnet 3.5 的更新版本。甚至有人开始基于 3.6 版本制作课程，而 Opus 3.5 却不见踪影。记住，这本该是一个类似 GPT-5 级别的模型。它的消失，似乎让 Anthropic 在与 GPT-4 的竞争中失去了最直接的对手。

但仔细研究 Opus 3.5 的情况，会发现一些有趣的地方。此前在 10 月，有帖子提到传言称 Sonnet 3.6 是一个非常出色的模型，但只是备受期待的 Opus 3.5 训练失败后的一个检查点。当时因为一些网页信息，很多人认为 Claude Opus 3.5 已经被取消了——之前他们一直宣称即将到来，后来却从很多页面上删除了发布消息。最近，Anthropic 的首席执行官接受了一次采访。关于 Opus 3.5 的所有信息，稍后都会与 GPT-5 联系起来。

之所以讨论 Opus 3.5，是因为它本应是 GPT-5 级别的竞争对手。接下来探讨的是，Anthropic 如何处理 Opus 3.5 的，以及他们的做法如何同时揭示了 OpenAI 可能采取的策略。在采访中，Dario Amodei 谈到 Opus 3.5 时表示：“没有给出确切日期，但就我们所知，计划仍然是发布 Claude Opus 3.5。” 他的回答谨慎而模棱两可，但也证实了计划仍然存在。

与此同时，有多篇彭博社文章都谈到了 OpenAI、Google 和 Anthropic 在构建更先进人工智能方面面临的挑战。当时正处于从 GPT-4 到 GPT-5 级别模型的过渡期。Gemini 2 令人失望，GPT-5 也令人失望，而 Opus 3.5 虽然表现更好，但提升幅度没达到预期。彭博社在一篇文章中写道：Anthropic 在训练后发现，作为 GPT-5 竞争对手的 Opus 3.5 表现优于旧版本，但提升幅度并没有达到模型规模和成本所预期的程度。Dario 避免给出具体日期的原因，可能就是 Opus 3.5 的训练运行没有失败，但结果不尽如人意。

很多人忽略了一个事实：这些下一代迭代模型，比如 GPT-5、Gemini 2，虽然不错，但唯一的缺点是成本太高，性价比不高。请记住这一点，因为这跟它们没有被发布的原因直接相关。

接下来是一些内部消息或泄露的信息。半导体专家 Dylan Patel 在 12 月 11 日提出了一个疯狂的理论：Anthropic 使用 Claude Opus 3.5 生成合成数据，并进行奖励建模，从而显著改进了 Claude Sonnet 3.5，同时还使用了用户数据。这说法很夸张，但来自一个业内可靠的消息来源——他此前曾透露过一些后来被证实为真的信息。这也是许多人认为 GPT-5 仍然在内部良好运行的关键理论之一。Dario 相信不同的训练运行可以改善结果，因此避免给出具体日期。彭博社证实，结果确实比现有模型更好，但不足以证明推理成本的合理性。

Dylan 和他的团队发现了神秘的 Sonnet 3.6 和失踪的 Opus 3.5 之间的联系——后者被内部用于生成合成数据。这意味着，他们可能拥有一个非常智能的人工智能系统，但还没有向公众发布。公开的版本是 Sonnet 3.6。

接下来更疯狂——文章开始解释模型蒸馏。更好、更小、更便宜——使用一个强大而昂贵的模型来生成数据，从而提高一个性能稍逊的模型的能力，这个过程被称为蒸馏。这是一种常用的范式，并且将继续下去。一个强大的模型就像一位老师，可以把较弱的学生模型从小、便宜、快速但能力弱，变成小、便宜、快速且功能强大。蒸馏把一个强大的模型变成了一个金矿。如果运行 Opus 这样优秀的模型成本太高，为什么不把它的很多能力“训练”到一个也受欢迎的 Sonnet 3.6 模型里呢？这非常有趣。

当然，Anthropic 选择不发布 Opus，并非因为结果不佳，而是因为在内部使用它更有价值——他们基本上用这个人工智能来训练下一代人工智能。Dylan Patel 认为，这就是开源社区能如此迅速地赶上 GPT-4 的原因——他们本质上是从 OpenAI 的思想中“窃取了黄金”。人们将 GPT-4 的能力蒸馏到更小的模型中。这很有趣，因为 GPT-4o 是一个更小的模型，速度更快，性能更好，非常有用。

这也是其他公司正在做的事情。当这些顶级实验室不再强调更高的参数量就意味着更好的性能时，范式已经变了。上次了解的参数量信息是：GPT-3.5 有 1750 亿个参数，而有传言称 GPT-4 在专家混合模型中有 1.8 万亿个参数。但最令人惊讶的是，现在推测像 GPT-4o 和 Sonnet 3.6 这样的未来模型，虽然比这个大模型小得多，但由于蒸馏技术性能更佳——这意味着模型中的知识效率更高，模型也更智能。当前模型，例如最初的 GPT-4o，可能比 GPT-4 小一个数量级。GPT-4o 大约有 2000 亿个参数，Sonnet 3.5 大约有 4000 亿个参数。尽管这个估计可能不准确，但 Anthropic 训练了 Opus 3.5，并把该模型的知识蒸馏到了 Sonnet 3.6 中。

那么 OpenAI 做了什么呢？这就引出了 GPT-5 的传闻。OpenAI 可能拥有一个非常神秘的内部模型，可能是 GPT-5。考虑到最近听到的所有消息，它可能是一个更智能的模型。我们目前使用的这些较小的模型所拥有的信息，很可能都是从那个秘密模型中蒸馏而来的。我们知道 Strawberry 模型也进行过一些蒸馏操作，所以 OpenAI 对蒸馏过程非常熟悉，就像之前的 o1 模型和 o1 preview 模型一样，效率非常高。

当说到“表现不如预期”时，这并不意味着比你之前做的更差，只是没达到预期。想象一下，你期望在一场比赛中赢 1 万美元，但只赢了 1000 美元。虽然比你通常赢的多，但算表现不如预期——这并不意味着没有进步。对于智能而言，每一寸进步都会解锁全新的能力。对这些公司来说，推理成本非常重要——因为有太多人在使用，需要大量服务器，而且需求每周都在持续增长，很难跟上。

这就是为什么蒸馏非常有效的原因。促使 Anthropic 将 Sonnet 3.6 蒸馏到 Opus 3.5 的因素，对 OpenAI 影响更大。文章指出，关于蒸馏，Ilya Sutskever 最近几周也承认了：“我们又回到了蒸馏的道路，我认为 GPT-4o 和 Claude Sonnet 3.5 都是从更大的模型中蒸馏而来的。” 这是一个大家都承认的现实。他们认为，现在达到更高水平模型的方式，不能仅仅投入更多数据，而需要新的创新。而基本事实是：蒸馏可能是实现这一目标的唯一途径。

第一个开辟道路的人必须清理道路。作者先分析了 Anthropic Opus 3.5 的故事，因为掌握了更多关于它的信息，然后通过蒸馏的概念将它与 OpenAI 联系起来，并解释了推动 Anthropic 的潜在力量也在推动 OpenAI。但现在又出现了一个新障碍：训练成本。不仅是推理成本，还包括训练成本——可能在谈论耗资 5 亿美元的训练运行。使用当前硬件进行这样的训练是否可能？答案是肯定的。但这其中最疯狂的是：你将无法对该模型进行推理。基本上，这些公司可能仍然在内部扩展模型，并进行疯狂的训练，但他们能够真正为客户提供经济价值的唯一途径就是蒸馏。

当然，这就是他们不发布完整模型的原因。这非常有趣，因为我们知道这些公司一直在努力解决推理成本问题，因为他们需要进行大量研究等等。但了解幕后真正发生的事情，将会非常有趣——如果他们正在训练一个如此庞大的模型，他们可以用它做很多事情，但他们可能不会发布相关的研究论文。

文章还指出，花费如此巨大的推理成本，对于微软、Google 或亚马逊来说也是难以承受的。如果 OpenAI 假设性地以“尚未准备好”为借口保留 GPT-5，除了控制成本和防止公众强烈反对外，他们还能实现一件事：避免声明该模型是否达到了被归类为 AGI 的门槛。正如我们所知，AI 的监管是一个非常复杂且敏感的问题。

文章接近尾声时开始总结观点。作者认为，即使以上说法都是真的，怀疑论者也不会想到 OpenAI 可能有比外部应用更好的内部“用途”。创建一个优秀的模型，和创建一个可以廉价地服务于 3 亿用户的优秀模型之间存在巨大差异。如果你做不到后者，你就不会去做；但如果你不需要这样做，你也不会去做。现在我们已经拥有了很多可以使用的简单产品，并且可以从中获得相当大的日常价值。他们真的不再需要为我们提供最前沿的技术——仅仅因为他们不再需要把这些技术提供给我们，他们只需要自己使用这些技术，以便开发更好的产品和技术。这就像说，当 OpenAI 开发出自己的内部 AGI 系统时，他们只会自己使用它，以便进行进一步开发。

OpenAI 很可能在内部拥有可用的 GPT-5，就像 Anthropic 拥有 Opus 3.5 一样。但极有可能的是，OpenAI 永远不会向公众发布 GPT-5。现在公众衡量模型性能的标准，不再仅仅是 GPT-4 或 Claude Sonnet 3.5，而是基于 o1 或 o3。随着测试时间的推移，新的缩放定律使得 GPT-5 需要跨越的门槛越来越高。他们如何才能发布一款真正超越 o1 和 o3，以及即将推出的 o 系列模型的 GPT-5 呢？像 GPT-5、GPT-6 这样的新型基础模型，对于 OpenAI 内部来说始终是有意义的，但不一定作为产品发布。这一部分可能已经结束了。

从现在开始，他们唯一的目标是不断为下一代模型生成更好的数据。基础模型可能会在后台运行，使其他模型能够实现它们自身无法完成的壮举，就像一位隐居者从秘密的山洞中传授智慧一样——只是这个山洞是一个巨大的数据中心。OpenAI 和 Anthropic 已经启动了通过人类参与的自我完善运作。他们公开发布什么并不重要，他们将越来越遥遥领先。就像宇宙加速膨胀一样，遥远的星系再也无法到达我们。这可能就是他们如何在短短三个月内从 o1 升到 o3 的原因，以及他们将如何从 o4 跳到 o5 的原因。这可能就是为什么他们在社交媒体上如此兴奋——因为通往日益强大人工智能的道路就在指尖。如果他们打算发布每一个进步供我们使用，那你肯定不会相信他们在说，他们的模型会让他们遥遥领先，以至于没有人能赶上他们。每一代新模型都是一个逃离平流层的逃逸速度引擎。他们已经在挥手告别了——随着每一次创造新模型，追赶 OpenAI 将变得越来越困难。

创新者来了。问题是我们不知道他们是如何做到的。还没有真正看到有人反驳这种说法。不仅在传言中，还有 OpenAI 的人一次又一次地提到关于超级智能的疯狂言论。OpenAI 在他们的博客上说，他们现在正在追逐人工超级智能（ASI），而不是通用人工智能（AGI），而且他们确切地知道如何实现它。

那么 GPT-5 会比 GPT-4 好多少？GPT 系列会和 o 系列合并吗？作者表示他仍在研究预计到来的时间和性能。在 2025 年，他们实际上讨论了合并 o1 系列和 GPT 系列。总而言之，这仍然是一个非常模糊的回应，没有太多具体信息。但考虑到他们确实创造了这些模型，他们无论如何都会制造这些模型，这绝对是有道理的。当然，我们知道他们还没有发布这些模型。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：GPT-5人工智能或将成为颠覆一切的革命性技术要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/LargeLanguageModel/2025012317643.html

ai 人工智能

上一篇：大模型之后，强化学习是智能体的未来方向

下一篇：CRAAP测试评估大模型生成内容的可信度

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。