面包屑图标 当前位置: 首页
AI资讯
热点详情

GPT-5人工智能或将成为颠覆一切的革命性技术

AI热点日报
AI热点日报时间:2026-06-29
热点解读

这是一篇关于 GPT-5 的深度好文,揭开了它背后那些不太寻常的秘密。 核心内容: 1 GPT-5 可能带来的碘伏 2 相关实验室的秘密项目 3 Open AI 不发布 GPT-5 的原因 传说中,GPT-5 可能会碘伏一切。 这条消息最早出自 Alberto Romano 的一篇长篇分析,文

这是一篇关于 GPT-5 的深度好文,揭开了它背后那些不太寻常的秘密。

核心内容:

1. GPT-5 可能带来的碘伏
2. 相关实验室的秘密项目
3. Open AI 不发布 GPT-5 的原因

GPT-5 可能会碘伏一切!

传说中,GPT-5 可能会碘伏一切。

这条消息最早出自 Alberto Romano 的一篇长篇分析,文中详细探讨了 GPT-5 的现状。一些人工智能实验室可能正在进行一些不为人知的秘密项目——而这些信息,可能比你想象的更关键。

Alberto Romano 的核心观点很明确:GPT-5 真的会改变一切。这不是夸大其词。当你钻进细节里,你会发现,这改变是碘伏性的。因为它意味着未来这些模型的发布方式将彻底不同。

文章开头提出了一个大胆的假设:如果我告诉你,GPT-5 是真实存在的,而且它已经在你看不见的地方,塑造着这个世界,你会怎么想?这个假设贯穿始终,也是我们今天要讨论的核心。

文章指出,OpenAI 已经构建了 GPT-5,但他们选择将其保留在内部。因为这样做带来的投资回报率,远高于将其发布给数百万的 ChatGPT 用户。而且,这个投资回报率不是金钱,而是别的东西。想法很简单,但关键在于把各种线索串联起来。文章深入探讨了为什么这一切都说得通。总而言之,核心论点是:OpenAI 已经创造出了 GPT-5,它是一个令人惊叹的模型——真的非常出色。但他们决定不发布它,原因将在后面展开。

提前卖个关子:这个原因相当有意思。先来看看文章中提到的一件事——Anthropic 的 Claude Opus 3.5 的神秘消失。

在深入探讨 GPT-5 之前,我们需要先关注它的“远房表亲”——那个同样失踪的模型。众所周知,三大人工智能实验室——OpenAI、Google DeepMind 和 Anthropic——提供了各种模型,覆盖价格、性能和不同应用场景的需求。OpenAI 有 GPT-4o、GPT-4、GPT-4 Turbo,以及 o1 和 o1 mini;Google DeepMind 有 Gemini Ultra、Pro 和 Flash;Anthropic 则有 Claude Opus、Sonnet 和 Haiku。这么多模型,本质上是为了尽可能满足不同客户的偏好——有的追求极致性能,不在意成本;有的则想要性价比高的解决方案。

现在回到 Opus 3.5 的神秘失踪。2024 年 10 月发生了一件奇怪的事。当时所有人都期待 Anthropic 发布 Claude Opus 3.5 来回应 GPT-4o,然而他们却发布了 Claude Sonnet 3.5 的更新版本。甚至有人开始基于 3.6 版本制作课程,而 Opus 3.5 却不见踪影。记住,这本该是一个类似 GPT-5 级别的模型。它的消失,似乎让 Anthropic 在与 GPT-4 的竞争中失去了最直接的对手。

但仔细研究 Opus 3.5 的情况,会发现一些有趣的地方。此前在 10 月,有帖子提到传言称 Sonnet 3.6 是一个非常出色的模型,但只是备受期待的 Opus 3.5 训练失败后的一个检查点。当时因为一些网页信息,很多人认为 Claude Opus 3.5 已经被取消了——之前他们一直宣称即将到来,后来却从很多页面上删除了发布消息。最近,Anthropic 的首席执行官接受了一次采访。关于 Opus 3.5 的所有信息,稍后都会与 GPT-5 联系起来。

之所以讨论 Opus 3.5,是因为它本应是 GPT-5 级别的竞争对手。接下来探讨的是,Anthropic 如何处理 Opus 3.5 的,以及他们的做法如何同时揭示了 OpenAI 可能采取的策略。在采访中,Dario Amodei 谈到 Opus 3.5 时表示:“没有给出确切日期,但就我们所知,计划仍然是发布 Claude Opus 3.5。” 他的回答谨慎而模棱两可,但也证实了计划仍然存在。

与此同时,有多篇彭博社文章都谈到了 OpenAI、Google 和 Anthropic 在构建更先进人工智能方面面临的挑战。当时正处于从 GPT-4 到 GPT-5 级别模型的过渡期。Gemini 2 令人失望,GPT-5 也令人失望,而 Opus 3.5 虽然表现更好,但提升幅度没达到预期。彭博社在一篇文章中写道:Anthropic 在训练后发现,作为 GPT-5 竞争对手的 Opus 3.5 表现优于旧版本,但提升幅度并没有达到模型规模和成本所预期的程度。Dario 避免给出具体日期的原因,可能就是 Opus 3.5 的训练运行没有失败,但结果不尽如人意。

很多人忽略了一个事实:这些下一代迭代模型,比如 GPT-5、Gemini 2,虽然不错,但唯一的缺点是成本太高,性价比不高。请记住这一点,因为这跟它们没有被发布的原因直接相关。

接下来是一些内部消息或泄露的信息。半导体专家 Dylan Patel 在 12 月 11 日提出了一个疯狂的理论:Anthropic 使用 Claude Opus 3.5 生成合成数据,并进行奖励建模,从而显著改进了 Claude Sonnet 3.5,同时还使用了用户数据。这说法很夸张,但来自一个业内可靠的消息来源——他此前曾透露过一些后来被证实为真的信息。这也是许多人认为 GPT-5 仍然在内部良好运行的关键理论之一。Dario 相信不同的训练运行可以改善结果,因此避免给出具体日期。彭博社证实,结果确实比现有模型更好,但不足以证明推理成本的合理性。

Dylan 和他的团队发现了神秘的 Sonnet 3.6 和失踪的 Opus 3.5 之间的联系——后者被内部用于生成合成数据。这意味着,他们可能拥有一个非常智能的人工智能系统,但还没有向公众发布。公开的版本是 Sonnet 3.6。

接下来更疯狂——文章开始解释模型蒸馏。更好、更小、更便宜——使用一个强大而昂贵的模型来生成数据,从而提高一个性能稍逊的模型的能力,这个过程被称为蒸馏。这是一种常用的范式,并且将继续下去。一个强大的模型就像一位老师,可以把较弱的学生模型从小、便宜、快速但能力弱,变成小、便宜、快速且功能强大。蒸馏把一个强大的模型变成了一个金矿。如果运行 Opus 这样优秀的模型成本太高,为什么不把它的很多能力“训练”到一个也受欢迎的 Sonnet 3.6 模型里呢?这非常有趣。

当然,Anthropic 选择不发布 Opus,并非因为结果不佳,而是因为在内部使用它更有价值——他们基本上用这个人工智能来训练下一代人工智能。Dylan Patel 认为,这就是开源社区能如此迅速地赶上 GPT-4 的原因——他们本质上是从 OpenAI 的思想中“窃取了黄金”。人们将 GPT-4 的能力蒸馏到更小的模型中。这很有趣,因为 GPT-4o 是一个更小的模型,速度更快,性能更好,非常有用。

这也是其他公司正在做的事情。当这些顶级实验室不再强调更高的参数量就意味着更好的性能时,范式已经变了。上次了解的参数量信息是:GPT-3.5 有 1750 亿个参数,而有传言称 GPT-4 在专家混合模型中有 1.8 万亿个参数。但最令人惊讶的是,现在推测像 GPT-4o 和 Sonnet 3.6 这样的未来模型,虽然比这个大模型小得多,但由于蒸馏技术性能更佳——这意味着模型中的知识效率更高,模型也更智能。当前模型,例如最初的 GPT-4o,可能比 GPT-4 小一个数量级。GPT-4o 大约有 2000 亿个参数,Sonnet 3.5 大约有 4000 亿个参数。尽管这个估计可能不准确,但 Anthropic 训练了 Opus 3.5,并把该模型的知识蒸馏到了 Sonnet 3.6 中。

那么 OpenAI 做了什么呢?这就引出了 GPT-5 的传闻。OpenAI 可能拥有一个非常神秘的内部模型,可能是 GPT-5。考虑到最近听到的所有消息,它可能是一个更智能的模型。我们目前使用的这些较小的模型所拥有的信息,很可能都是从那个秘密模型中蒸馏而来的。我们知道 Strawberry 模型也进行过一些蒸馏操作,所以 OpenAI 对蒸馏过程非常熟悉,就像之前的 o1 模型和 o1 preview 模型一样,效率非常高。

当说到“表现不如预期”时,这并不意味着比你之前做的更差,只是没达到预期。想象一下,你期望在一场比赛中赢 1 万美元,但只赢了 1000 美元。虽然比你通常赢的多,但算表现不如预期——这并不意味着没有进步。对于智能而言,每一寸进步都会解锁全新的能力。对这些公司来说,推理成本非常重要——因为有太多人在使用,需要大量服务器,而且需求每周都在持续增长,很难跟上。

这就是为什么蒸馏非常有效的原因。促使 Anthropic 将 Sonnet 3.6 蒸馏到 Opus 3.5 的因素,对 OpenAI 影响更大。文章指出,关于蒸馏,Ilya Sutskever 最近几周也承认了:“我们又回到了蒸馏的道路,我认为 GPT-4o 和 Claude Sonnet 3.5 都是从更大的模型中蒸馏而来的。” 这是一个大家都承认的现实。他们认为,现在达到更高水平模型的方式,不能仅仅投入更多数据,而需要新的创新。而基本事实是:蒸馏可能是实现这一目标的唯一途径。

第一个开辟道路的人必须清理道路。作者先分析了 Anthropic Opus 3.5 的故事,因为掌握了更多关于它的信息,然后通过蒸馏的概念将它与 OpenAI 联系起来,并解释了推动 Anthropic 的潜在力量也在推动 OpenAI。但现在又出现了一个新障碍:训练成本。不仅是推理成本,还包括训练成本——可能在谈论耗资 5 亿美元的训练运行。使用当前硬件进行这样的训练是否可能?答案是肯定的。但这其中最疯狂的是:你将无法对该模型进行推理。基本上,这些公司可能仍然在内部扩展模型,并进行疯狂的训练,但他们能够真正为客户提供经济价值的唯一途径就是蒸馏。

当然,这就是他们不发布完整模型的原因。这非常有趣,因为我们知道这些公司一直在努力解决推理成本问题,因为他们需要进行大量研究等等。但了解幕后真正发生的事情,将会非常有趣——如果他们正在训练一个如此庞大的模型,他们可以用它做很多事情,但他们可能不会发布相关的研究论文。

文章还指出,花费如此巨大的推理成本,对于微软、Google 或亚马逊来说也是难以承受的。如果 OpenAI 假设性地以“尚未准备好”为借口保留 GPT-5,除了控制成本和防止公众强烈反对外,他们还能实现一件事:避免声明该模型是否达到了被归类为 AGI 的门槛。正如我们所知,AI 的监管是一个非常复杂且敏感的问题。

文章接近尾声时开始总结观点。作者认为,即使以上说法都是真的,怀疑论者也不会想到 OpenAI 可能有比外部应用更好的内部“用途”。创建一个优秀的模型,和创建一个可以廉价地服务于 3 亿用户的优秀模型之间存在巨大差异。如果你做不到后者,你就不会去做;但如果你不需要这样做,你也不会去做。现在我们已经拥有了很多可以使用的简单产品,并且可以从中获得相当大的日常价值。他们真的不再需要为我们提供最前沿的技术——仅仅因为他们不再需要把这些技术提供给我们,他们只需要自己使用这些技术,以便开发更好的产品和技术。这就像说,当 OpenAI 开发出自己的内部 AGI 系统时,他们只会自己使用它,以便进行进一步开发。

OpenAI 很可能在内部拥有可用的 GPT-5,就像 Anthropic 拥有 Opus 3.5 一样。但极有可能的是,OpenAI 永远不会向公众发布 GPT-5。现在公众衡量模型性能的标准,不再仅仅是 GPT-4 或 Claude Sonnet 3.5,而是基于 o1 或 o3。随着测试时间的推移,新的缩放定律使得 GPT-5 需要跨越的门槛越来越高。他们如何才能发布一款真正超越 o1 和 o3,以及即将推出的 o 系列模型的 GPT-5 呢?像 GPT-5、GPT-6 这样的新型基础模型,对于 OpenAI 内部来说始终是有意义的,但不一定作为产品发布。这一部分可能已经结束了。

从现在开始,他们唯一的目标是不断为下一代模型生成更好的数据。基础模型可能会在后台运行,使其他模型能够实现它们自身无法完成的壮举,就像一位隐居者从秘密的山洞中传授智慧一样——只是这个山洞是一个巨大的数据中心。OpenAI 和 Anthropic 已经启动了通过人类参与的自我完善运作。他们公开发布什么并不重要,他们将越来越遥遥领先。就像宇宙加速膨胀一样,遥远的星系再也无法到达我们。这可能就是他们如何在短短三个月内从 o1 升到 o3 的原因,以及他们将如何从 o4 跳到 o5 的原因。这可能就是为什么他们在社交媒体上如此兴奋——因为通往日益强大人工智能的道路就在指尖。如果他们打算发布每一个进步供我们使用,那你肯定不会相信他们在说,他们的模型会让他们遥遥领先,以至于没有人能赶上他们。每一代新模型都是一个逃离平流层的逃逸速度引擎。他们已经在挥手告别了——随着每一次创造新模型,追赶 OpenAI 将变得越来越困难。

创新者来了。问题是我们不知道他们是如何做到的。还没有真正看到有人反驳这种说法。不仅在传言中,还有 OpenAI 的人一次又一次地提到关于超级智能的疯狂言论。OpenAI 在他们的博客上说,他们现在正在追逐人工超级智能(ASI),而不是通用人工智能(AGI),而且他们确切地知道如何实现它。

那么 GPT-5 会比 GPT-4 好多少?GPT 系列会和 o 系列合并吗?作者表示他仍在研究预计到来的时间和性能。在 2025 年,他们实际上讨论了合并 o1 系列和 GPT 系列。总而言之,这仍然是一个非常模糊的回应,没有太多具体信息。但考虑到他们确实创造了这些模型,他们无论如何都会制造这些模型,这绝对是有道理的。当然,我们知道他们还没有发布这些模型。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:GPT-5人工智能或将成为颠覆一切的革命性技术要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/LargeLanguageModel/2025012317643.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-05 16:42
大模型本地部署后为何没了下文

大模型在基础教育领域遇冷的主要原因,正是数据获取这一关键难题始终难以突破。 2025年1月30日,DeepSeek宣布开源之后,一篇探讨本地部署对中小学教育价值的文章迅速走红——阅读量突破8 2万,6000余人转发,13个公众号相继转载。春节假期刚结束,不少学校及机关单位便高调宣布完成DeepSee

AI热点2026-07-05 16:42
款AI Agent工作流推荐与优缺点深度解析

掌握AI智能体工作流模式,提升应用开发效率。核心内容: 基础模式:检索增强生成(RAG)的工作原理与应用场景 进阶模式:提示链、路由、并行化等智能体工作流模式解析 各种模式的优缺点分析,助你精准选择适用场景 说实话,AI应用借助大语言模型(LLMs),早就突破了传统规则系统的局限,能处理各种复杂任务

AI热点2026-07-05 16:42
艾默生发布谷轮在线信息工具 NVIDIA助海帆深度管控平台

NVIDIA助力海帆推出基于DeepStream的IDC机房管控平台,实现戴口罩检测、抽烟识别等AI分析,采用Jetson边缘终端支持多路视频流。英威腾与唐山智诚电气战略合作,共建矿山智能化输煤系统,推动煤矿装备国产化。艾默生发布谷轮™在线信息工具,优化产品搜索与交叉引用功能,集成技术资源与计算工具。

AI热点2026-07-05 16:42
晶心科技测试IMG B图形处理器 NVIDIA GPU助力三维家提效

三维家借助英伟达图形处理器与推理技术,使算法执行速度提升两倍以上,超分渲染时间节省超过一半;英威腾电源为大会提供系列不间断电力保障;晶心科技成功验证了系列图形处理器与中央处理器的集成,为异构计算提供完整方案。

延伸阅读