o3 压台登场：OpenAI 卷动推理 AI模型风云，迈向 AGI 新巅峰

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

o3 压台登场：OpenAI 卷动推理 AI模型风云，迈向 AGI 新巅峰

热心网友时间：2026-04-29

转载

o3 压台登场：OpenAI 卷动推理 AI模型风云，迈向 AGI 新巅峰

消息来了，“12 Days of OpenAI”活动正式落下帷幕。压轴亮相的，是OpenAI全新的o3系列大模型。官方这次给的说法相当有分量：在某些场景下，其推理能力已经非常接近通用人工智能（AGI）的门槛了。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

o3 压台登场：OpenAI 卷动推理 AI模型风云，迈向 AGI 新巅峰

名称：为何是o3？

你可能注意到了，这次发布直接从o1跳到了o3，中间的o2去哪了？在今天早上的直播活动里，OpenAI首席执行官山姆・阿尔特曼揭晓了答案：主要是为了避免与英国电信运营商O2的商标产生冲突。看吧，即便是前沿科技巨头，也得遵守商业世界的基本规则。

邀请安全测试：谨慎的开放步伐

作为o1推理模型的正式继任者，o3系列包含完整版和一个精简版本——o3-mini。后者主要针对特定任务进行了优化和微调。

不过，OpenAI没有选择立即全面开放。他们的策略相当谨慎：即日起，先邀请安全研究人员注册测试预览版的o3-mini模型，后续再逐步推出完整版o3的预览。对于普通开发者和研究者来说，现在可以前往官网提交申请，排队等候。阿尔特曼没有给出o3模型的具体开放时间表，只透露o3-mini预计在2025年1月底推出，完整的o3模型则要再等等。

o3模型推理：核心差异在哪里？

o3模型与市面上主流AI模型的一个根本性不同，在于它内置了事实核查机制。这个设计能帮助模型规避一些常见的“幻觉”或逻辑陷阱，但代价也很明显：响应会产生延迟。根据问题推理的复杂程度，这个延迟可能在几秒到几分钟不等。

另一个亮点是o3系列使用了所谓的“私人思想链”进行“思考”。简单来说，模型在最终给出答案前，会先“暂停”一下，在内部详细地推演整个思考过程，然后才总结出最准确的结论。此外，o3还引入了一个新功能：允许用户调整推理时间，分为低、中、高三种计算级别。级别越高，模型执行任务的性能就越好，当然，成本也越高。

性能与AGI：关键的里程碑

这里需要先明确一下AGI的概念。AGI，即通用人工智能，通常指能够像人类一样执行各类任务的AI系统。OpenAI自己给出的定义更务实一些：是“在最具经济价值的工作中超越人类的高度自治系统”。

OpenAI朝着这个目标迈进，除了技术野心，其实在商业层面也有特别的含义。根据其与重要合作伙伴微软的协议条款，一旦OpenAI达成自己定义的AGI，就不再负有向微软提供其最先进技术的义务。因此，每一次模型能力的重大突破，都不仅仅是技术新闻。

而o3，无疑是迈向该目标的关键一步。在衡量AGI潜力的ARC-AGI基准测试中，o3在高计算设置下拿到了87.5%的分数，低计算设置下也有75.7%，整体性能达到了o1的三倍。当然，ARC-AGI的联合创始人弗朗索瓦·乔莱也坦言，高计算设置的成本非常高昂，每个任务可能要花费数千美元。

在其他多项专业基准测试中，o3的表现同样亮眼：

在SWE-Bench Verified编程任务测试中，成绩比o1高出22.8个百分点；
在Codeforces编程技能测试中，获得了2727的评分；
在2024年美国数学邀请赛中，得分高达96.7%；
在GPQA Diamond研究生水平的生物、物理和化学测试中，得分87.7%；
最惊人的是在EpochAI的Frontier Math基准测试中，o3解决了25.2%的难题（其他所有模型均未超过2%），创造了新纪录。

需要指出的是，以上结果均来自OpenAI的内部评估。模型实力的最终定论，还需要等待更广泛的外部客户和独立机构的测试来验证。

安全：不可忽视的另一面

毫无疑问，o3的发布标志着OpenAI在通用人工智能的漫长征程上，迈出了坚实而重要的一步。其展现出的推理能力令人印象深刻，但随之而来的潜在风险也必须得到同等重视。强大的推理能力若被滥用，后果可能更严重。对此，OpenAI方面承诺将持续投入模型安全研究，并积极与其他机构合作，共同构建更完善、更可靠的评估与基准测试体系。这条路，注定是能力与责任并重的双线赛跑。

来源:https://www.1ai.net/25411.html

上一篇：谷歌拓展 Gemini AI 深度研究模式，支持中文等 40+ 语言

下一篇：消息称雷军亲自重金招募大模型领军人才，DeepSeek 罗福莉将加入小米