应对竞争压力,OpenAI发布最强代码生成模型

从写代码到「接管电脑」,GPT-5.3-Codex 正在重新定义什么叫 AI 工具人。
作者|桦林舞王
编辑|靖宇
2 月 5 日,Anthropic 在超级碗上发布的讽刺广告,,却被科技圈嘲笑。
现在,Altman 的报复来了!
当地时间 2 月 5 日,OpenAI 发布 GPT-5.3-Codex,这款最新的代码模型不仅在测试中名列前茅,而且能真正接管电脑,自主切换程序,完成复杂任务。
,现在又是 GPT-5.3-Codex,来自 Altman 的反击,是如此迅速。
01
从「代码助手」到「电脑管家」
传统的 AI 编程工具,包括 GitHub Copilot 和之前的 Codex,本质上都是「代码补全器」——你写一行,它帮你写下一行。但 GPT-5.3-Codex 完全不同。
它能「接管」你的整台电脑。
OpenAI 在发布会上展示的场景让人印象深刻:Codex 不仅能写代码,还能运行测试、调试程序、管理数据库、处理文件系统,甚至能够自主地在不同应用程序之间切换,完成复杂的多步骤任务。
一位 Hacker News 用户的观察很有意思:「Codex 在发现错误和小的不一致性方面非常出色,这让我感到惊讶。Claude Code 在『原始编程』方面很好,但 Codex 在仔细、系统地发现『问题』方面是无敌的。」
说白了,这不再是一个编程工具,而是一个数字员工。
相比于之前的版本,GPT-5.3-Codex 的提升不再仅仅体现在代码生成的正确率,而是在「智能代理(Agentic)」能力上的质变。

5.3 Codex 和自家产品的对比|图片来源:OpenAI
在保持相同推理深度的情况下,运行速度比GPT-5.2-Codex快了25%。同时,新模型引入了「中途转向(Mid-turn Steering)」。你不再需要等待模型生成完毕后才反馈,可以在它运行长达数小时的任务(如重构整个代码库)时,随时插入指令进行纠偏。
就在 OpenAI 发布 5.3 的同一天(甚至只相差 15 分钟),Anthropic 发布了Claude Opus 4.6,火药味极浓。

OpenAI 和 Anthropic 最新代码模型的数据对比|图片来源:AI 自制
更有趣的是,这是OpenAI第一个「自己造自己」的模型。
研究团队用 Codex 来监控训练过程、分析代码质量、提出优化建议。AI 开始参与 AI 的诞生过程,这个循环一旦形成,进化速度将是指数级的。
02
90% 时间在编程的产品经理
最能说明 Codex 影响力的,不是技术指标,而是人的工作方式改变。
OpenAI 产品设计负责人 Ed Bayes 的话很直接:「我现在 90% 的时间都在编程。一年前正好相反,可能只有 10% 的时间。」
一个产品设计师,现在大部分时间在写代码——这个转变背后的逻辑很简单:当 AI 能够理解你的意图并直接实现时,传统的「产品-开发-测试」流水线就被压缩了。
这种变化不只发生在 OpenAI 内部。

两天前 OpenAI 刚刚发布 MacOS 版的 Codex 独立应用|图片来源:OpenAI
The New Stack 分析师指出:「GPT-5.3-Codex 不仅仅在单个任务上更好,而是朝着能够在现实世界技术工作的全谱中进行推理、构建和执行的单一通用代理迈出了一步。」
但这也带来了新的分工模式。
一位 Hacker News 用户总结了 Codex 与 Anthropic Claude 的区别:「在 Codex 中,定位是一个交互式协作者:你在执行过程中引导它,保持循环,在它工作时纠正方向。而在 Opus 4.6 中,强调的是相反的:一个更自主、更智能、更深思熟虑的系统。」
这意味着,程序员的角色正在从「执行者」转向「指挥者」。
03
AI Coding 大战升级
Codex 的发布时间点很微妙——就在超级碗前夕,OpenAI 和 Anthropic 都准备了竞争性广告。VentureBeat 将此次发布描述为「AI 编程战争的开场齐射」。
这不是偶然。当 AI 编程工具从「锦上添花」变成「必需品」时,这个市场的竞争就会变得异常激烈。
有 Hacker News 评论员直接警告 Anthropic:「他们最好采取重大行动,否则 OpenAI 将杀死 Claude Code。」话虽然说得直接,但反映了业内的普遍判断:Codex 这次的能力跃升,确实给竞争对手带来了巨大压力。
不过,Every.to 的对比测试显示了另一个角度:「在一项调试测试中,GPT-5.3 Codex 运行了超过 8 个工具调用,逐位分析但错过了实际问题。而 Opus 4.6 只读了一次文档就诊断出了问题。」
这说明,不同的 AI 编程工具正在形成差异化的优势:Codex 更像一个细致的执行者,Claude 更像一个敏锐的诊断师。
但无论如何,Sam Altman 的评价很能说明问题:「感觉,比基准测试显示的更像是一个真正的进步。」当CEO用「感觉」而不是数据来描述产品时,往往意味着这个产品已经超越了现有的评估体系。
这场 AI 编程战争,本质上是在争夺一个问题的答案:在软件开发这个万亿美元市场中,人和 AI 的边界到底在哪里?
Codex 给出的答案是:AI 可以做程序员能做的几乎所有事情,人类负责告诉 AI 要做什么。这个分工模式一旦被验证,整个软件行业的人才需求、薪酬结构、甚至教育体系都会发生根本性改变。
现在的问题不再是「AI 会不会取代程序员」,而是「什么样的程序员,不会被 AI 取代」。
*头图来源:OpenAI
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
阿里钉钉文档全功能解析在线协同办公套件使用指南
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
商汤小浣熊智能助手基于自研大语言模型
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
MiniMax新一代智能模型矩阵全面解析与应用指南
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
智能客服机器人解决方案:AI客服系统提升企业服务效率
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练
开源企业答疑工具Danswer:高效解决团队知识管理难题
Danswer 是一款专为企业设计的开源智能问答平台,支持用户使用自然语言直接提问,并能够从公司内部文档、知识库等私有数据源中快速检索,提供带有精准来源引用的可靠答案。 核心功能:它如何解答问题? Danswer 的核心价值在于实现了“智能问答”。用户无需再花费大量时间手动搜索和翻阅各类文件,只需像
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

