谁不用谁亏，Karpathy吹爆GPT-5：10分钟编码完胜Claude一小时，奥特曼秒回感谢

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

谁不用谁亏，Karpathy吹爆GPT-5：10分钟编码完胜Claude一小时，奥特曼秒回感谢

热心网友时间：2025-09-08

转载

GPT-5，一夜又成为了编码圈的顶流。AI大牛Karpathy发文狂赞，Claude Code折腾一小时没搞定的难题，GPT-5 Pro十分钟就完成了，奥特曼秒回感谢。麻将 GPT-5 Pr

GPT-5，一夜又成为了编码圈的顶流。AI大牛Karpathy发文狂赞，Claude Code折腾一小时没搞定的难题，GPT-5 Pro十分钟就完成了，奥特曼秒回感谢。

麻将

GPT-5 Pro再次得到了AI大佬的认可。

今天，Karpathy一早激动发文，「必须再吹一波OpenAI的GPT-5 Pro，真的太强了」！

这究竟是肿么回事儿？

在工作流中，Karpathy遇到了一个棘手的问题，但Claude Code折腾了一个小时还是没有搞定。

最后，他决定换GPT-5 Pro去跑，没想到仅用十分钟，就直出一个开箱即用的解决方案。

更有趣的是，他让Claude看了GPT-5 Pro的解法，它居然写了「两段小作文」疯狂夸赞。

最后，Karpathy还真诚地建议，「谁要是不把最刁钻的问题交给GPT-5 Pro，简直亏大了」。

在编码PK的这一局中，GPT-5 Pro又上分了。

奥特曼立即感谢Karpathy，顺便好奇地问了一句，「你是更希望它变得更聪明，还是跑得更快」？

OpenAI总裁Greg还不忘借此宣传一波，「GPT-5 Pro就是编码的下一代产品」。

编码王者之战，GPT-5 Pro上大分

当前，在编码领域，每位开发者都有各自青睐的模型。

有的人喜欢Claude，有的人喜欢Gemini，还有的人更倾向于GPT-5/Codex，又或是Grok Code。

评论区，一位网友问Karpathy有没有尝试过grok-code-fast-1？

显然没有，不过已在他的计划之中。每隔几天，Karpathy就会把现有的工具轮着用一遍。

接下来，他再次谈了自己使用OpenAI模型的感受——

说实话，大概三周前，我还觉得Codex在处理基准编辑和整体体验上，还不如现在Claude Code好用。

不过单说GPT-5 Pro，目前确实甩别的模型好几条街。

另一位网友称，「AI模型互相赞赏彼此的工作成果，这才是未来感拉满的巅峰时刻」！

在Karpathy看来，这是一个超强的评估方法，而且自己经常这样做。

让所有模型都生成一段内容，然后把所有结果混在一起，再让每个模型去给所有内容输出排名。

一开始，比较令人担心的是，AI会偏向自己的生成结果，但在Karpathy有限的测试中，事实并非如此。

这就好像是「生成-判别差距」的现实版演示——写好内容很难，但识别优秀的东西容易多了，而且模型在这方面做的确实不错。

没想到，这一观点，深得网友认同。

给GPT-5 Pro编码好评的，可不止Karpathy一人。

一位开发者测试后，深刻感受到了GPT-5 Pro的强大。在大约6分钟，一次性完成应用开发，能够自由组合各种图像、文本、箭头等元素。

多轮交流后，GPT-5 Pro还能将SMILES转换为ASCII的代码。

HubSpot联创也是非常认可GPT-5 Pro的实力，但OpenAI Codex的用户体验还没有CC更友好，不过这一差距正在逐渐缩小。

半个月，使用量暴增10倍

今年5月，OpenAI正式推出了AI编程智能体Codex，这是一款专为软件工程设计的模型。

最初，它是基于o3打造的codex-1模型提供能力。

自GPT-5发布后，Codex又集成了最新模型，性能一夜暴涨，吸引了不少开发者的使用。

两天前，奥特曼曾官宣，过去两周Codex使用量增长了大约10倍。

他还表示，内部有一个非常高效的模型，能提供大量的使用量。

在PR竞技场中，Codex实力最强，大幅超越了Devin、GitHub Copilot、Cursor Agent。

或许你根本无法想象，不用一行代码，就能打造一个应用的感受。

一位Claude Code资深开发者，在尝试Codex 48小时后，分别点评了它们的之间的差异：

这位开发者同样认为，Codex在Claude遇到棘手问题上，以及编写代码方面表现良好。

不知，大家更倾向于哪个编码模型？

参考资料

https://x.com/karpathy/status/1964020416139448359

https://x.com/sama/status/1964032346975588371

来源:https://36kr.com/p/3457496569419400

上一篇： IFA消费级AI硬件大爆发，AI不再是功能插件，而是家居大脑

下一篇：上海交大副教授，两年融4轮

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

一位技工在客户家地下室发现一台属于AMD前CEORoryRead的旧PC，机箱上留有苏姿丰等高管签名，配置为推土机时代硬件且从未开机。这台电脑封存了AMD从推土机失败到Zen架构崛起的关键转折历史。

时间：2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

Laravel12延续开发体验优势，在项目结构、查询构建、API开发、调试及性能上持续优化。其生态日趋成熟，形成Reverb、Pulse等完整工具链，覆盖API、SaaS、企业后台及AI应用开发。与Next js的组合逐渐流行，Laravel已演变为现代Web开发平台，保持社区活力。

时间：2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

LinuxKernel6 15重大更新：Rust驱动正式入主线，NOVADRM成为首个实践案例；io_uring新增零拷贝网络接收，降低CPU开销与延迟；Btrfs增强实时zstd压缩、DirectIO及稳定性。内核同步推进安全化与高性能网络化。

时间：2026-07-10 10:06

谷歌Gemini进入Agent时代打造全天候AI助理

Google推出GeminiSpark、Omni等新功能。Spark可全天候在后台运行，主动处理邮件、日历等任务；Omni侧重视频理解与环境推理，布局世界模型。AI正从被动回答转向主动观察、规划与执行，标志着竞赛进入新阶段。

时间：2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

CPU-Z2 20 2正式版发布，新增支持IntelPantherLake、WildcatLake、BartlettLake三大架构及AMD锐龙AIMax、Pro系列，加入锐炫G3识别库，修复缓存错误和锐龙77700X3D检测问题，免费下载。

时间：2026-07-10 10:05

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

热门数据榜

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

相关攻略

2026-07-10 10:06

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

2026-07-10 10:05

谷歌Gemini进入Agent时代打造全天候AI助理

2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

2026-07-10 10:05

苹果CEO库克主持WWDC26数次拭泪连说18声谢谢

2026-07-10 10:05

中国空间站成功培育出番茄

2026-07-10 10:05

A电竞全线领先锐龙5 9600X vs 酷睿Ultra5 250K PLUS八款游戏实测

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

北境酒馆实况我在中世纪经营知名酒馆发布于 2026-07-10

天堂2盟约剑盾职业玩法：技能搭配装备选择实战技巧发布于 2026-07-10

战意三国7月24日定档违约最高送1亿电影票发布于 2026-07-10

天堂2盟约手游深度评测：玩法特色、职业系统及新手入门指南发布于 2026-07-10

年大型手游排行榜前十人气耐玩网游大盘点发布于 2026-07-10

怪物猎人旅人冰原双刀强度解析与实战评测发布于 2026-07-10

女生最爱玩的热门高人气手游推荐下载合集发布于 2026-07-10

最新十大好用安卓手机飞机订票App推荐下载发布于 2026-07-10

如何用Linux查看网络数据包在内核的流向发布于 2026-07-10

如何在CentOS 7中修改文件系统配额的具体操作步骤发布于 2026-07-10

Linux查看具体硬件驱动列表的命令发布于 2026-07-10

电脑0x800401f3无效类字符串系统底层报错解决发布于 2026-07-10

奔驰电动GLC与理想i6怎么选，40万内家用优势对比发布于 2026-07-10

三星S20U设置5G后信号变差常见原因及解决方法发布于 2026-07-10

家用取暖器暖和又省电的选购指南与推荐发布于 2026-07-10

超声波加湿器如何安装使用更省电发布于 2026-07-10

热门话题

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战

谁不用谁亏，Karpathy吹爆GPT-5：10分钟编码完胜Claude一小时，奥特曼秒回感谢

编码王者之战，GPT-5 Pro上大分

半个月，使用量暴增10倍

参考资料

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

Laravel 12生态成熟助力全栈开发效率提升

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

谷歌Gemini进入Agent时代 打造全天候AI助理

CPU-Z 2.20.2正式版发布 支持Intel三大平台及AMD锐龙AI Max

谷歌Gemini进入Agent时代打造全天候AI助理

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max