首页
AI
谷歌Gemini与OpenAI GPT-5同获ICPC金牌,破解人类未解之谜

谷歌Gemini与OpenAI GPT-5同获ICPC金牌,破解人类未解之谜

热心网友
转载
2025-09-19
来源:https://36kr.com/p/3472125425375625

近半个世纪以来,国际大学生程序设计竞赛(ICPC)始终保持着计算机程序设计领域最高荣誉的地位,堪称计算机界的"奥林匹克盛会"。而今年这场顶尖赛事却出现了令人瞩目的转折——来自OpenAI的GPT-5和Google DeepMind的Gemini 2.5 DeepThink这两款AI模型,成为了全场最耀眼的"选手"。

在这届特别增设的AI赛道上,GPT-5和Gemini 2.5 DeepThink严格遵循ICPC最新赛事规则,在独立判题环境下完成了和人类选手完全相同的编程挑战。最终的竞赛成绩让整个科技界为之震动:

●GPT-5创下了满分纪录,12道编程题目全部解答正确,这一成绩已超越所有人类参赛队伍。

●Gemini 2.5 DeepThink用时677分钟完成了10道题目,同样达到金牌水准。按照谷歌发布的排名评估,这一表现足以位列全球第二。

值得关注的是,本届ICPC的金牌得主包括圣彼得堡国立大学、东京大学、北京交通大学和清华大学的顶尖编程团队。但即便是这些传统强队的最优成绩也止步于11/12,这意味着AI首次在这场国际顶级算法竞赛中实现了对人类的完全超越。

ICPC:精英程序员的试金石

作为创办于1977年的全球性赛事,ICPC一直代表着大学生编程能力的最高水准。今年总决赛汇聚了来自103个国家的139所顶尖高校,延续了其标志性的竞赛形式:

●三人一组的大学生团队协作;

●限时5小时完成12道算法题;

●排名依据解题数量和用时。

但这些看似简单的规则背后,蕴含着极大的技术难度。ICPC的题目往往融合了图论、数论、动态规划等前沿算法知识,既考验编程速度,更检验数学思维与团队协作能力。历届ICPC金牌得主后来都成为了全球科技巨头争相招揽的核心技术骨干。

正因为ICPC如此严苛的考核标准,本届赛事首次设立的AI赛道格外引人注目——这是计算机科学领域最具分量的"人机对决"。

人工智能的惊艳表现

OpenAI披露,GPT-5参赛时未经过任何针对性的赛前训练,完全依靠其基础能力完成了所有题目。整个过程与人参赛保持一致:接收标准格式赛题、通过官方评测系统提交代码、严格遵守5小时时限。

比赛结果令人惊叹:11道题目一次性通过,仅1道难题在第9次尝试后破解,最终达成12/12的完美战绩——要知道本届人类选手最好成绩仅完成11题,而GPT-5的全满分表现堪称ICPC历史性的突破。

OpenAI在其官方社交平台证实道:

"GPT-5严格遵循ICPC竞赛规程,5小时内独立完成12道题目评测。其中11道题一次通过,最具挑战的题目在第9次提交后解答成功。最终成绩超越所有人类队伍。"

与此同时,谷歌也公布了Gemini 2.5 DeepThink的出色表现:前45分钟完成8题;3小时内破解10题。最令人惊讶的是,它在比赛开始半小时后就给出了问题C的正确答案——这道题目最终没有任何人类队伍能够解答。

ICPC比赛现场

据了解,这道"无人能解"的赛题要求参赛者在复杂的水管网络系统中,找到最优的阀门配置方案以实现最短注水时间。面对近乎无限的组合可能性,Gemini 2.5 DeepThink展现了惊人的解题创造力:

1、首创性地为每个水库建立优先级评估体系; 2、基于动态规划推导最优管道调整方案; 3、运用极小化极大定理重新定义约束条件; 4、最终通过凸优化空间的三分搜索实现高效收敛。

这套解题思路完全由AI自主构建,与传统解法大相径庭。谷歌在技术博客中指出,这不仅是一次正确的答题,更代表了AI在算法创新层面的重大突破。

划时代的意义

虽然AI在各种标准化考试中取得优异表现早已不是新闻:

●大语言模型在SAT、司法考试等各类测评中屡创佳绩; ●Gemini不久前刚斩获国际数学奥林匹克金牌; ●各类NLP基准测试长期被AI模型霸榜。

但这类成绩常常被质疑依赖训练数据记忆或超强计算力。而ICPC这样的现场编程竞赛截然不同:赛题均为原创设计、需要即时构建数学模型、编写可执行代码、并且在严格时间限制下完成解题。

此次GPT-5和Gemini在ICPC中的卓越表现,切实证明了它们已经具备真实环境下的问题分析、数学建模和创新求解能力。科技界人士普遍认为,这场竞赛标志着AI发展进入新纪元——从单纯的知识存储转向真正的智力创造。正如某位AI专家在社交媒体的感慨:"我们正在见证人机智能平等的历史性时刻。"

这绝不仅是技术进步的注脚,而是全新篇章的开端。当AI开始在这类高难度智力竞赛中与人类同场竞技并展现优势时,我们有理由期待它们在未来将这种能力拓展到更广阔的创新领域。

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新文章

特斯拉Optimus机器人获PharmAGRI万台意向订单,制药业人形机器人应用提速

9 月 18 日消息,美国植物基制药企业 PharmAGRI 在一份当地时间本月 15 日的新闻稿中表示,其已于特斯拉签署了一份意向书,计划在农场运营、原料药合成、处方药生产环节部署多达 1 万台

2025-09-19.

马斯克否认特斯拉Optimus被订购上万台:消息不属实

9 月 18 日消息,据外媒 Teslarati 报道,近期有消息称,美国制药与农业基础设施公司 PharmAGRI 将购买 10000 台特斯拉 Optimus 机器人。特斯拉 CEO 马斯克今

2025-09-19.

开发者开源AI测评工具,精准评估大模型智能缺陷

9 月 18 日消息,程序员 ionutvi 今天发布了名为 AI Benchmark Tool 的 AI 评分工具,可衡量各大 AI 模型的“愚蠢程度”,帮助代码工作者选择最准确性最佳、更具性价

2025-09-19.

Meta推出Quest 3/3S专用Hyperscape全景扫描,实现VR家居数字化

9 月 18 日消息,Meta 今天于 Connect 大会上正式为旗下 Quest 3 3S VR 头显推出 Hyperscape 全景扫描方案,可将现实场景扫描转化成虚拟现实空间。Meta 曾

2025-09-19.

面壁智能推出VoxCPM语音生成模型,0.5B参数实现接近真人发音效果

9 月 18 日消息,今天下午,面壁智能宣布“小钢炮”系列迎新:推出 0 5B 参数尺寸的语音生成基座模型 VoxCPM。该模型由面壁智能与清华大学深圳国际研究生院人机语音交互实验室(THUHCS

2025-09-19.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
暗黑破坏神不朽哔哩哔哩服
暗黑破坏神不朽哔哩哔哩服 角色扮演 2025-09-19更新
查看
攻城天下vivo
攻城天下vivo 棋牌策略 2025-09-19更新
查看
香肠派对体验服
香肠派对体验服 飞行射击 2025-09-19更新
查看
割绳子国际
割绳子国际 休闲益智 2025-09-19更新
查看
僵尸榨汁机国际
僵尸榨汁机国际 休闲益智 2025-09-19更新
查看
地铁跑酷全皮肤
地铁跑酷全皮肤 休闲益智 2025-09-19更新
查看
香肠派对先行服
香肠派对先行服 飞行射击 2025-09-19更新
查看
割绳子1正
割绳子1正 休闲益智 2025-09-19更新
查看
糖葫芦达人正
糖葫芦达人正 休闲益智 2025-09-19更新
查看