谷歌模型升级:清华姚顺宇参与,从业者称其如外星智能
北京时间2月13日,谷歌正式推出了Gemini 3 DeepThink的重大升级版本,该模型专门设计用于处理复杂任务的推理模式,旨在应对科学和工程领域中存在的诸多挑战。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
值得一提的是,去年9月加入谷歌DeepMind团队的清华物理系知名学者姚顺宇(Shunyu Yao)也深度参与了此次DeepThink新模型的研发工作,并在当天通过社交媒体发文,邀请广大用户体验这一全新模型。

谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在发帖中表示:"我们与科学家和研究团队紧密合作,对DeepThink进行了全面改进,以应对现实世界中各种棘手的挑战。"这些挑战往往缺乏明确的指导原则或唯一正确答案,数据也常常呈现杂乱无章或不完整的状态。DeepThink将科学知识与日常工程实践相结合,有效推动实际应用落地。
从测试数据来看,这一模型在多项基准测试中创下了新纪录,超越了头部竞争对手旗下的Claude Opus 4.6和GPT-5.2,也超越了谷歌自家的Gemini 3 Pro Preview版本。
具体而言,在"人类终极考试"测试中,DeepThink取得了48.4%的成绩(在不使用工具的情况下),刷新了该测试的最佳纪录。而Claude Opus 4.6的成绩为40%,OpenAI的GPT-5.2成绩为34.5%。
在ARC-AGI-2测试中,DeepThink获得了前所未有的84.6%成绩,此前最强模型的得分在60%-70%之间,Claude Opus 4.6的成绩是68.8%。在竞技编程基准测试平台Codeforces中,DeepThink的Elo评分达到3455分,这一分数相当于在全球编程能力排名中位列前8。
此外,Gemini 3 DeepThink在化学和物理等科学领域表现卓越。谷歌特别提到,在2025年国际物理和化学奥林匹克竞赛的笔试环节,该模型取得了金牌级别的优异成绩。
去年,谷歌已证实DeepThink模式的定制版本能够攻克诸多高难度推理难题,在国际数学和编程锦标赛事中达到金牌水准。而此次升级则让DeepThink模式进一步支持研发人员开展研究级(research-level)的数学探索工作。
在官方博客中,谷歌展示了一些早期测试用户使用最新版DeepThink取得的成果。
罗格斯大学的数学家Lisa Carbone致力于研究高能物理学界所需的数学结构,以弥合爱因斯坦引力理论和量子力学之间的鸿沟。由于该领域缺乏大量的训练数据,她利用DeepThink技术审阅了一篇高度专业的数学论文。DeepThink成功地识别出了一个细微的逻辑缺陷,而这个缺陷此前在人工同行评审中均未被发现。
DeepThink还可以用来优化复杂晶体生长的制备方法,用于探索新的半导体材料。在杜克大学的案例中,其设计的方案培育出了尺寸超过100微米的薄膜,技术指标超过此前所有方法。
除了其最先进的性能外,DeepThink还旨在推动实际应用,使研究人员能够解释复杂的数据,使工程师能够通过代码对物理系统进行建模。例如,DeepThink对图纸进行分析,对复杂的形状进行建模,并生成文件,通过3D打印创建物理对象。
在谷歌官方评论区中,不少从业者震惊于ARC-AGI-2测试得分能达到84.6%。作为参考,大多数人在这类抽象推理题上都很难达到80%的正确率。
"如果这个模型在识别新模式(而不仅仅是记忆)方面真的达到了这样超人的水平,我们就应该停止称它为聊天机器人,而应该称它为外星智能。"一位AI从业者感慨道,Codeforces上的Elo等级是3455简直就是"传奇大师"级别了。
"真正让人惊讶的是,DeepThink竟然发现了一篇经过同行评审的数学论文中,人类审核人都忽略的逻辑缺陷。那不是工具,那是合作者。我们已经跨越了人工智能辅助研究人员和人工智能验证研究人员工作的界限。"一位谷歌前工程师评论道。
谷歌表示,DeepThink现已在Gemini应用中上线,目前Google AI Ultra订阅用户可以使用。此外,谷歌首次通过Gemini API向部分研究人员、工程师和企业开放DeepThink的使用权限。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
华硕“VG27UQEL5A”27 英寸显示器首销:4K 80Hz/ 1080P 310Hz 双模,1599 元
华硕“VG27UQEL5A”27英寸显示器首销:4K 80Hz 1080P 310Hz双模,1599元 3月15日最新消息,华硕旗下型号为“VG27UQEL5A”的27英寸显示器已在京东平台正式开启首销。这款新品最大的亮点在于支持4K 80Hz与1080P 310Hz双模式切换,首发定价锁定在159
盛色推出“G75 护眼版”27 英寸显示器:2K 340Hz 超频,1209 元
盛色G75护眼版显示器上架:2K 340Hz电竞新选择 电竞显示器市场又迎来一位实力选手。盛色最新推出的G75护眼版27英寸显示器已在京东正式开售,主打2K分辨率和340Hz超高刷新率,定价1209元。值得一提的是,部分地区享受国家补贴后,实际到手价可低至1148 55元,性价比相当突出。 性能参数
华硕Intel 800系主板Intel Ultra 200S Plus的好搭子
Intel酷睿Ultra 200S Plus系列处理器——270K Plus和250K Plus现已正式发布,拥有更多的核心,可显著增强多线程性能,并加入全新的英特尔二进制优化技术。与现有的第二代酷睿 Ultra系列台式机处理器相比,几何平均游戏性能提升高达15%。新U配好板,华硕Intel 800
重返奎尔萨拉斯!微星《魔兽世界:至暗之夜》限定版显卡来袭
MSI与暴雪联手,推出《魔兽世界:至暗之夜》限定版显卡,信仰与性能并存 嘿,各位玩家和硬件爱好者们,有个大消息来了!咱们熟悉的硬件大厂微星MSI,这次和暴雪娱乐玩了一票大的。为了庆祝《魔兽世界》最新资料片“至暗之夜”上线,他们俩竟然联手,捣鼓出了一款限定版显卡——GeForce RTX 5070 1
荣耀 MagicBook 14/16 2026 笔记本开启新品预约:可选酷睿 Ultra5-335H/Ultra X7-358H 处理器
荣耀 MagicBook 14 16 2026 款全方位评测:Ultra X7 与 Ultra5 双芯配置,性能与续航如何兼得? 荣耀新一代轻薄本产品线布局迅速,备受瞩目的 MagicBook 14 与 MagicBook 16 2026 款已正式开启新品预约。尽管官方售价尚未公布,但从京东等电商平
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

