哈萨比斯警示:觉醒的AlphaGo正接管AGI科研

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
新智元报道
编辑:倾倾
【新智元导读】十年前,AlphaGo的神之一手让专业棋手当场沉默;十年后,Demis Hassabis说:那一刻,我们知道AI已经准备好去做真正重要的事了。从蛋白质折叠到数学奥林匹克金牌,AlphaGo开创的技术路径正在重塑科学本身。
2016年3月,首尔。
围棋世界冠军李世石,他的对手是一台程序。
第二局,第37手落下,无论哪位职业棋手都不会下在这里。
解说员一度以为这是操作失误,但在一百多手之后,AlphaGo赢了。
当晚有2亿人在看这场比赛的直播,全场的沉默持续了近一分钟。
十年后,Demis Hassabis在回顾这段历史时说,它下出「第37手」这一刻,他意识到:技术已经准备好了。
不是准备好赢围棋,而是准备好去攻克真正的科学难题。
那个判断,现在看来完全正确。
数亿种局面,一次穷举都没有
围棋棋盘上有10的170次方种可能的局面,这个数字远超宇宙中所有原子的总数。
传统的穷举+剪枝方法,在国际象棋上已经走到了极限,在围棋面前根本不够用。
AlphaGo把深度神经网络、强化学习、蒙特卡洛树搜索合在一起。
先从人类棋谱中学习哪些落子是合理的,建立一个初步的直觉模型。
然后自我对弈数十万局,让强化学习机制不断强化胜率更高的策略。
最后在实战中只搜索最有价值的分支。

这套组合的本质是用学习代替规则,用搜索代替蛮力,让AI从经验中涌现出超越人类经验的策略。
AlphaGo之后,DeepMind继续推进。
AlphaGo Zero完全抛弃了人类棋谱,从随机落子开始自我学习,最终成为史上最强棋手。
再往后是AlphaZero。同一套系统,从零开始,几小时之内学会了国际象棋,并且击败了当时最强的专用象棋引擎Stockfish,同时还下出了人类棋手从未见过的新策略。
Hassabis对这段历史的总结只有一句话:
这证明了方法是对的,是时候用到真实世界了。
从棋盘到实验室:AlphaGo的技术迁移
AlphaGo证明了,AI可以通过学习+搜索找到人类从未到达过的解。
这个方法,在科学领域的迁移直接且强力。
蛋白质折叠
这是人类研究了50年的难题。
蛋白质从氨基酸序列折叠成三维结构,决定了它的功能。
理解这个结构,对于攻克疾病和开发新药至关重要,但预测计算量巨大。

2020年,AlphaFold 2解决了这个问题。
随后,DeepMind把2亿个已知蛋白质的结构全部预测出来,放进开源数据库,免费向全球开放。
现在,全球超过300万名研究人员在用AlphaFold数据库工作。
2024年,Demis Hassabis和John Jumper因此获得诺贝尔化学奖。
数学推理
这是AlphaGo最直接的传承方向。

AlphaProof用语言模型加上AlphaZero的强化学习和搜索算法,学习证明形式化的数学陈述。
它本质上和AlphaGo「找最优解」是同一套框架,只是搜索空间从棋盘换成了数学命题空间。
2025年,AlphaProof和AlphaGeometry 2联手,首次在国际数学奥林匹克中达到银牌水平。
后来,Gemini Deep Think走得更远。
它用一套受AlphaGo启发的方法,在2025年IMO上拿下了金牌。
算法发现
AlphaEvolve是这个方向的代表。
就像AlphaGo搜索下一步最优落子,AlphaEvolve搜索的是「下一个更高效的算法」。
它找到了一种新的矩阵乘法方式。这是驱动几乎所有现代神经网络的基础操作,被研究了数十年,AlphaEvolve发现了人类从未找到过的方案。
Hassabis把这称为「AlphaEvolve的第37手时刻」。目前它正在被用于优化数据中心和量子计算问题。
科学协作
AI协作科学家系统(AI co-scientist)将AlphaGo的辩论式搜索原则嵌入科研流程。
它让多个AI智能体「辩论」科学假设,筛选最有价值的方向。
在帝国理工学院的验证研究中,这套系统分析了数十年的文献,独立推导出了研究人员花了数年时间才验证出的同一个抗菌素耐药性假设。
十年后,AlphaGo在Gemini里延续
AlphaGo证明的那套方法,现在正在Gemini里运行。
最新一代Gemini模型的推理机制,用到了AlphaGo和AlphaZero开创的搜索与规划技术。
Gemini从一开始就被设计为多模态。不是把图像和音频转成文字再处理,而是直接在多种模态上同时建立对世界的理解。
在Hassabis的设想中,通向AGI的路径需要三件事同时成立:Gemini提供的世界模型,AlphaGo式的搜索和规划能力,以及AlphaFold这类专用工具的协同调用。
这三者加在一起,才是「真正通用」的AI。
他在文章里还讲了一个更高维度的标准:
真正的AGI,不只是能在围棋里找到人类从未想到的策略,而是能发明一款像围棋一样深邃、优雅、值得人类研究几百年的游戏。
这两件事的差距,大约就是「找到答案」和「提出问题」之间的距离。
目前的AI在前者上已经走得很远,后者还没人知道需要多久。
文章末尾,Hassabis引用了李世石本人的话。
这位曾被AlphaGo击败的世界冠军,如今是韩国蔚山科学技术院的兼职教授。他这样评价那场比赛:
我认为AlphaGo给出的最重要的启示,是对人工智能时代的一次决定性预告——证明了这不是某个遥远、模糊的未来,而是一个正在到来的现实。它就像一份来自未来的路线图,向人类发出了清晰的信号:世界正在改变。
十年过去了,那张路线图上的很多节点,DeepMind已经走到了。
从蛋白质折叠到数学金牌,从算法优化到AI协作科研,AlphaGo的技术遗产已经溢出了棋盘,渗进了科学本身的运作方式里。
下一个「第37手」,会发生在哪里?
Hassabis没有给出答案,但他说,目标已经在地平线上了。
参考资料:
https://x.com/GoogleDeepMind/status/2031399096267718847

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
具身智能研发框架Dexbotic重塑机器人开发流程
近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边
CTO如何平衡AI效率提升与团队建设管理
最近,一个反复出现的新闻标题越来越常见:某大型企业一边高调宣扬AI带来的效率提升,一边大规模裁员。 主角轮番更替,背后的逻辑却如出一辙。企业既面临内部削减成本的压力,又需要向外界展示竞争优势。对许多企业而言,这意味着加大AI的使用力度,同时裁减被认为“多余”的员工——尽管目前对AI能力与可靠性的评估
OpenAI发布三款实时语音模型支持推理翻译与转录
OpenAI近期在语音AI领域动作频频,正式发布了三款全新的实时语音模型。官方表示,此举旨在“为开发者开启全新的语音应用类别”,推动语音交互技术的创新边界。这三款模型分别聚焦推理、翻译与转录三大核心功能,各具特色,预示着实时语音应用将迎来更丰富的可能性。 简单来说,这三款新品分别瞄准了实时对话推理、
捷克Albert超市借力AI货架扫描机器人提升运营效率
近日,Brain Corp发布了与捷克领先零售商Albert合作扩展AI货架扫描机器人的最新成果报告。报告显示,由人工智能驱动的自动化库存盘点解决方案在实际门店运营中取得了“高度成功”的表现,有效提升了零售运营的效率和准确性。 Albert是捷克知名的零售品牌,隶属于国际零售巨头Ahold Delh
OpenAI发布Daybreak网络安全AI模型
网络安全领域迎来重大进展。今日,OpenAI正式推出其专为网络安全打造的AI模型——Daybreak。这并非一次普通的功能升级,而是一个集成了多重技术能力的全新解决方案。 根据官方披露,Daybreak的核心架构由三大关键部分组成:其一是作为推理基础的GPT-5 5模型;其二是强大的Codex代码生
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

