王坚院士外滩大会演讲全文实录

AI热点日报时间：2026-05-30

热点解读

当前，人工智能的技术本身、与产业结合的方式以及基础设施正同时经历三重革命。2017年Transformer架构奠定了深度学习的基础，ChatGPT则成为标志性的应用平台。在规模驱动下，数据、模型与算力深度融合，构成新型基础设施，持续推动创新与变革。

王坚院士的这场演讲，围绕三个关键词展开：AI、AI+、AI基础设施。通篇听下来，可以提炼出几个核心判断——人工智能的技术本身、它与产业结合的方式，以及它赖以生存的基础设施，这三件事正在同时经历革命。这种三重革命的叠加，在历史上并不多见。

先说第一个问题：我们今天聊的人工智能，到底在说什么？

人工智能有很长的过去，但只有很短的历史。这句话听着有点矛盾，但事实就是如此。那篇标志性的文章，是图灵在40年代末50年代初写的，叫《智能机器》。那个时候计算机这个词都还没定型，大家管它叫“计算设备”，美国计算机学会至今叫ACM，也是这个历史遗留。图灵那篇文章第一次用了“数字计算机”这个术语，发在心理哲学杂志上，探讨机器与智能的关系。如果往回追溯，关于机器智能的思考可以追到几百年前，但真正意义上的起点，还是从图灵开始。

当然，1956年的达特茅斯会议大家都熟。有意思的是，迈克尔刚才提到了控制论（Cybermetics），如果那个会不是在达特茅斯开，这个领域可能就叫控制论了。从单词角度讲，“控制论”说不定更好，但“人工智能”就这么流行起来了。

我特别标注了赫伯特·西蒙，是因为个人对人工智能的理解就是从这位传奇人物开始的。他是个心理学家，却参加了达特茅斯会议，后来拿了诺贝尔经济学奖。1972年他以美国计算机学会名义访华，80年代初又以美国心理学会名义再次来华。那时我大三，听他讲人工智能在未来十年会有天翻地覆的变化。一个中国大学生在80年代听到这种预言，当然激动。但等了十年，什么都没发生，大家该干嘛干嘛去了。

不过，那时候很多基础的东西其实已经被提出来了，包括神经网络。80年代末有一本教科书叫《并行分布式处理》，通篇讲神经网络理论，但只限于每层两个节点、三层结构。今天的规模完全不可同日而语。

AI的七年历史

所以需要强调一点：今天的人工智能，跟80年代初大家聊的人工智能，已经是两个完全不同的概念了。

那为什么说它只有很短的历史？因为真正让AI回到大众视野、对产业产生巨大影响的节点，是2017年。那一年谷歌提出了Transformer架构。从那时算起，这段历史不过七年。2017年之前的人工智能，跟之后的人工智能，有本质差别。

这段历史从一篇文章开始，大家都知道。但值得玩味的是，那篇文章的8个作者现在都不在谷歌了——听说最近有一个回去了。反正，谷歌发明了Transformer，但最后好像没它什么事。

那篇文章里有些被忽视的关键创新。比如第一次出现了“token”这个概念。听起来没什么了不起，但今天所有商业服务都用token计价。如果连最基本的计价逻辑都搞不清，很难有一个健康的产业。更不用说后面讲的关于基础设施的问题了。

同样，在谷歌这篇文章前后，出现了一家公司叫OpenAI。OpenAI的出现，让我们不得不重新思考创新的机制是什么。于是有了2022年GPT的发布。

这两件事放在一起，就很耐人寻味。一句话：谷歌很行，谷歌也很不行。

谷歌100%完成了0到1的创新，甚至更多。为什么说它不行？埃里克·施密特在斯坦福的那番发言搞得沸沸扬扬，说的就是谷歌非常不行。它没创造出像OpenAI那么有社会价值的东西。这里面的核心问题值得我们深思——创新机制到底是什么？不是简单的从0到1，也不只是有个好想法。中间的机制，远超今天学者甚至产业界的理解。这恐怕是我们面临的最大挑战。

机制创新与ChatGPT的本质

ChatGPT的光芒对大众而言掩盖了很多东西。比如AlphaFold 3出世，但很少人知道它的背后还是Transformer加扩散模型。今天大家聊生成图片、生成视频，都会提到Transformer加扩散模型，但很少有人理解为什么谷歌那篇文章如此基础——到最后所有东西都离不开Transformer。

从ChatGPT到AlphaFold，再到天气预报，这三个跨度极大的应用，背后都绕不开Transformer。所以，我们愿不愿意承认，现在都生活在Transformer这个阴影——或者说阳光之下。

在这样的背景下，再来看政府工作报告中提到的“人工智能+”，就需要更深入的思考。简单地在“人工智能+”后面加个行业，没有比这更庸俗的做法了。

ChatGPT是什么？它不是个应用，而是个应用平台，就像当年的Office。如果再拆一层：GPT是基础模型，Chat是应用，ChatGPT就是GPT加Chat。而Chat这个应用并不简单。微软和OpenAI在比尔·盖茨家里讨论了很多GPT的应用场景，最后只有ChatGPT最革命，变成了产品。其他那些有用但不革命的东西，后来都写成了书。有时候开个玩笑：书很危险，最革命的东西做成了产品，不革命的东西才写成书。

没有人比OpenAI的人更了解Chat。所以一句话：当你做不出比ChatGPT更好的东西时，至少有两个约束。第一是技术基础，也就是模型本身。第二是你对这个领域问题理解的深度——你能不能真正找到那个问题，这往往才是最大的前提。很多时候我们其实不理解问题，以为有了GPT就能解决一切。

规模驱动下的AI基础设施

AlphaFold 2出来的时候，有人说它是“生物学的ImageNet时刻”。这句话才真正反映了技术发展的本质。回到杰弗里·辛顿那篇里程碑式的文章，它其实就是三个东西的组合：ImageNet——有组织的数据；CNN——模型；GPU——算力。这是第一次把三者完美结合在一起的文章。而这三样东西在当时都不算新：ImageNet存在已久，CNN不是新算法，GPU更是网吧里都有。但那篇文章之后，GPU成了学术界和工业界的标准。当时他们用的不过是两块很普通的GPU卡，尽管算力已超过上万CPU核心，但中国每个网吧都有。所以，算力重要吗？重要。但在创新阶段，没有什么比人的创造力更重要。

为什么会引出“基础设施”这个概念？答案就在于“规模”二字。当数据、模型、算力的规模都发生质变时，一定要引入全新的东西才能解决问题。Pascal语言发明人说过一句话：婴儿速度的1000倍就是喷气机。任何东西的规模增加1000倍，就会发生天翻地覆的变化。今天，这三个组合的每一个单元都增长超过1000倍。正是这个量级，让我们绕不开AI基础设施。

一旦谈到基础设施，这其实是技术渗透的终极形态。人类历史上，什么技术对人类社会产生最长远的影响？答案是那些变成基础设施的技术。

红杉资本有一次研讨会上用的幻灯片很有意思，它把云计算、苹果、英伟达都划到了“基础设施”这一类。作为做云计算的人，看到这张图很激动。再看美国六家AI独角兽背后的基础设施支持：OpenAI背后是微软，第二名背后是AWS。这些企业背后的支持者，正是全世界排名第一、第二、第三、第五、第六的云计算服务商。第一、第二、第三、第五、第六都在，唯独没有第四——第四正是阿里云。这种基础设施的差距，某种程度上也反映了产业之间的差距。

这让我想起另一句话：微软很不行，但微软也很行。它没做出Transformer，但它有云，有基础设施。它和OpenAI一起创造出了今天我们看到的东西。在AI、AI+和AI基础设施这个逻辑下，每个人都可以做创造历史的事。

前几天看到一个创业公司画的图，很有意思。它区分了传统IT时代的云计算和AI时代的云计算，以及传统意义上的数据和AI意义上的数据。图中特别强调了：数据是基础设施的核心组成部分。数据不只是模型的附属品，也不只是计算的附属品。只有当所有这些东西结合成一个完整的基础设施时，才会有更激动人心的创新。

回到开头那句话：当你看AI、AI+和AI基础设施时，你会发现这个世界不但技术在革命，机制也在革命，基础设施也在革命。没有比这三项革命在同一个时间发生更令人激动的事情了。这些革命，正在创造未来。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：王坚院士外滩大会演讲全文实录要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/LargeLanguageModel/2024090710247.html

ai 人工智能

上一篇：企业使用AI代码规避GPL协议争议的法律风险指南

下一篇：Trae生成的SQL查询语句准确吗？数据库开发实测

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。