面包屑图标 当前位置: 首页
AI资讯
热点详情

王坚院士外滩大会演讲全文实录

AI热点日报
AI热点日报时间:2026-05-30
热点解读

当前,人工智能的技术本身、与产业结合的方式以及基础设施正同时经历三重革命。2017年Transformer架构奠定了深度学习的基础,ChatGPT则成为标志性的应用平台。在规模驱动下,数据、模型与算力深度融合,构成新型基础设施,持续推动创新与变革。

王坚院士的这场演讲,围绕三个关键词展开:AI、AI+、AI基础设施。通篇听下来,可以提炼出几个核心判断——人工智能的技术本身、它与产业结合的方式,以及它赖以生存的基础设施,这三件事正在同时经历革命。这种三重革命的叠加,在历史上并不多见。

先说第一个问题:我们今天聊的人工智能,到底在说什么?

人工智能有很长的过去,但只有很短的历史。这句话听着有点矛盾,但事实就是如此。那篇标志性的文章,是图灵在40年代末50年代初写的,叫《智能机器》。那个时候计算机这个词都还没定型,大家管它叫“计算设备”,美国计算机学会至今叫ACM,也是这个历史遗留。图灵那篇文章第一次用了“数字计算机”这个术语,发在心理哲学杂志上,探讨机器与智能的关系。如果往回追溯,关于机器智能的思考可以追到几百年前,但真正意义上的起点,还是从图灵开始。

当然,1956年的达特茅斯会议大家都熟。有意思的是,迈克尔刚才提到了控制论(Cybermetics),如果那个会不是在达特茅斯开,这个领域可能就叫控制论了。从单词角度讲,“控制论”说不定更好,但“人工智能”就这么流行起来了。

我特别标注了赫伯特·西蒙,是因为个人对人工智能的理解就是从这位传奇人物开始的。他是个心理学家,却参加了达特茅斯会议,后来拿了诺贝尔经济学奖。1972年他以美国计算机学会名义访华,80年代初又以美国心理学会名义再次来华。那时我大三,听他讲人工智能在未来十年会有天翻地覆的变化。一个中国大学生在80年代听到这种预言,当然激动。但等了十年,什么都没发生,大家该干嘛干嘛去了。

不过,那时候很多基础的东西其实已经被提出来了,包括神经网络。80年代末有一本教科书叫《并行分布式处理》,通篇讲神经网络理论,但只限于每层两个节点、三层结构。今天的规模完全不可同日而语。

AI的七年历史

所以需要强调一点:今天的人工智能,跟80年代初大家聊的人工智能,已经是两个完全不同的概念了。

那为什么说它只有很短的历史?因为真正让AI回到大众视野、对产业产生巨大影响的节点,是2017年。那一年谷歌提出了Transformer架构。从那时算起,这段历史不过七年。2017年之前的人工智能,跟之后的人工智能,有本质差别。

这段历史从一篇文章开始,大家都知道。但值得玩味的是,那篇文章的8个作者现在都不在谷歌了——听说最近有一个回去了。反正,谷歌发明了Transformer,但最后好像没它什么事。

那篇文章里有些被忽视的关键创新。比如第一次出现了“token”这个概念。听起来没什么了不起,但今天所有商业服务都用token计价。如果连最基本的计价逻辑都搞不清,很难有一个健康的产业。更不用说后面讲的关于基础设施的问题了。

同样,在谷歌这篇文章前后,出现了一家公司叫OpenAI。OpenAI的出现,让我们不得不重新思考创新的机制是什么。于是有了2022年GPT的发布。

这两件事放在一起,就很耐人寻味。一句话:谷歌很行,谷歌也很不行。

谷歌100%完成了0到1的创新,甚至更多。为什么说它不行?埃里克·施密特在斯坦福的那番发言搞得沸沸扬扬,说的就是谷歌非常不行。它没创造出像OpenAI那么有社会价值的东西。这里面的核心问题值得我们深思——创新机制到底是什么?不是简单的从0到1,也不只是有个好想法。中间的机制,远超今天学者甚至产业界的理解。这恐怕是我们面临的最大挑战。

机制创新与ChatGPT的本质

ChatGPT的光芒对大众而言掩盖了很多东西。比如AlphaFold 3出世,但很少人知道它的背后还是Transformer加扩散模型。今天大家聊生成图片、生成视频,都会提到Transformer加扩散模型,但很少有人理解为什么谷歌那篇文章如此基础——到最后所有东西都离不开Transformer。

从ChatGPT到AlphaFold,再到天气预报,这三个跨度极大的应用,背后都绕不开Transformer。所以,我们愿不愿意承认,现在都生活在Transformer这个阴影——或者说阳光之下。

在这样的背景下,再来看政府工作报告中提到的“人工智能+”,就需要更深入的思考。简单地在“人工智能+”后面加个行业,没有比这更庸俗的做法了。

ChatGPT是什么?它不是个应用,而是个应用平台,就像当年的Office。如果再拆一层:GPT是基础模型,Chat是应用,ChatGPT就是GPT加Chat。而Chat这个应用并不简单。微软和OpenAI在比尔·盖茨家里讨论了很多GPT的应用场景,最后只有ChatGPT最革命,变成了产品。其他那些有用但不革命的东西,后来都写成了书。有时候开个玩笑:书很危险,最革命的东西做成了产品,不革命的东西才写成书。

没有人比OpenAI的人更了解Chat。所以一句话:当你做不出比ChatGPT更好的东西时,至少有两个约束。第一是技术基础,也就是模型本身。第二是你对这个领域问题理解的深度——你能不能真正找到那个问题,这往往才是最大的前提。很多时候我们其实不理解问题,以为有了GPT就能解决一切。

规模驱动下的AI基础设施

AlphaFold 2出来的时候,有人说它是“生物学的ImageNet时刻”。这句话才真正反映了技术发展的本质。回到杰弗里·辛顿那篇里程碑式的文章,它其实就是三个东西的组合:ImageNet——有组织的数据;CNN——模型;GPU——算力。这是第一次把三者完美结合在一起的文章。而这三样东西在当时都不算新:ImageNet存在已久,CNN不是新算法,GPU更是网吧里都有。但那篇文章之后,GPU成了学术界和工业界的标准。当时他们用的不过是两块很普通的GPU卡,尽管算力已超过上万CPU核心,但中国每个网吧都有。所以,算力重要吗?重要。但在创新阶段,没有什么比人的创造力更重要。

为什么会引出“基础设施”这个概念?答案就在于“规模”二字。当数据、模型、算力的规模都发生质变时,一定要引入全新的东西才能解决问题。Pascal语言发明人说过一句话:婴儿速度的1000倍就是喷气机。任何东西的规模增加1000倍,就会发生天翻地覆的变化。今天,这三个组合的每一个单元都增长超过1000倍。正是这个量级,让我们绕不开AI基础设施。

一旦谈到基础设施,这其实是技术渗透的终极形态。人类历史上,什么技术对人类社会产生最长远的影响?答案是那些变成基础设施的技术。

红杉资本有一次研讨会上用的幻灯片很有意思,它把云计算、苹果、英伟达都划到了“基础设施”这一类。作为做云计算的人,看到这张图很激动。再看美国六家AI独角兽背后的基础设施支持:OpenAI背后是微软,第二名背后是AWS。这些企业背后的支持者,正是全世界排名第一、第二、第三、第五、第六的云计算服务商。第一、第二、第三、第五、第六都在,唯独没有第四——第四正是阿里云。这种基础设施的差距,某种程度上也反映了产业之间的差距。

这让我想起另一句话:微软很不行,但微软也很行。它没做出Transformer,但它有云,有基础设施。它和OpenAI一起创造出了今天我们看到的东西。在AI、AI+和AI基础设施这个逻辑下,每个人都可以做创造历史的事。

前几天看到一个创业公司画的图,很有意思。它区分了传统IT时代的云计算和AI时代的云计算,以及传统意义上的数据和AI意义上的数据。图中特别强调了:数据是基础设施的核心组成部分。数据不只是模型的附属品,也不只是计算的附属品。只有当所有这些东西结合成一个完整的基础设施时,才会有更激动人心的创新。

回到开头那句话:当你看AI、AI+和AI基础设施时,你会发现这个世界不但技术在革命,机制也在革命,基础设施也在革命。没有比这三项革命在同一个时间发生更令人激动的事情了。这些革命,正在创造未来。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:王坚院士外滩大会演讲全文实录要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/LargeLanguageModel/2024090710247.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-05-30 13:47
Qwen 2.5开源版API价格降至一折

阿里开源Qwen2 5全家桶,涵盖0 5B至72B语言模型及代码、数学专用模型。API价格大幅下调,Turbo输出降至原价一成。72B开源领先,3B性能媲美Llama-38B,Coder7B超越更大模型,Math新增中文支持与多路径推理。该系列模型性能全面,开源社区反响热烈。

AI热点2026-05-30 13:47
如何用豆包AI设计市场调研问卷题目

相信不少人在使用豆包这类AI工具来设计市场调研问卷时,都会遇到一些尴尬的情况:生成的题目类型翻来覆去就那么几样,题目之间的逻辑跳来跳去让人摸不着头脑,或者问了一大圈才发现核心维度压根没覆盖到。别急着把锅全甩给AI,问题往往出在初始指令没有锚定好调研目标和用户分层。下面分享四个经过实战检验的方法,可以

AI热点2026-05-30 13:46
微调大模型如创业:稍有不慎即变笨

微调大语言模型可能导致模型丧失原有能力,变成只会输出特定格式的“傻子”。关键在于训练数据必须同时包含有效指令和所需格式。相比微调,检索增强生成(RAG)更简单高效,必要时可结合两者。换基础模型会带来新问题,需在验证集上测试多种方法择优。

AI热点2026-05-30 13:46
海螺AI生成文案AI味太重?去AI化与人性化表达建议

有不少读者私信问我,为什么海螺AI生成的文案总是一眼就能看出是机器写的?其实答案并不复杂——模型输出的文本过于“干净”了,缺少人类写作特有的那种毛边感和节奏变化。经过一段时间的实战摸索,我总结了五个具体方法,能有效去除AI痕迹,让文字重新拥有生命力。 一、替换抽象词汇为具体场景描述 AI生成内容有一

延伸阅读