大模型如何重塑世界从ChatGPT革新谈起

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

大模型如何重塑世界从ChatGPT革新谈起

热心网友时间：2026-05-15

转载

人工智能的每一次实质性飞跃，从来都不是在原有轨道上的简单加速，而往往是对旧有逻辑与模式的一次彻底超越。

回顾过去，受限于技术框架，上一代AI的商业化落地大多只能聚焦于高度定制化的“点到点”服务。这种模式下，AI生产力的释放相当有限。当算法和算力陷入内卷，许多公司都面临着硬件成本飙升与技术创新的边际效益递减的双重困境。

然而，以ChatGPT、GPT-4为代表的新浪潮，彻底改变了游戏规则。大模型展现出的解决多项任务的通用能力，在有效控制成本的同时，显著提高了应用效益，让人们第一次清晰地看到了AI大规模、普惠化落地的可行性。通用人工智能（AGI）的潜力不再遥不可及。智能生产力的闸门被打开，我们正步入一个全新的AI时代。这很像历史上的工业革命，大模型作为核心引擎，将被广泛应用于各行各业，带来生产力的巨大跃升，并深刻重塑我们的生活方式。

如今，无论身处哪个行业，大模型都是无法回避的焦点。一条全新的起跑线已然划下，大模型拉开了模型即服务（MaaS）时代的序幕。在这个充满可能性的新起点上，每个人都想参与其中，也似乎都能找到自己的角色。

为了汇聚全球顶尖智慧，前瞻GPT与AI的未来发展图景，相关机构将于8月14日至15日在新加坡举办第七届GAIR全球人工智能与机器人大会。会议前夕，我们与三位将出席大会的行业领军者——黄学东、周伯文、何晓冬进行了一场深度对话。透过他们的视角，大模型所撼动的竞争格局与持续迭代的市场脉络，显得更为清晰。

这三位专家背景深厚：黄学东，计算机领域首位由中国大陆高校培养的美国双院院士，现任Zoom CTO，曾担任微软云与人工智能部首席AI技术官；周伯文，清华大学电子工程系长聘教授，曾任IBM Research美国总部人工智能基础研究院院长，京东集团高级副总裁；何晓冬，京东集团副总裁、大模型负责人，其团队在跨模态注意力机制研究上贡献卓著。

（从左至右：黄学东、周伯文、何晓冬）

在科技以人为标杆的演进中，我们期待大模型能推动AI普惠，缩小“智能时代”的技术鸿沟。以下是对话中提炼出的核心观点分享。

一场大模型的起跑

以ChatGPT为标志，大模型的技术研发与应用探索进入了全新阶段。据统计，国内已发布的大模型产品超过80个，覆盖不同行业与场景。各大厂商与研究机构纷纷投入资源竞赛，“百模大战”的帷幕已然拉开。

问：去年11月，ChatGPT引发了全球震动，各位对此有何感受？

黄学东指出，OpenAI的历史性突破，在于真正把“对话”这件事做成了。他回忆，早年陆奇在微软就曾强调“Chat”的重要性并提出“Chat as service”概念，但受限于当时的技术，项目难以落地。

周伯文则从认知科学角度给出了解读。他引用诺贝尔奖得主卡尼曼的“系统1”（快思考）与“系统2”（慢思考）理论，认为过去AI多被用于“系统1”的直觉型任务，而其真正价值应在于辅助人类完成“系统2”的复杂逻辑推理。ChatGPT的出现验证了这一可能性，意味着AI能帮助发现新知识，进而设计出更好的AI，形成一个创造性的增强回路。

何晓冬的观点聚焦于“效果”而非“形态”。他认为，人机对话等基础形态早已被设想，关键在于效果能否达标。ChatGPT之所以惊艳，正是因其对话效果实现了质的飞跃，这为导购、客服等衍生形态的应用奠定了坚实基础。

问：大模型的源头离不开Transformer架构，它的创新之处何在？

周伯文强调，Transformer的核心在于自注意力机制与多头机制，它有效解决了模型的长距离依赖问题。他对比了GPT与BERT的路径差异：BERT利用双向信息进行表征学习，而GPT坚持用过去信息预测下一个词。当用海量数据充分训练后者时，AGI的曙光便显现出来。如今，模型中带“T”的，大多指向了Transformer。

何晓冬补充道，当前语言的飞跃已实现，但视觉等多模态的完全崛起还需时日。以优势模态带动其他模态涌现是主流探索方向，其中“视觉+语言”因数据丰富且重要而备受关注。这一过程未必最终沿用Transformer架构，但相关的基础性探索已在路上。

问：GPT带来的自然语言交互方式，意义何在？

何晓冬分析，GPT-4相比GPT-3的最大进步在于对话能力的深化，而非单纯的多模态。它在知识深度、意图理解和多轮对话记忆上表现更优，正确率显著提升。

周伯文则阐述了AI与人类协同演进的本质。他认为，生成式AI爆发后，通过与人交互学习的AI会越来越强。AI发现新知识，新知识反哺AI系统设计，形成良性循环。为此，他提出以“可信赖AI”为基底，聚焦“多模态表征交互、人机协同演绎、环境协同演化”的研究方向，核心目标是实现人机的协同共创。

追求创新，而非复制方法论

回溯历史，战略远见与组织协同往往孕育重大创新。2014年纳德拉执掌微软后，推动“移动为先，云为先”战略，奠定了业务向企业服务与云端转型的基石。2018年左右，微软内部进一步深化云与AI的融合，相关团队整合至云与人工智能事业部，为后续云业务接入ChatGPT提供了组织与能力保障。2019年，微软投资OpenAI，Azure成为其独家云服务商，双方合力最终引爆了市场。

问：为什么是OpenAI取得了突破？与微软的投资有关吗？

黄学东从自身经历出发，坦言大模型没有强大的算力（如GPU）支撑根本“玩不转”。OpenAI的显著特征是“大”，而“大”需要巨大的工程化能力与资源支持。他自豪地表示，支持OpenAI的Azure AI平台由其团队推动孵化并实现商业化，今年已开始盈利。他认为，微软的资金支持固然关键，但OpenAI团队本身的理想主义与强大工程能力同样不可或缺。

何晓冬分享了七年前的类似探索。其团队曾遵循“论文-公众产品-产品迭代”的三步走路径，并一度取得用户量破百万的成绩，但最终因推进速度等问题未能形成规模效应。对比之下，OpenAI与微软的协作展现了新趋势：产品开发与技术研究深度融合，迭代速度极快，ChatGPT发布仅半年便全面接入微软核心产品线。

周伯文从多维度分析了OpenAI的成功：顶尖的技术判断（如Ilya Sutskever）、卓越的工程实现（如Greg Brockman）、强大的资源整合（如Sam Altman）以及对伦理社会的全面考量。他特别提到，OpenAI选择用GitHub代码训练思维链，因为程序语言的逻辑极其严谨，这体现了其不盲目出击的特质。在商业上，通过建立生态、宣布新摩尔定律、大幅降低API价格等策略，成功拓展了市场想象空间。