大模型如何重塑世界从ChatGPT革新谈起
人工智能的每一次实质性飞跃,从来都不是在原有轨道上的简单加速,而往往是对旧有逻辑与模式的一次彻底超越。
回顾过去,受限于技术框架,上一代AI的商业化落地大多只能聚焦于高度定制化的“点到点”服务。这种模式下,AI生产力的释放相当有限。当算法和算力陷入内卷,许多公司都面临着硬件成本飙升与技术创新的边际效益递减的双重困境。
然而,以ChatGPT、GPT-4为代表的新浪潮,彻底改变了游戏规则。大模型展现出的解决多项任务的通用能力,在有效控制成本的同时,显著提高了应用效益,让人们第一次清晰地看到了AI大规模、普惠化落地的可行性。通用人工智能(AGI)的潜力不再遥不可及。智能生产力的闸门被打开,我们正步入一个全新的AI时代。这很像历史上的工业革命,大模型作为核心引擎,将被广泛应用于各行各业,带来生产力的巨大跃升,并深刻重塑我们的生活方式。
如今,无论身处哪个行业,大模型都是无法回避的焦点。一条全新的起跑线已然划下,大模型拉开了模型即服务(MaaS)时代的序幕。在这个充满可能性的新起点上,每个人都想参与其中,也似乎都能找到自己的角色。
为了汇聚全球顶尖智慧,前瞻GPT与AI的未来发展图景,相关机构将于8月14日至15日在新加坡举办第七届GAIR全球人工智能与机器人大会。会议前夕,我们与三位将出席大会的行业领军者——黄学东、周伯文、何晓冬进行了一场深度对话。透过他们的视角,大模型所撼动的竞争格局与持续迭代的市场脉络,显得更为清晰。
这三位专家背景深厚:黄学东,计算机领域首位由中国大陆高校培养的美国双院院士,现任Zoom CTO,曾担任微软云与人工智能部首席AI技术官;周伯文,清华大学电子工程系长聘教授,曾任IBM Research美国总部人工智能基础研究院院长,京东集团高级副总裁;何晓冬,京东集团副总裁、大模型负责人,其团队在跨模态注意力机制研究上贡献卓著。

(从左至右:黄学东、周伯文、何晓冬)
在科技以人为标杆的演进中,我们期待大模型能推动AI普惠,缩小“智能时代”的技术鸿沟。以下是对话中提炼出的核心观点分享。
一场大模型的起跑
以ChatGPT为标志,大模型的技术研发与应用探索进入了全新阶段。据统计,国内已发布的大模型产品超过80个,覆盖不同行业与场景。各大厂商与研究机构纷纷投入资源竞赛,“百模大战”的帷幕已然拉开。
问:去年11月,ChatGPT引发了全球震动,各位对此有何感受?
黄学东指出,OpenAI的历史性突破,在于真正把“对话”这件事做成了。他回忆,早年陆奇在微软就曾强调“Chat”的重要性并提出“Chat as service”概念,但受限于当时的技术,项目难以落地。
周伯文则从认知科学角度给出了解读。他引用诺贝尔奖得主卡尼曼的“系统1”(快思考)与“系统2”(慢思考)理论,认为过去AI多被用于“系统1”的直觉型任务,而其真正价值应在于辅助人类完成“系统2”的复杂逻辑推理。ChatGPT的出现验证了这一可能性,意味着AI能帮助发现新知识,进而设计出更好的AI,形成一个创造性的增强回路。
何晓冬的观点聚焦于“效果”而非“形态”。他认为,人机对话等基础形态早已被设想,关键在于效果能否达标。ChatGPT之所以惊艳,正是因其对话效果实现了质的飞跃,这为导购、客服等衍生形态的应用奠定了坚实基础。
问:大模型的源头离不开Transformer架构,它的创新之处何在?
周伯文强调,Transformer的核心在于自注意力机制与多头机制,它有效解决了模型的长距离依赖问题。他对比了GPT与BERT的路径差异:BERT利用双向信息进行表征学习,而GPT坚持用过去信息预测下一个词。当用海量数据充分训练后者时,AGI的曙光便显现出来。如今,模型中带“T”的,大多指向了Transformer。
何晓冬补充道,当前语言的飞跃已实现,但视觉等多模态的完全崛起还需时日。以优势模态带动其他模态涌现是主流探索方向,其中“视觉+语言”因数据丰富且重要而备受关注。这一过程未必最终沿用Transformer架构,但相关的基础性探索已在路上。
问:GPT带来的自然语言交互方式,意义何在?
何晓冬分析,GPT-4相比GPT-3的最大进步在于对话能力的深化,而非单纯的多模态。它在知识深度、意图理解和多轮对话记忆上表现更优,正确率显著提升。
周伯文则阐述了AI与人类协同演进的本质。他认为,生成式AI爆发后,通过与人交互学习的AI会越来越强。AI发现新知识,新知识反哺AI系统设计,形成良性循环。为此,他提出以“可信赖AI”为基底,聚焦“多模态表征交互、人机协同演绎、环境协同演化”的研究方向,核心目标是实现人机的协同共创。
追求创新,而非复制方法论
回溯历史,战略远见与组织协同往往孕育重大创新。2014年纳德拉执掌微软后,推动“移动为先,云为先”战略,奠定了业务向企业服务与云端转型的基石。2018年左右,微软内部进一步深化云与AI的融合,相关团队整合至云与人工智能事业部,为后续云业务接入ChatGPT提供了组织与能力保障。2019年,微软投资OpenAI,Azure成为其独家云服务商,双方合力最终引爆了市场。
问:为什么是OpenAI取得了突破?与微软的投资有关吗?
黄学东从自身经历出发,坦言大模型没有强大的算力(如GPU)支撑根本“玩不转”。OpenAI的显著特征是“大”,而“大”需要巨大的工程化能力与资源支持。他自豪地表示,支持OpenAI的Azure AI平台由其团队推动孵化并实现商业化,今年已开始盈利。他认为,微软的资金支持固然关键,但OpenAI团队本身的理想主义与强大工程能力同样不可或缺。
何晓冬分享了七年前的类似探索。其团队曾遵循“论文-公众产品-产品迭代”的三步走路径,并一度取得用户量破百万的成绩,但最终因推进速度等问题未能形成规模效应。对比之下,OpenAI与微软的协作展现了新趋势:产品开发与技术研究深度融合,迭代速度极快,ChatGPT发布仅半年便全面接入微软核心产品线。
周伯文从多维度分析了OpenAI的成功:顶尖的技术判断(如Ilya Sutskever)、卓越的工程实现(如Greg Brockman)、强大的资源整合(如Sam Altman)以及对伦理社会的全面考量。他特别提到,OpenAI选择用GitHub代码训练思维链,因为程序语言的逻辑极其严谨,这体现了其不盲目出击的特质。在商业上,通过建立生态、宣布新摩尔定律、大幅降低API价格等策略,成功拓展了市场想象空间。
从场景中来,到产品里去
一项技术创新要深入产业,离不开其通用性与自动化生产能力。然而,基础大模型在应对细分场景的特定需求时,常面临“牛刀小用”的窘境,存在准确率不足、能力不匹配等问题。在业界需求井喷的当下,如何落地、从何处切入,成为AI发展的关键方向。
问:客观上看,国内大模型在语言能力上与国外仍有差距,如何看待?
黄学东的回答言简意赅:差距需要时间追赶,成败在于细节。
何晓冬指出,ChatGPT的强项在于广度而非深度。在金融等专业领域,必须与行业知识结合并经实战磨练。一个有趣的观察是,今天的ChatGPT已不再追求通过图灵测试“欺骗”人类,它会坦然告知自己是语言模型,这恰恰是技术进步并开始转化为生产力的体现。
周伯文从创业视角出发,认为在掌握通用技术后,培育垂直领域的专业能力至关重要。GPT的突破主要在通用性,其对特定行业的价值有待深挖。他以电商为例,看到了用AI动态匹配消费者需求与产品设计的巨大商机,这正是其创业方向——打造垂直行业的通用大语言模型,以改变传统的购物路径。
问:从产品与应用角度看,大模型落地的主要难点是什么?
周伯文以消费场景详解。消费者行为符号背后是复杂的情感与选择逻辑,而商家往往难以洞察真实需求。大模型的价值在于打通需求侧与供给侧的所有业务链条,将信息高保真地压缩进一个通用模型,从而赋能企业从机会发现、产品设计到营销转化的全周期。核心难题正在于此。
何晓冬认为,应用需求反向牵引科学研究是计算机领域的常态。以大模型研究贴近落地,对科学是促进而非限制。他以多模态大模型为例,指出当前落地的一大挑战在于模型的可控性,特别是对细节的理解与生成控制,例如AI绘画在手指等细节上仍需反复生成筛选。
问:如何看待大模型的未来趋势?
黄学东笃信语音交互是未来。他回顾了从IBM早期语音研究到机器翻译的历史,指出GPT本质是语音交互的延伸。他对Siri、智能音箱等早期探索表示认可,同时指出成功需要算力、产品、工程化能力的完美结合,是项复杂的“工艺”。
周伯文展望,未来定义明确、高价值的工作流程将由专业AI模型完成。从垂直场景成功切入,再反哺提升通用基础能力,是更务实的路径。因此,底层框架需兼具通用基础能力、科学评估方法与专业训练。
何晓冬最后将视角回归到“人”。他指出,通用人工智能(AGI)始终以人为标杆,服务的核心是人而非将人边缘化。多模态既是实现AGI的路径(向人多模态学习),也是必然要求(未来人机交互是多模态的)。他认为,多模态大模型的“ChatGPT时刻”尚未到来,可能还需要数据、算法或时间上的进一步突破。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
阿里钉钉文档全功能解析在线协同办公套件使用指南
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
商汤小浣熊智能助手基于自研大语言模型
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
MiniMax新一代智能模型矩阵全面解析与应用指南
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
智能客服机器人解决方案:AI客服系统提升企业服务效率
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练
开源企业答疑工具Danswer:高效解决团队知识管理难题
Danswer 是一款专为企业设计的开源智能问答平台,支持用户使用自然语言直接提问,并能够从公司内部文档、知识库等私有数据源中快速检索,提供带有精准来源引用的可靠答案。 核心功能:它如何解答问题? Danswer 的核心价值在于实现了“智能问答”。用户无需再花费大量时间手动搜索和翻阅各类文件,只需像
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

