何宝宏认为大语言模型上半场已进入垃圾时间

AI热点日报时间：2026-06-29

热点解读

过去一年里，大语言模型领域的竞争态势变得颇为微妙。中国通信院云计算与大数据研究所所长何宝宏在第十九届中国IDC产业年度大典上，提出了一个相当犀利的观点：大语言模型的竞赛上半场，实际上已迈入“垃圾时间”。训练效果普遍未能达到预期，能力提升的步伐也明显放缓，进入了瓶颈期。观察行业的风向标，不难发现：Op

过去一年里，大语言模型领域的竞争态势变得颇为微妙。中国通信院云计算与大数据研究所所长何宝宏在第十九届中国IDC产业年度大典上，提出了一个相当犀利的观点：大语言模型的竞赛上半场，实际上已迈入“垃圾时间”。训练效果普遍未能达到预期，能力提升的步伐也明显放缓，进入了瓶颈期。

观察行业的风向标，不难发现：OpenAI的模型迭代周期显著拉长，从过去的24个月更新一次，延长至33个月，且新版本的表现并未带来足够惊艳的突破；谷歌的Gemini 2.0也呈现出仓促上阵的迹象。这些信号背后，指向一个核心困境——Scaling law，那个曾驱动大模型一路高歌猛进的“万有引力”，如今正步入减速区间，发力渐弱。

上半场“垃圾时间”：Scaling law的放缓与失效

何宝宏明确指出，大语言模型的发展已然步入“下半场”。他强调，过去一年，大模型训练效果普遍不及预期，一个关键原因就在于Scaling law正面临增速放缓甚至失效的境地。值得注意的是，Scaling law并非大模型领域的专属规律，它广泛存在于物理世界、生命体进化、城市发展、公司运营乃至计算机系统等众多复杂系统中。

所有的Scaling law，随着时间推移，最终都会走向失效。没有任何事物能够永远保持指数级增长。大模型领域不过是再次验证了这一自然法则。如果Scaling law在短期（例如0到3年内）便宣告失效，那么通往AGI的征途，或许会比我们预想的更为漫长且曲折。

既然正面突破Scaling law的瓶颈困难重重，各大研究机构开始调整策略，转向两条全新赛道：一是从训练侧转向推理侧，二是从大语言模型转向多模态模型。前者意味着从连接主义（依赖数据与经验）向符号主义（依靠逻辑与推理）的转变，本质上，这两条路径正趋向统一；后者则直指应用落地、视觉理解与分布式大模型，尽管这条道路依然崎岖，需要大量的优化与迭代工作。

2024年，大模型赛道的激烈内卷有目共睹。一个值得关注的现象是，开源模型的能力已达到GPT-3.5的80%，但训练与使用成本却仅为后者的1/20。何宝宏点出一个关键趋势：如果向前卷不动技术突破，那就转向卷工程化落地。目前的大模型仍像一件“工艺品”，需要经历更深入的工程化打磨，才能真正蜕变为成熟的产品。未来的大模型，必须在可解释性、透明度、长期推理能力以及安全可靠性上取得突破，而模型的压缩、轻量化与组件化，正是从工艺品走向工程化产品的必经之路。

竞争的底层逻辑也在发生转变：从过去单纯比拼性能，逐渐转向比拼性价比。那个疯狂堆叠算力、追求极致参数规模的时代已经过去，如今的核心命题是如何以更低的成本实现更大的商业价值。至于模型的“幻觉”问题，何宝宏的看法颇为独到：幻觉并非完全是负面因素，它恰恰是创意与创新的重要源泉。在文学、艺术与科技领域，这种“幻觉”或许能催生意想不到的灵感火花。

大模型撞上数据墙

2024年底，“大模型撞上数据墙”成为业界讨论的焦点话题。OpenAI前首席科学家Ilya也预言“预训练时代将走向终结”。何宝宏表示，这一判断与他本人的观察高度一致。

关于“大模型撞墙”的争论，有人认为预训练并未结束，数据也未被真正耗光。未来可以利用视频数据、人工智能生成的合成数据，甚至私域数据来继续训练。但何宝宏并不认同这一乐观看法。他直言，视频数据如何有效用于训练，目前尚未形成成熟的方法论；而私域数据即便体量再大，相较于互联网的海量数据来说仍属“小数据”，顶多用于模型微调，难以在全局层面上取得实质性突破。

至于合成数据，问题则更为严峻。何宝宏指出，过去30多年积累的互联网优质数据，将在未来三到五年内被消耗殆尽。如果使用AI生成的数据进行训练，反而可能导致模型性能崩溃。研究数据显示，一旦训练数据中混入1%的AI生成内容，经过五次迭代后模型便会崩溃。他甚至提出了一个颇具冲击力的观点——“互联网正在面临生死存亡的威胁”。因为AI生成的数据正以惊人的速度膨胀，而人类生产的优质数据却在快速萎缩。

下半场：Agent与智算基础设施的重构

展望未来，何宝宏认为，2025年Agent将成为最为核心的焦点。大模型正在经历它的“七年之痒”，下一步，行业重心应从大模型转向Agent。与专注于知识压缩的大模型不同，Agent是目标导向的，这既是它的突出优势，也是全新的挑战所在。

由于Agent以目标为导向，其思维方式与运作逻辑与人类传统的智能模式存在显著差异。如何确保智能体的终极目标与人类的深层意图高度一致？如何进行有效的监测与纠偏？这些问题都需要深入研究和系统解决。

在算力方面，下半场的竞争逻辑也在变化。不能只盯着高端算力，边缘算力与混合算力将变得越来越重要。整个AIDC生态正在经历重构，从Agent到大模型，再到智算基础设施，已经演变为技术密集型、资金密集型、能耗密集型与人才密集型的新模式。

最后，何宝宏给出了一个清醒的总结：从缺算力转向缺电力，从液冷技术到智力基础设施，我们需要面向未来进行长期规划。如果按照当前趋势发展，到2030年，全球20%的电力可能都会被人工智能数据中心所消耗。下一步的竞争核心，将是“智力在线”。而今天的算力基础设施，距离真正建成规模化的智算基础设施，还有相当漫长的路要走。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：何宝宏认为大语言模型上半场已进入垃圾时间要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/LargeLanguageModel/2025010640571.html

ai 人工智能

上一篇：缓存增强生成CAG或将成为RAG的终极替代方案

下一篇：IBM推出Docling文档处理利器基于LangChain打造RAG应用

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周基于人工智能的室内设计与虚拟布置平台 02 / 本周人工智能驱动客户体验管理与评论分析平台OctoparseVOC 03 / 本周Odoo CRM营销助手扩展全面功能详解与使用技巧大全 04 / 本周扎克伯格称联想基于Meta Llama大模型构建个人AI智能体AI Now 05 / 本周Booking.com房东AI智能即时回复工具

01 / 本月基于人工智能的室内设计与虚拟布置平台 02 / 本月人工智能驱动客户体验管理与评论分析平台OctoparseVOC 03 / 本月Odoo CRM营销助手扩展全面功能详解与使用技巧大全 04 / 本月扎克伯格称联想基于Meta Llama大模型构建个人AI智能体AI Now 05 / 本月Booking.com房东AI智能即时回复工具

热点快看

06-29 20:24基于人工智能的室内设计与虚拟布置平台 06-29 20:24人工智能驱动客户体验管理与评论分析平台OctoparseVOC 06-29 20:24Odoo CRM营销助手扩展全面功能详解与使用技巧大全 06-29 20:23扎克伯格称联想基于Meta Llama大模型构建个人AI智能体AI Now 06-29 20:22Booking.com房东AI智能即时回复工具

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别