ICLR 2025 顶尖科学家关注的十大人工智能趋势

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

ICLR 2025 顶尖科学家关注的十大人工智能趋势

热心网友时间：2026-05-16

转载

自GPT-4发布以来，人工智能领域持续高速演进，我们正处在一个技术范式快速更迭的关键时期。从Anthropic推出MCP协议推动AI生态互联，到GPT-4o与GPT-4.1在短期内大幅提升上下文理解能力，再到国内DeepSeek通过FP8混合精度训练实现突破，以及Manus发布通用智能体平台……技术创新的周期正在不断缩短。

在众多前沿方向并行发展的当下，如何准确把握AI行业的真实趋势与核心挑战？

近期，一场聚焦“2025年ICLR前沿趋势”的线上学术沙龙汇聚了多位顶尖学者的见解。南洋理工大学安波教授、浙江大学赵俊博研究员、清华大学赵昊助理教授以及埃默里大学刘菲副教授，围绕大模型决策系统、智能体前沿、缩放定律演进及新模型架构等关键议题，进行了深度探讨。

讨论中一个核心议题是：驱动大模型发展的“缩放定律”（Scaling Law），是否已接近其效能边界？

Scaling Law：面临瓶颈还是开启新阶段？

随着“巨量参数+海量数据”模式逐渐成熟，一个现实挑战日益凸显：人类生成的高质量文本数据即将耗尽。近期，AI领域权威专家联合发表论文指出，从人类数据中汲取知识的方法正快速接近极限。

赵俊博研究员对此给出了具体数据支撑：“人类产出的最高质量文本数据总量约在10-15万亿token之间。像DeepSeek-V3这样的模型已消耗近15T数据。若引入部分高质量合成数据并适当放宽质量标准，或许能扩展至25-30T，但此后数据增长将极为困难。”

这或许标志着，单纯依靠扩大数据与算力来构建通用人工智能的路径遇到了首道屏障。当这条传统路径动力减弱，算法与架构层面的创新便成为突破的关键。

刘菲副教授提出了一个新颖视角：数据分配策略的优化。“目前基础模型预训练阶段通常纳入所有可用数据，而后训练阶段才使用领域专用数据。我们能否探索更优的数据分配方案，在预训练与后训练间取得平衡，从而最大化模型效能？”

此外，训练任务本身的创新也蕴含巨大潜力。大语言模型始终以“下一个词预测”为核心目标。刘菲提出：“能否通过设计新的训练目标，专门增强模型的后训练适应性或在垂直领域的能力？”

以下是本次圆桌讨论的核心观点梳理。

技术快速迭代：从ICLR看AI发展现状

今年ICLR大会给与会者的普遍印象是：规模空前，热度攀升。

赵俊博研究员感慨，这个源自纽约大学实验室的会议，十一年间已发展成为全球顶级AI盛会。“最直观的感受是人流密集、论文数量激增、会场规模扩大。海报展示环节已被压缩至两小时，节奏非常紧凑。”

安波教授印证了这一观察：“今年注册排队就需要一小时，通道时常拥挤。这恰恰证明了会议的高质量与吸引力。”刘菲副教授则注意到，大量金融科技公司成为本届会议赞助商，这或许预示了大模型在金融等垂直行业的商业化落地将加速。

谈及令人印象深刻的研究，赵昊助理教授提到了满分论文“IC light”。“这项工作在扩散模型中实现了精准的光照控制，具有重要意义。当前图像生成在物理可控性上普遍较弱，而IC light在光照建模上的突破，使其成为许多后续研究的基础工具。”

刘菲教授分享了她关注的决策系统进展。“例如，用大模型辅助选购咖啡机这类简单决策已较为成熟，但像子女升学择校这类涉及多因素、长序列的复杂决策，系统仍缺乏透明度和可靠性。”她特别提及安波教授团队的“Agent Studio”，这是一个助力开发者构建与评估智能体的开源平台。

安波教授则关注大模型在复杂现实场景中的推理短板。他分享了一个测试案例：让GPT分析新加坡火灾现场图片并制定应急计划，结果模型忽略了附近就有儿科医院的关键信息。“如何让模型融合多模态信息（如视频、音频、建筑图纸）进行综合推理，以解决真实世界问题，仍是长期挑战。”

赵俊博研究员指出了学术研究周期与产业快速演进之间的脱节。“ICLR论文从投稿到发表约有半年周期。但自去年10月截稿以来，行业已涌现GPT-4.5、MCP、GPT-4o、DeepSeek等一系列进展。传统学术会议的节奏，似乎难以跟上技术变革的速度。”

模型架构演进：自回归与扩散模型谁主沉浮？

当前，自回归架构与扩散模型在生成式AI领域形成两种主流技术路线，未来架构将如何演化？

赵俊博研究员表达了对扩散模型理念的看好。“我关注的不仅是用于图像生成的扩散模型，更是‘扩散’这一数学框架的潜力。它可以应用于多种数据形态。”他举例说明了扩散模型与自回归模型结合的可能性，例如在坐标空间进行扩散以完成复杂推理。“扩散模型擅长处理高维、多模态分布，打破了自回归的序列限制。尽管扩散语言模型尚未显现明确的缩放规律，但其前景广阔。”

安波教授的态度则更为审慎。“若其优势如此显著，大型科技公司理应全面转向。短期内取代Transformer架构的可能性较低。”

刘菲教授从自然语言处理角度分析：“对于文本这类强序列数据，自回归仍是主流。但其序列生成特性导致推理时无法并行。因此，探索扩散与自回归的混合架构，或研究RNN等变体，都是值得尝试的方向。”

赵昊助理教授认为需区分应用场景。“若仅考虑纯视觉任务（如图像、视频生成），未来一两年可能更倾向自回归思路，因其推理速度优势明显。但对于多模态大模型，如何将不同粒度的视觉信息有效映射到语言空间，仍是开放问题。这两条技术路径可能会长期并存发展。”

智能体（Agent）发展：从理论概念到实际应用

智能体无疑是当前AI领域最受关注的方向之一，但其迈向实用化仍面临诸多挑战。

赵昊助理教授介绍了一个新兴交叉领域：基于区块链的多智能体协同。“我们正在研究利用区块链的Merkle-Tree数据结构，为机器人集群构建可信的加密协作框架。这能确保智能体在协同工作时，既能完成目标，又无需暴露全局信息，从而提升系统安全性与抗干扰能力。”

刘菲教授分享了她团队的两项工作。一是“HARBOR”系统，一个考虑个性化与竞争关系的多智能体框架。“设想未来每人拥有专属AI助手。在竞争性场景（如求职）中，如何让智能体在理解个人偏好的同时，做出最具竞争力的决策？”二是对现有规划系统的综述研究“PlanGenLLMs”，旨在建立更统一的智能体能力评估标准。

她特别指出智能体落地面临的两大瓶颈：鲁棒性与安全性。“许多系统的任务成功率远未达到实用门槛（如90%-95%）。在安全性方面，例如代码生成中，模型可能因‘幻觉’调用不存在的库，若该库名被恶意注册并植入恶意代码，将引发严重安全风险。”

安波教授从宏观决策视角审视智能体发展。“要构建能解决复杂现实任务的智能体，强化学习与大模型的深度融合至关重要。当前模型决策多基于静态数据模仿，而要适应动态、未知环境，必须引入能与环境实时交互、持续学习的强化学习机制。”他回顾了多智能体系统从传感器网络、分布式规划到深度学习与大模型驱动的演进历程，指出动态环境下的高效协同仍是核心难题。

对于“通用智能体”这一热门概念，安波教授认为这无疑是AI的长期目标，但道路漫长。“即便当前AI已在特定领域（如数学）取得突破，但要实现真正的通用智能体，所需时间可能远超十年。”

赵俊博研究员观察到市场的双重性。“相关创业公司在2025年将持续增加。像Manus这类产品，虽然在功能完备性上尚有不足，但在交互体验上带来了创新。这个领域必然存在泡沫，但产业界的积极探索是真实的，生态版图今年将继续扩张。”

未来方向：AI如何实现能力跃迁？

圆桌最后，专家们展望了提升AI系统智能水平的潜在路径。

赵昊助理教授聚焦机器人领域。“我认为通过生成高质量、高可控性的仿真数据来训练机器人，是重要方向。当前机器人的主要瓶颈可能并非‘大脑’的智力，而是‘小脑’的灵巧性——在物理世界中的精细操控与实时反应能力仍有巨大提升空间。”

刘菲教授强调了基础模型的基石作用。“一个强大且稳健的基础模型，是所有后续长上下文扩展、强化学习微调及多模态能力延伸的基础。未来关键方向之一，便是在中等参数量级（如700亿参数）上，将预训练做到极致。”此外，她认为模型安全性研究，以及AI在科学计算、教育、金融等交叉领域的突破性应用，将是未来半年的重点。

安波教授再次回归其核心研究方向：决策与推理。“无论是推理技术的改进，还是多智能体协同机制的优化，要让AI系统在未知、动态场景中保持稳定可靠的性能，仍是极具挑战的课题。我们仍需持续探索。”

赵俊博研究员以“谨慎乐观”作为总结。乐观之处在于，大模型的后训练技术路径正逐渐清晰，今年在数据多样性、算法优化及计算基础设施方面仍有挖掘潜力。挑战则在于，诸如长文本处理等系统级问题仍需攻克。“技术变革速度太快，或许要到2025年底，我们才能看清新的产业格局究竟如何形成。”

人工智能的技术浪潮持续奔涌，关于缩放定律、架构创新与智能体未来的探讨远未结束。可以确定的是，对于更高效、更智能、更实用AI系统的追求，这场技术远征正步入最为关键的阶段。

参考文档：

1.https://arxiv.org/pdf/2502.12149

2.https://arxiv.org/pdf/2502.11221

来源:https://www.leiphone.com/category/ai/aTUexELzPx0NHlV1.html

上一篇：字节跳动欧洲AI研发中心启动招募计划

下一篇：朱哲清解析RL智能体架构：AI产品的骨骼与神经设计