面包屑图标 当前位置: 首页
AI资讯
热点详情

李宏毅3分钟揭秘AI Agent从原理到应用

AI热点日报
AI热点日报时间:2026-07-05
热点解读

AI Agent 到底是什么?李宏毅老师用一堂课讲透了。从底层原理到实际应用,从强化学习到LLM驱动的智能体,这篇笔记帮你一次性理清。先看一个核心框架:任何智能体都遵循“目标→观察→行动”的循环——行动改变环境,产生新观察,循环往复直到目标达成。比如AlphaGo,目标就是赢棋,观察棋盘局面,行动是

AI Agent 到底是什么?李宏毅老师用一堂课讲透了。从底层原理到实际应用,从强化学习到LLM驱动的智能体,这篇笔记帮你一次性理清。先看一个核心框架:任何智能体都遵循“目标→观察→行动”的循环——行动改变环境,产生新观察,循环往复直到目标达成。比如AlphaGo,目标就是赢棋,观察棋盘局面,行动是落子。道理很简单,但背后的技术演进却很有意思。

揭秘AI Agent!李宏毅老师3分钟带你飞速穿梭AI前沿,从原理到应用,一文读懂智能体的无限可能!

传统AI Agent依赖强化学习(RL),但RL有一个硬伤:每个任务都需要单独训练一个模型,成本极高。于是研究者们开始打LLM的主意——直接用大语言模型来当智能体的“大脑”,思路一下子打开了。

一、AI Agent 的基本运作原理

核心循环:目标 (Goal) → 观察 (Observation) → 行动 (Action)。行动作用于环境,环境产生新观察,循环继续,直到目标达成。这个框架在AlphaGo身上体现得淋漓尽致。

传统上,AI Agent依赖强化学习算法,但RL的局限性很明显——每个任务都得单独训练模型,泛化能力差。新思路的出现彻底改变了局面:直接用LLM充当AI Agent。

二、LLM 作为 AI Agent

运作方式变成:目标用文字描述,环境也转化为文字(或直接输入图像),行动同样是文字描述,只不过需要转译成可执行的指令。核心逻辑很简单:LLM本质上是文字接龙,AI Agent就是这种能力的一种应用。

回顾一下历史:2023年春季曾掀起一波AI Agent热潮(AutoGPT),但实际效果远未达到预期。不过方向是对的——LLM带来的优势太大了:行动可能性近乎无限,不再被预设行为限制;而且无需定义 Reward,直接提供错误日志之类的丰富信息就行。

三、AI Agent 实例

  • AI 村民:斯坦福小镇项目,模拟人类社交行为
  • AI 使用电脑:Claude Computer Use、ChatGPT Operator 等
  • AI 训练 AI 模型:Google 的 co-scientist 等

四、更即时的互动

核心需求是根据环境的实时变化立刻调整行动。典型的应用场景是语音对话——你得一边听一边想怎么回,不能等全部听完再反应。

五、AI Agent 的关键能力剖析

(一)根据经验调整行为

传统方法需要调整模型参数(本课程不涉及细节)。而LLM的能力在于:直接提供错误信息,无需调参就能改变行为。关键问题来了:如何有效管理和利用过去的经验?

解决方案是 Memory 机制,包含三个模块:

  • Read 模块:从 Memory 中筛选与当前问题相关的经验(类似 RAG 技术)
  • Write 模块:判断哪些信息值得记录下来
  • Reflection 模块:对记忆做抽象和整理,建立经验之间的联系(类似 Knowledge Graph)

(二)使用工具

工具的定义很宽松:只需要知道怎么用,不需要了解内部原理。常用工具包括搜索引擎、程序(LLM自己编写)、其他AI模型。本质上就是 Function Calling(函数调用)。开发者的角色就是搭桥,把工具指令转化为实际的函数调用。

具体工具举例:搜索引擎(RAG)、LLM自己编写程序作为工具、其他AI模型作为工具(比如文字模型调用语音识别或情绪识别模块来处理语音)。大模型和小模型协同工作也是常见套路。

但风险也显而易见:过度相信工具可能导致错误。这里有一个关键问题——内部知识和外部知识冲突时怎么办?LLM 会在自己的“信念”和工具返回的外部结果之间权衡。外部信息与 LLM 信念差距越大,LLM 越不容易采纳。而 LLM 对自己信念的信心程度,也会影响它是否会被外部信息动摇。

(三)做计划

目前的现实是:传统LLM的规划能力介于“有”和“没有”之间。要强化规划能力,可以通过与环境互动探索(Tree Search),切除没有希望的路径。但缺点很明显——有些动作不可逆。解决方案是“脑内模拟”(World Model),在思维中模拟环境变化。DeepSeek-R1 等思考模型就有类似效果。不过风险同样存在:过度思考可能导致停滞不前,甚至直接放弃。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:李宏毅3分钟揭秘AI Agent从原理到应用要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/LargeLanguageModel/2025032846519.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-05 17:22
craftygform自动生成Google表单

提起在线表单工具,大多数人会立刻想到Google Forms——功能全面、免费且操作简便。然而,每次从零开始创建表单往往伴随着大量重复性工作:逐一设置字段、调整布局、配置逻辑条件……假如有一款工具能根据你的需求“智能生成”表单,效率将得到质的飞跃。 它适合谁? 无论是希望快速获取客户反馈的产品经理,

AI热点2026-07-05 17:22
AI自动将表单和图像转换为Excel表格

将表单和图片转换为Excel表格?如今借助AI技术,这一过程已实现自动化,并且识别精度相当出色。 什么是FormToExcel? 简而言之,FormToExcel 是专门处理纸质文档数据的强大工具。它能够从PDF、JPG、BMP等格式的文件中,将表单、表格、收据和发票直接转换为您需要的Excel电子

AI热点2026-07-05 17:22
Riffo AI智能文件重命名与工作区管理工具

在日常数字文件管理工作中,许多用户都会遇到这样的难题:文件命名杂乱无章、散落在不同位置,查找起来既费时又低效。Riffo 正是为破解这一痛点而诞生——它是一款基于人工智能的智能文件重命名与整理工具,专为摄影师、设计师以及其他需要高效管理素材的专业人士打造,旨在显著节省时间、提升工作流程效率。 什么是

AI热点2026-07-05 17:22
日常智能工具提升效率创造业务价值

在数字化工具层出不穷的当下,能够真正覆盖多场景需求的集成平台屈指可数。Berack AI 精准瞄准了这一市场空白——它并非单一功能的聊天机器人,而是一套面向现代工作流程的全方位生产力工具集。 哪些场景用得上 从社交媒体管理到市场营销,从内容创作到SEO优化,再到YouTube视频制作、自由职业者接单

延伸阅读