面包屑图标 当前位置: 首页
AI资讯
热点详情

智能体与上下文协议MCP核心概念及重要性深度解析

AI热点日报
AI热点日报时间:2026-07-03
热点解读

Agent和上下文协议的革命性意义,带你了解AI自动化的新篇章。核心内容:1 Agent概念的起源与发展,及其在AI自动化中的关键作用2 Agent的组成:大脑、眼睛 手、工作纪要、行为SOP等3 Agent如何实现AI的类人工作和思考方式,以及其应用前景 这几天,Agent 相关的概念沸沸扬

Agent和上下文协议的革命性意义,带你了解AI自动化的新篇章。
核心内容:
1. Agent概念的起源与发展,及其在AI自动化中的关键作用
2. Agent的组成:大脑、眼睛/手、工作纪要、行为SOP等
3. Agent如何实现AI的类人工作和思考方式,以及其应用前景

这几天,Agent 相关的概念沸沸扬扬的,几乎成了AI圈最热的话题之一。

不做词义追源,单从大众认知的角度看,这事儿真正开始发酵,其实是在前年初,也就是2023年的2-3月。当时的几个标志性事件,算是给今天的讨论埋下了引线:

  • AutoGPT 等开源项目的发布:这基本上是第一波基于自然语言的AI自动化实践。你给它一个任务,它就会通过自然语言自我对话,把这个任务拆解、规划并试着去实现。你可以把它看作是后来Manus这类产品的前辈——虽然当时成功率很低,能干的事也有限,但方向已经定下了。

  • 斯坦福小镇一类的项目实践:给不同的Bot赋予不同的人格,再配上记忆窗口,让它们之间相互交流。这已经是在模拟人类社会的初步形态了。

  • 《Toolformer》论文与OpenAI的插件计划:2023年2月发表的论文《Toolformer:大模型可以教自己使用工具》,以及3月底OpenAI发布的插件计划,标志着一个重要转折——大模型从一个纯粹的“思想家”,通过对外部工具的调用,变成了一个“实干家”。

《AI 学会使用工具了》

2023年2月14日,报道自赛博禅心

由于语言的泛化,今天出现了一个有趣的现象:「Agent 是什么」这个问题,已经没有了标准定义。

一个比较常见的认知是:Agent,就是让AI以类似人的工作和思考方式,来完成一系列任务。一个Agent可以是一个Bot,也可以是多个Bot的协作。这就像职场里,简单的工作可以独立完成,复杂的工作则需要团队协作。

具体到每个Bot,通常会包含以下四个核心组件:

  • 一个大脑:负责判断和规划行为。这里通常需要GPT-4或更高水平的LLM来支撑。

  • 眼睛和手:负责确认信息和使用外部工具。一般对应的是各种插件、Actions或API。

  • 工作纪要:负责储存已经发生的事。常见的媒介包括上下文窗口、一个todo文件,或者是数据库。

  • 行为SOP:明确这个Agent的身份、任务、目标和运行机制。这个SOP可能是用户提供的,也可能由其他Bot生成。

说得再具体一点,这里从GPTs里截了个图,能更直观地展示:

GPTs,通常被认为是OpenAI设计的最简版Agent。在默认情况下,它只支持单Bot交互:

  • 一个大脑:在ChatGPT的GPT Store里,GPT-4是唯一可选的大脑。

  • 眼睛和手:可以在Capabilities里勾选OpenAI提供的第一方能力,也可以通过Actions来拓展外部能力。

  • 工作纪要:一般来说就是对话记录,GPTs可以回顾之前的对话。

  • 行为SOP:存放在Description、Instructions以及Knowledge里。

在这里,大脑要连接眼睛和手,需要一种“神经信号”——在代码世界里,它被称为协议

最早的协议是OpenAI的Plugin协议,发布于差不多两年前的这个时候,当时是定向邀请制。之后,Anthropic在去年发布了MCP协议,一个公开的版本。

当时也做了一个简评:

类比来说,可理解为 Claude 桌面版的插件系统(类比 OAI 去年3月的发布),不同点在于:

- Claude 的插件,暂还不能共享

- 只能在「Claude 桌面版」(网页版不行)、「Zed」、「Cody」里面使用

- 没有更新到接口(仍然没有正式的 Function Calling / JSON Mode / Sturctured Output)

- 早期版本,很多东西还是饼,比如 Sampling

从进步的角度看,它一定程度上解决了Claude不能输出结构化信息的问题:之前Claude想要结构化输出,只能靠 prompt + prefill + regex 硬凑。

下面,就让我们一起来看看这个MCP协议。

Norah Sakal写过一篇不错的介绍,这里把核心内容整理出来。

模型上下文协议(Model Context Protocol,简称MCP) 是一种全新的开放协议,专门用于标准化地为大语言模型(LLMs)提供应用场景和数据背景。

你可以把MCP想象成AI领域的“USB-C接口”——它能让不同的AI模型与外部工具和数据源轻松连接。

本文的核心目的,就是清晰地解释MCP的价值、工作原理,以及它与传统API的关键区别。

什么是MCP?

模型上下文协议(MCP) 就像是为AI模型量身定制的“USB-C接口”,可以标准化地连接AI系统与各类外部工具和数据源。

就像USB-C接口让你的电脑更容易连接各种设备一样,MCP让AI模型更简单地获取数据、工具与服务。

为什么要用MCP,而不是传统的API?

通常情况下,AI系统想要连接外部工具,需要单独整合多个不同的API。每个API都有独立的代码、文档、认证方式、错误处理和后续维护,这极大地增加了开发复杂度。

为什么说传统API就像每扇门都有一把不同的钥匙?

打个比方: API就像不同的门,每扇门都需要自己的钥匙和特定的规则。

传统的API要求开发者为每个服务或数据源单独编写代码和整合方案。

MCP背后是谁?

MCP最早由Anthropic公司开发,目的是帮助AI模型(如Claude)更容易地连接工具和数据源。

但现在,MCP已经成为一个开放协议,越来越多的企业和开发者开始采用它,这也让它逐渐成为AI与工具互动的新标准。

想深入了解?可以访问官方的MCP规格文档。

MCP与API快速对比

功能 MCP 传统API
整合难度 一次标准化整合 每个API单独整合
实时双向通信 ✅ 支持 ❌ 不支持
动态发现工具 ✅ 支持 ❌ 不支持
扩展性 即插即用 需要额外开发
安全性与控制 所有工具统一标准 每个API单独定义

MCP与传统API关键区别:

  • 单一协议: MCP像一个统一接口,只要一次整合,就能连接多个服务。
  • 动态发现: AI模型能自动识别并使用可用的工具,不用提前写死每个接口。
  • 双向通信: MCP支持类似WebSockets的实时双向通信,模型不仅能查询数据,还能主动触发操作。

为什么要有双向通信?

MCP提供实时互动,模型能:

  • 拉取数据: 模型实时查询数据,如查看你的日历
  • 触发操作: 模型主动向服务器发出指令,如重新安排会议发送邮件

MCP如何工作:架构原理

MCP采用简单的客户端-服务器架构:

  • MCP主机(Host): 如Claude桌面应用或智能开发环境(IDE),需要访问外部数据或工具。
  • MCP客户端(Client): 与MCP服务器建立一对一的稳定连接。
  • MCP服务器(Server): 提供特定功能,连接本地或远程的数据源。
  • 本地数据源: 文件、数据库或服务。
  • 远程服务: 外部API或互联网服务。

简单说,MCP像一座桥梁: 它本身不处理复杂逻辑,只负责协调AI模型与工具之间的信息流动。

实际中的MCP客户端案例

比如,一个Python脚本(client.py)作为MCP客户端,可以轻松连接MCP服务器,以控制Gmail、Slack或日历应用,无需每个工具单独编写代码。

MCP应用案例:什么时候用它?

设想下面几个场景:

1. 旅行规划助手

  • 使用 API 时: 分别为谷歌日历、邮件、机票预订写代码,繁琐而复杂。
  • 使用 MCP 时: AI助手直接通过MCP统一协议,查看日历订机票发邮件确认,无须单独整合每个工具。

2. 智能IDE(代码编辑器)

  • 使用 API 时: 手动连接文件系统、版本管理、包管理和文档,耗时费力。
  • 使用 MCP 时: IDE 通过 MCP 一次连接所有功能,带来更丰富的上下文支持,更强大的智能建议。

3. 复杂的数据分析

  • 使用 API 时: 人工管理与每个数据库、数据可视化工具的连接。
  • 使用 MCP 时: AI自动发现并连接多个数据库和可视化工具,通过统一的MCP接口轻松完成分析任务。

MCP 的好处

  • 简化开发: 一次整合,多次复用,不再重复开发。
  • 灵活性强: 轻松切换AI模型或工具,无需复杂的重新配置。
  • 实时互动: 长连接保证数据实时更新。
  • 安全可靠: 内置标准化安全和权限控制。
  • 扩展性强: AI系统扩展时,只需连接新的MCP服务器。

什么时候传统 API 更适合?

如果你的应用场景需要精准且严格受控的交互方式,那么传统API可能更合适。MCP提供广泛而灵活的动态能力,更适合需要上下文理解的场景,但不一定适用于严格受控的场合。

传统API更合适的场景:

  • 需要细粒度控制、功能严格限制;
  • 更偏好紧耦合以提升性能;
  • 希望最大化交互的可预测性。

如何开始使用MCP?

快速集成MCP的步骤:

  1. 定义能力: 明确你的MCP服务器提供哪些功能。
  2. 实现MCP层: 按照协议标准进行开发。
  3. 选择通信方式: 本地连接(标准输入输出)或远程连接(如WebSockets)。
  4. 创建资源/工具: 开发或连接你的数据源和服务。
  5. 建立客户端连接: 与MCP服务器建立安全稳定的连接。

总结

再次回顾什么是MCP:

  • MCP: 为AI模型统一连接数据与工具的标准接口。
  • API: 传统的方式,每个服务单独连接,开发更复杂。

MCP让AI与外部数据、工具的连接变得更加标准化和高效。这不仅是技术上的进步,更可能成为未来AI自动化生态中不可或缺的基础设施。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:智能体与上下文协议MCP核心概念及重要性深度解析要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/LargeLanguageModel/2025031030816.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 19:00
Daetama数据科学完整准备工作系统指南与精选学习资源汇总

Daetama是面向数据科学面试和SQL能力提升的练习平台,已收录超100个覆盖基础到进阶的SQL题目,求职板块与课程模块在开发中,团队保持每周更新节奏,提供系统性刷题与模拟面试场景。

AI热点2026-07-04 19:00
AI驱动配音平台 Speakmulti

SpeakMulti是一款AI驱动的配音平台,可将YouTube视频翻译成多种语言,保留原始说话者的音色和语调,降低本地化成本。用户提交视频并选择目标语言后,AI自动完成配音,并由专家团队审核,确保准确自然。

AI热点2026-07-04 18:59
Umi-OCR图片转文字识别软件

需求人群 如果你经常需要从图片中提取文字——例如整理截图内容、翻译图片里的外语文本、识别带有水印的图片信息——那么 Umi-OCR 无疑是一款相当实用的工具。它完全在本地运行,无需联网,对隐私保护极为友好。 产品特色 这款工具的核心亮点都集中在实用性上。截屏识别操作非常顺手,按下快捷键即可框选区域,

AI热点2026-07-04 18:59
用AI生成你最爱的画家或艺术运动风格绘画

艺术创作与人工智能的融合,正在开启一个全新的创作时代。moonlightai 正是这样一款AI绘画工具,能够帮助用户通过人工智能快速生成不同风格的绘画作品——无论你想复刻文艺复兴时期的古典优雅,还是为画作注入梵高般炽热的笔触,甚至从艾沃佐夫斯基的海浪星空中汲取灵感,它都能轻松实现。 需求人群 简单来

延伸阅读