金丹之道，炼己为先

加载中

1.Agent

1.1 什么是Agent

简单来理解就是：能够利用大语言模型的推理决策能力以及各种外部工具，解决问题的一种系统或应用

Agent的图标一般是一个机器人🤖，这就很贴切，大模型就像是霍金，头脑发达但是四肢残废，而通过给他装上手脚（各种工具），就可以自己做事了

AI Agent：就是一种可以 可以持续思考 和 可以持续调用工具 直至实现用户目标的一种智能程序

Cursor，Cline插件、Manus都可以看成一个Agent，他们有模型可以调用，还有文件读写、外部搜索、我们自定义的一些MCP Tools这些工具可以调用，帮助我们完成写代码的问题。

1.2 ReAct -- Agent架构的设计理念之一

ReAct 即 Reasoning推理和 Acting调用工具能力

Reason Only就是模型只负责推理，没有访问外部工具的能力，导致AI知识受限于模型训练的知识库大小。

Act Only就是模型只能调用工具，但不具备推理能力。

ReAct就是将推理能力和调用工具能力相结合的一种架构（这就能构成一个最简单的Agent雏形了）

2. Function Calling

广义的 Function Calling 是指让大模型能够调用外部工具的一种技术实现，就是ReAct中Acting部分：先向大模型提供可用函数(可用工具)的列表及说明，由大模型在对话过程中智能判断是否需要调用函数，并自动生成调用所需的参数，最终用文字返回符合约定格式的函数调用请求。

狭义的 Function Calling 特指大模型提供商在模型内部与 API 层面做了支持的一种能力，它最早由 OpenAI 引入 (2023年7月20号发布)：

在模型层面：模型提供商需对大模型进行特别优化，使其具备或强化其根据上下文正确选择合适函数、生成有效参数的能力（比如有监督微调、强化学习）
在 API 层面：模型提供商需额外开放对 Function Calling 的支持（比如 GPT API 中提供了一个 tools 参数）

2.1 基于提示词的Function Calling

ReAct是2022年10月才提出的，当时就是使用提示词工程来实现的函数调用。

使用提示词约束AI的返回值，然后使用特定解析方法来获取函数调用请求，在ReAct作者的Demo程序中，就是暴力的使用split('\nAction')来获取函数调用请求

2.1.1 举例

使用DeepSeek来完成最简单的调用

设置系统提示词约束返回

# 你的角色
你是一个函数调用助手，我将提供多个函数的定义信息，包括函数名称、作用、参数及参数类型。

# 你的任务
- 根据用户的输入，判断是否需要调用某个函数  
- 如果需要，请**严格按照以下格式**输出函数调用指令：
```json
{ "name": "函数名", "arguments": { "参数名": "参数值" } }
```

# 函数定义信息
1. **get_weather**  
   - 作用：查询指定城市的天气情况  
   - 参数：  
     -`city`（string）：城市名称
2. **get_time**  
   - 作用：查询指定城市的当前时间  
   - 参数：  
     - `city`（string）：城市名称

用户提示词

“广州的天气怎么样？”

AI模型返回调用函数的请求

json

{ 
  "name": "get_weather",
  "arguments": { 
    "city": "广州"
  }
}

应用中解析该JSON,然后使用参数调用对应的函数
最后将函数返回的结果再返回给AI
最后获取最终结果

2.1.2 出现的问题

输出格式不稳定
- LLM大模型可能不按规定格式返回、返回的结果夹杂多余自然语言...，导致命令解析失败
AI存在幻觉的问题
- 大模型可能编造不存在的函数名和参数
- (💡大模型提供商能否对模型进行微调、强化学习，提升大模型在这一方面的能力？)
对开发者依赖高
- **对开发者依赖度高。**函数描述、调用指令格式、提示词逻辑完全由开发者设计。
- (💡函数描述、调用指令格式能否由大模型提供商来指定？系统提示词中的“说明与规则”逻辑能否由大模型提供商来兜底?)
上下文冗长，tokens消耗严重
- 为确保调用逻辑正确，往往需要在 System Prompt 中加入大量说明与规则。

2.2 基于API的Function Calling

基于上面可能出现的问题，所以厂商对模型进行微调、强化学习等等...在大模型API层面就是多了一个tools/functions参数来描述一组函数

2.2.1 举例

用户提问

json

"广州的天气如何?"

向大模型API发送请求，获取函数调用请求

应用向大模型 API 传入用户原始输入、函数描述和其他上下文信息，获取调用指令。函数描述包括函数名称、用途说明、参数结构等。

json

// 各家的格式可能不太一样
{
  "messages": [
    {
      "role": "system",
      "content": "你是一个助手，可以根据用户的请求调用工具来获取信息。"
    },
    {
      "role": "user",
      "content": "广州今天天气如何？适合出门吗？"
    }
  ],
  "tools": [
    {
      "name": "getWeather",
      "description": "获取指定城市的天气",
      "parameters": {
        "type": "object",
        "properties": {
          "location": {
            "type": "string",
            "description": "城市名称，比如北京"
          },
          "date": {
            "type": "string",
            "description": "日期，比如 2025-08-07"
          }
        },
        "required": ["location", "date"]
      }
    }
  ]
}

模型生成调用指令

模型会智能判断是否需要调用函数，选择合适的函数，并基于上下文自动生成结构化的调用指令（函数名 + 参数）

具体的格式由大模型厂商规定，需要查看其官方文档，例如：

json

{
  "function_call": {
    "name": "getWeather",
    "arguments": {
      "location": "Guangzhou",
      "date": "2025-07-17"
    }
  }
}

后端解析调用指令，并执行实际的函数调用

应用接收到模型返回的调用指令后，解析调用指令，得到函数名称和参数，执行对应的方法（如调用天气查询函数），并获取结果。

后端第二次向大模型 API 发起请求，将刚才的调用结果和其他上下文信息一起传给模型，生成最终的回复

应用将函数执行结果 + 其他上下文信息（包括用户原始输入）传给模型，模型判断此时已有足够的信息回答问题，不再需要调用函数了，于是直接生成最终结果，例如：“广州今天35度，暴雨，建议在室内活动”。

2.2.2 出现的问题

可选模型有限
后端应用适配不同大模型时存在大量冗余开发

3. MCP

3.1 MCP 解决什么问题

工具接入的冗余开发问题

当前每新增一个工具（函数），开发者就需要在应用中做两处人工适配

a. 在api接口中补充工具描述

b. 补充具体工具（函数）代码

工具复用困难

环境问题导致 copy 的代码不一定能跑；

很多企业不提供可供 copy 的源码；

跨语言的代码 copy 了没用。

3.1.1 解决问题的思路

如果是你会怎么解决以上问题？（假设现在完全没有 MCP 协议）

从问题出发

→ 冗余开发、复用困难问题基本都是由 copy 代码带来的，怎么才能用上别人的方法，但又不用 copy 别人的代码？

思路一：导包式接入，AI 应用开发者将工具代码拉到本地调用。
- 可行吗？⚠️ 跨语言调用问题无法解决
- 跨语言问题是客观无解的吗？→ 能否本地另起一个进程运行该语言的执行环境，工具代码原封不动运行在对应语言环境中，AI 应用再通过进程间通信（如管道、套接字）获取标准化的返回结果？
- 所以可行吗？✅ → 并且，这种接入方式更适合被称为“本地服务式接入”
思路二：远程服务式接入，工具开发者将工具独立部署，封装成标准化 API，约好统一的请求/响应格式，AI应用开发者只需按规定传入参数并解析返回值即可，不需要关心工具的实现语言、运行环境、内部逻辑。
- 可行吗？✅

从目标出发

→ 接入工具、复用工具对开发者来说最理想的方式是什么？

开发者只需添加一条配置（如工具的唯一标识或访问地址）就可以接入自己 / 别人的工具

→ 当前的非理想状态是什么？

当前每新增一个工具，开发者需要在链路中做两处人工适配：
- 补充工具描述
- 补充工具代码

→ 从非理想状态到理想状态必须满足什么条件？

要让“配置替代人工适配”，必须满足以下两点：
- 新增配置后，AI 应用后端要能根据配置自动获取工具的描述信息
- 新增配置后，AI 应用后端要能根据配置自动定位工具调用入口并执行调用

从问题到技术需求

→ 本地服务式接入场景

如何在任意 AI 应用中通过一条标准化配置：
- 拉取任意工具的包到本地，并在本地起一个进程，将工具作为一个服务运行起来（只要工具开发者有提供对应的包）
- 自动获取工具的描述信息、自动完成调用过程（通过本地进程间通信）

→ 远程服务式接入场景

如何在任意 AI 应用中通过一条标准化配置：
- 访问任意工具的远程服务（只要工具开发者有对外提供服务）
- 自动获取工具的描述信息、自动完成调用过程（通过远程服务调用）

技术方案思路

工具与AI 应用必须解耦合。
工具与AI 应用之间的交互必须标准化。

a. AI 应用和工具服务的通信协议需要统一（本地进程间的通信协议 / 远程服务调用的协议）

b. AI 应用和工具服务的接口定义需要统一（需要提供哪些接口、接口需包含哪些参数）

c. AI 应用和工具服务的数据交换格式需要统一（接口的请求 / 响应格式等)

d. AI 应用接入工具的配置内容需要进行标准化定义

e. 所有工具服务必须提供标准化的接入方式，以支持通过标准化配置即可加载工具

f. 所有 AI 应用内部需实现标准化的工具加载调用逻辑，以支持通过标准化配置即可加载工具

系统架构设计

总结

总结下来就一句话：

计算机科学领域的任何问题都可以通过增加一个中间层来解决

--- David Wheeler

我们应该设计一种架构，将工具层和AI应用解耦，并将两者之间的交互标准化

3.2 MCP 是什么

诞生：2024 年 11 月由 Anthropic 提出，官方文档。
定义：

MCP is an open protocol that standardizes how applications provide context to large language models (LLMs). Think of MCP like a USB-C port for AI applications. Just as USB-C provides a standardized way to connect your devices to various peripherals and accessories, MCP provides a standardized way to connect AI models to different data sources and tools. MCP enables you build agents and complex workflows on top of LLMs and connects your models with the world. [1]

MCP 是一个开放协议，用于标准化应用程序向大语言模型（LLM）提供上下文的方式。你可以把 MCP 想象成 AI 应用的 USB-C 接口——正如 USB-C 提供了一种将设备连接到各种外设和配件的标准化方式一样，MCP 提供了一种将 AI 模型连接到不同数据源和工具的标准化方式。借助 MCP，你可以在 LLM 之上构建智能体和复杂工作流，并将你的模型与外部世界相连接。

关键词理解：
- 应用程序：集成了LLM大语言模型的具体应用。典型例子：各家大模型的在线对话页面、集成了大语言模型的IDE程序、各种Agent（如Cursor、Claude Code等）以及各种接入了大语言模型的普通应用。
- 上下文：在模型决策时可以访问的所有信息：包括用户输入、历史对话消息、外部工具(tool 函数)信息、外部数据源(resource)信息、提示词(prompt)信息等（在MCP中，主要还是工具最为重要）

MCP就是一个协议，规定了AI应用 如何发现 和 调用工具（函数）

MCP只是让大模型 更好的 使用工具的一个协议，难听点讲就是有他没他Agent都能干活，只是有了它Agent干活更好更方便

3.3 MCP核心架构

MCP follows a client-server architecture where an MCP host — an AI application like Claude Code or Claude Desktop — establishes connections to one or more MCP servers. The MCP host accomplishes this by creating one MCP client for each MCP server. Each MCP client maintains a dedicated one-to-one connection with its corresponding MCP server.The key participants in the MCP architecture are:

MCP Host: The AI application that coordinates and manages one or multiple MCP clients
MCP Client: A component that maintains a connection to an MCP server and obtains context from an MCP server for the MCP host to use
MCP Server: A program that provides context to MCP clients

For example: Visual Studio Code acts as an MCP host. When Visual Studio Code establishes a connection to an MCP server, such as the Sentry MCP server, the Visual Studio Code runtime instantiates an MCP client object that maintains the connection to the Sentry MCP server. When Visual Studio Code subsequently connects to another MCP server, such as the local filesystem server, the Visual Studio Code runtime instantiates an additional MCP client object to maintain this connection, hence maintaining a one-to-one relationship of MCP clients to MCP servers.Note that MCP server refers to the program that serves context data, regardless of where it runs. MCP servers can execute locally or remotely. For example, when Claude Desktop launches the filesystem server, the server runs locally on the same machine because it uses the STDIO transport. This is commonly referred to as a “local” MCP server. The official runs on the Sentry platform, and uses the Streamable HTTP transport. This is commonly referred to as a “remote” MCP server. [

MCP遵循客户端-服务器架构，其中 MCP Host——Claude Code 或 Claude Desktop 等AI应用程序——与一个或多个MCP Server 建立连接。MCP 主机通过为每个 MCP Server 创建一个 MCP Client 来实现这一目标。每个 MCP Client 都与相应的 MCP Server 保持专用的一对一连接。MCP架构的主要组成者是：

MCP Host：协调和管理一个或多个 MCP Server 的人工智能应用程序
MCP Client：一个组件，用于维护与 MCP Server的连接，并从 MCP Server获取上下文，供 MCP HOST使用
MCP Server：一个为 MCP Client 提供上下文的程序

个人理解：

MCP Host：就是上面所说的各种AI应用

MCP Client：就是MCP Host中实例化的一个对象，作用就是维护Host和Server之间的联系，与MCP Server一对一的关系，当然也可以一对多，但是Anthropic最后选择的是一对一的关系，方便管理

MCP Server：叫MCP服务或者MCP工具集比较合适，内部会有多个tool，给Host提供工具描述（当然也有resource、prompt等，但是用的不多）和执行具体的tool

例如：Visual Studio Code 充当 MCP Host。当 Visual Studio Code 建立与MCP Server（如Sentry MCP服务器）的连接时，Visual Studio Code 运行时实例化了维护与Sentry MCP Server连接的MCP Client对象。当Visual Studio Code 随后连接到另一个MCP Server时，例如本地文件系统服务器，Visual Studio Code 运行时实例化一个额外的MCP Client对象来维护此连接，从而保持MCP Client与MCP Client的一对一关系。

3.4 MCP传输协议

MCP supports two transport mechanisms:

Stdio transport: Uses standard input/output streams for direct process communication between local processes on the same machine, providing optimal performance with no network overhead.
Streamable HTTP transport: Uses HTTP POST for client-to-server messages with optional Server-Sent Events for streaming capabilities. This transport enables remote server communication and supports standard HTTP authentication methods including bearer tokens, API keys, and custom headers. MCP recommends using OAuth to obtain authentication tokens.

The transport layer abstracts communication details from the protocol layer, enabling the same JSON-RPC 2.0 message format across all transport mechanisms.[ 3]

Stdio 传输

Stdio 传输本质上是本地进程间通信（IPC）的一种形式，它最常用的底层机制就是管道（pipe）。

什么是 stdio？
- stdio（standard I/O）是**进程的标准输入/输出接口。**每个进程启动时，操作系统会给它分配 三个文件描述符：
json
```
0 → stdin  （标准输入，默认是键盘） 
1 → stdout（标准输出，默认是屏幕） 
2 → stderr（标准错误输出，默认是屏幕）
```
- 程序里的 printf、scanf、cin、cout、read、write 都是通过这些接口和外界交换数据的。
什么是管道（pipe）？
- 管道是操作系统内核提供的一种进程间通信（IPC）机制，它允许一个进程的输出直接作为另一个进程的输入，实现数据在两个进程之间的流动。
总结：什么是 Stdio 传输？
- 所谓 Stdio 传输，就是通过标准输入和标准输出这两个数据流来传输数据、通过管道来连接两个进程的标准输入/输出接口，使得一个进程的输出直接传给另一个进程输入，实现进程间数据传输（本质上是一个基于字节流的全双工通信通道）
- stdio 是接口，管道是连接这接口的通道。

举例：

Shell

# 没有使用管道
ps aux
[键盘] → shell → ps(stdin) → ps(stdout) → [屏幕]

shell

# 使用管道Stdio传输
ps aux | grep python
# ps 和 grep 在执行时都会各自成为一个独立的进程
# ps aux 列出进程 → grep python 过滤后留下包含 "python" 的进程
# 管道 | 把 ps aux 的 stdout 作为 grep python 的 stdin
[键盘] → shell → ps(stdin) → ps(stdout) → grep(stdin) → grep(stdout) → 屏幕

为什么在这么多本地进程间通信的方式中选了 Stdio 传输？

因为它简单，MCP Host 和 MCP Server之间只是传输一些简单的JSON，没必要搞多么复杂的通信方式

HTTP + SSE 传输（旧方案，2024.10）

客户端通过 HTTP POST 向服务端发请求，服务端通过 SSE 通道返回响应结果。

SSE（Server-Sent Events服务器发送事件），是一种服务器单向推送数据给客户端的技术，基于 HTTP 协议。
基本原理
- 客户端先向服务端发起一个普通的 HTTP 请求。
- 服务端保持这个连接不断开，以 text/event-stream 作为响应类型，源源不断地往里写数据。
- 客户端收到数据后会触发相应的事件回调（比如浏览器前端实时更新界面）。
和普通 HTTP 的核心差异
- 支持服务端主动、流式地推送消息

为什么在这么多远程服务调用的协议中选了 HTTP + SSE？

服务端推送的必要性：MCP Server 中的工具发生了更新，需要主动向 MCP Client 推送通知

Why Notifications Matter

This notification system is crucial for several reasons:

Dynamic Environments: Tools may come and go based on server state, external dependencies, or user permissions
Efficiency: Clients don’t need to poll for changes; they’re notified when updates occur
Consistency: Ensures clients always have accurate information about available server capabilities
Real-time Collaboration: Enables responsive AI applications that can adapt to changing contexts

This notification pattern extends beyond tools to other MCP primitives, enabling comprehensive real-time synchronization between clients and servers. [4]

Streamable HTTP 传输（新方案，2025.03）

HTTP + SSE 传输方案的升级版，目前正在逐步取代原有的 HTTP + SSE 传输方案

Streamable HTTP 并不是一个标准协议名，而是一个通用描述，指的是基于 HTTP 协议的“可流式传输”技术。它的核心思想是：在一个 HTTP 连接里，服务端可以持续不断地发送数据给客户端，客户端边接收边处理，类似“流”一样。与传统 HTTP 请求响应“一次性完成”不同，Streamable HTTP 保持连接不关闭，数据分片持续传输。常见实现方式包括：
- HTTP/1.1 长连接 + 分块传输编码（Chunked Transfer Encoding）
- HTTP/2 流式数据
- HTTP/3 QUIC 流式传输

为什么 HTTP + SSE 要升级成 Streamable HTTP ？

数据格式限制问题：SSE 的 Content-Type: text/event-stream 只支持文本格式；Streamable HTTP 的Content-Type支持任意格式，如 JSON、HTML、二进制等，更适合 AI 场景（可能要传 JSON + 音频 + 图片）
跨平台兼容问题：SSE 支持的客户端主要是浏览器端和少量语言库；而 Streamable HTTP 支持多种客户端。
性能问题：SSE 是基于 HTTP/1.1 长连接，Streamable HTTP 可以基于 HTTP/2/3 ，支持多路复用和双向流。且 HTTP/2/3 的流控制和优先级机制使得高吞吐和低延迟成为可能；SSE 消息只能文本格式，Streamable HTTP 支持其他采用更紧凑的编码方式（比如二进制分包、压缩等）。

必须选用以上传输协议吗？

——No，因为无论哪种传输方式，都只是把各种工具的不同接入方式统一起来，对外暴露一种协议的接口而已。

自己实现一种协议，只要能传输JSON数据也行

3.5 MCP具体例子

基于本地服务式接入（Stdio传输方式）

json

// 在 mcpServers 配置中新增一个叫 "amap-maps"（你自己起名）的 MCP Server
// 通过 npx -y @amap/amap-maps-mcp-server 命令，运行高德官方提供的 MCP server
// 运行时的环境变量是 "AMAP_MAPS_API_KEY": "你申请的 API Key"
{
  "mcpServers": {
    "amap-maps": {
      "command": "npx",
      "args": ["-y", "@amap/amap-maps-mcp-server"],
      "env": {
        "AMAP_MAPS_API_KEY": "您在高德官网上申请的key"
      }
    }
  }
}

远程服务式接入(基于SSE协议)

json

{
  "mcpServers": {
    "amap-maps-streamableHTTP": {
      "url": "https://mcp.amap.com/mcp?key=您在高德官网上申请的key"
    }
  }
}

4.MCP和Function Calling的区别

Function Calling的出现让AI有了操控外部工具的能力，而MCP制定了一个统一的标准，可以让应用更好、更易用的进行工具调用

两者根本不在一个层次，也不存在谁取代谁的关系

AI Agent与MCP协议

摘要

1.Agent

1.1 什么是Agent

1.2 ReAct -- Agent架构的设计理念之一

2. Function Calling

2.1 基于提示词的Function Calling

2.1.1 举例

2.1.2 出现的问题

2.2 基于API的Function Calling

2.2.1 举例

2.2.2 出现的问题

3. MCP

3.1 MCP 解决什么问题

3.1.1 解决问题的思路

从问题出发

从目标出发

从问题到技术需求

技术方案思路

系统架构设计

总结

3.2 MCP 是什么

3.3 MCP核心架构

3.4 MCP传输协议

Stdio 传输

HTTP + SSE 传输（旧方案，2024.10）

Streamable HTTP 传输（新方案，2025.03）

必须选用以上传输协议吗？

3.5 MCP具体例子

4.MCP和Function Calling的区别

5. 文章参考