收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

本文系统解析了LLM Agents的核心架构与关键技术,详述了记忆系统(短期/长期记忆)、工具使用(MCP协议)和计划能力(ReAct与Reflexion)三大组件,并探讨了从单智能体到Multi-Agent协作的演进路径。通过40+图解展示了LLM Agent如何通过推理与行动循环实现自主决策,以及专业化Agent如何在框架下协同工作,为构建高效AI Agent系统提供全面技术指南。


前排提醒!文末有大模型CSDN独家资料包,看到最后别错过哦~

LLM Agents正在变得广泛传播,但它们并非轻易就能创造出来,需要许多组件协同工作。以 40+ 张图解,探索 LLM Agents的主要组件、Multi-Agent框架、以及MCP等全栈技术要点,比如:

  • Agent如何从失败Plan中学习经验?
  • LLM、MCP、Tool交互细节?
  • 几十种Multi-Agent架构,核心组件是?

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

AI Agent是任何可以通过传感器感知其环境并通过执行器对环境采取行动的东西。

——罗素和诺维格,《人工智能:一种现代方法》(2016 年)

Agents与环境互动,通常包括几个重要组件:

  • 环境 —— 代理互动的世界
  • 传感器 —— 用于观察环境
  • 执行器 —— 用于与环境互动的工具
  • 效应器 —— 决定如何从观察到行动的“大脑”或规则
  • 收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

这个框架适用于所有与各种环境互动的代理,比如与物理环境互动的机器人或与软件互动的AI Agents。

可以稍微扩展这个框架,使其适用于“增强型 LLM”。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

使用“增强型”LLM,Agent可以通过文本输入观察环境,并通过使用工具执行某些行动。

为了选择要采取哪些行动,LLM Agent有一个关键组件:它的计划能力。为此,LLM 需要能够通过链式思考等方法进行“推理”和“思考”。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

利用这种推理行为,LLM Agent将计划出要采取的必要行动。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

这种计划行为使Agent能够理解情况(LLM)、计划下一步(计划)、采取行动(工具)并跟踪已采取的行动(记忆)。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

根据系统,你可以拥有不同程度自主性的 LLM Agents。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

一个系统越“agentic”,LLM 就越能决定系统的行动方式。

将通过 LLM Agent的三个主要组件:记忆、工具和计划,来探索各种自主行为的方法。

LLM 是健忘的系统,或者更准确地说,在与它们互动时,它们根本不进行任何记忆。

例如,当你问 LLM 一个问题,然后又接着问另一个问题时,它不会记得前者。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

我们通常将其称为短期记忆,也称为工作记忆,它作为(近乎)即时上下文的缓冲区。这包括 LLM 代理最近采取的行动。

然而,LLM 代理还需要跟踪可能多达数十步的行动,而不仅仅是最近的行动。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

这被称为长期记忆,因为 LLM 代理理论上可能需要记住多达数十步甚至数百步。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

短期记忆

实现短期记忆最直接的方法是使用模型的上下文窗口,这本质上是 LLM 可以处理的 token 数量。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

较大的上下文窗口可以用来跟踪完整的对话历史,作为输入提示的一部分。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

对于上下文窗口较小的模型,或者当对话历史较大时,可以改用另一个 LLM 来总结到目前为止发生的对话。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

长期记忆

LLM Agents的长期记忆包括需要长期保留的Agents过去的行动空间。

实现长期记忆的一个常见技术是将所有之前的互动、行动和对话存储在一个外部向量数据库中。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

在构建数据库之后,可以通过RAG方式检索相关信息。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

工具允许给定的 LLM 要么与外部环境(如数据库)互动,要么使用外部应用程序(如运行自定义代码)。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

工具通常有两种用例:获取数据以检索最新信息和采取行动,比如安排会议或点餐。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

要实际使用一个工具,LLM 必须生成适合给定工具的 API 的文本。我们通常期望的是可以格式化为 JSON 的字符串,以便可以轻松地输入到代码解释器中。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

工具使用是一种强大的技术,可以增强 LLM 的能力并弥补它们的不足。因此,关于工具使用和学习的研究在过去几年中迅速增加。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

最早实现这一目标的技术之一被称为 Toolformer,这是一个训练用于决定调用哪些 API 以及如何调用的模型。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

工具是具代理性框架的重要组成部分,允许 LLM 与世界互动并扩展其能力。然而,当你有许多不同的 API 时,启用工具使用变得很麻烦,因为任何工具都需要:

  • • 手动跟踪并输入给 LLM
  • • 手动描述(包括其预期的 JSON 模式)
  • • 每当其 API 发生变化时手动更新

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

为了使工具更容易在任何给定的具代理性框架中实现,Anthropic 开发了模型上下文协议(MCP)。MCP Agent 智能体 为天气应用和 GitHub 等服务标准化了 API 访问。

它由三个组件组成:

  • MCP 主机 —— LLM 应用程序(例如 Cursor),管理连接
  • MCP 客户端 —— 与 MCP 服务器保持一对一连接
  • MCP 服务器 —— 为 LLM 提供上下文、工具和能力

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

例如,假设你希望某个 LLM 应用程序总结你仓库中的最新 5 次提交。

MCP 主机(与客户端一起)将首先调用 MCP 服务器,询问有哪些工具可用。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

LLM 收到信息后,可能会选择使用某个工具。它通过主机向 MCP 服务器发送请求,然后接收结果,包括所使用的工具。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

最后,LLM 收到结果,并可以向用户解析答案。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

工具使用使 LLM 能够增强其能力。它们通常通过类似 JSON 的请求调用。

但是,LLM 在具代理性的系统中如何决定使用哪个工具以及何时使用呢?

这就是计划的作用。LLM 代理中的计划涉及将给定任务分解为可操作的步骤。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

推理

计划可操作步骤需要复杂的推理行为。因此,LLM 必须能够在规划任务的下一步之前展示这种行为。

“推理型”LLM 是那些倾向于在回答问题之前“思考”的 LLM。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

这种推理行为可以通过大致两种选择来实现:微调 LLM 或特定的提示工程。

通过提示工程,可以创建 LLM 应该遵循的推理过程的例子。提供例子是引导 LLM 行为的好方法。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

在训练 LLM 时,可以给它足够数量包含类似思维的例子的数据集,或者 LLM 可以发现自己的思考过程。例如 DeepSeek-R1,其中使用奖励来引导使用思考过程。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

推理与行动

在 LLM 中启用推理行为很好,但并不一定使其能够规划可操作的步骤。

到目前为止关注的技术要么展示推理行为,要么通过工具与环境互动。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

例如,链式思考纯粹关注推理。

将这两个过程结合起来的最早技术之一被称为 ReAct(推理与行动)。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

ReAct 通过精心设计的提示来实现这一点。ReAct 提示描述了三个步骤:

  • 思考 —— 关于当前情况的推理步骤
  • 行动 —— 要执行的一系列行动(例如,工具)
  • 观察 —— 关于行动结果的推理步骤

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

LLM 使用这个提示来引导其行为以循环的方式进行思考、行动和观察。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

反思

没有人,即使是具有 ReAct 的 LLM,也并非每个任务都能完美完成。失败是过程的一部分,只要你能反思这个过程就行。

这个过程在 ReAct 中缺失,而 Reflexion 正是填补这一空白的地方, 利用verbal reinforcement 帮助代理从之前的失败中学习的技术。

假设了三个 LLM 角色:

  • 行动者 —— 根据状态观察选择并执行行动。
  • 评估者 —— 对行动者产生的输出进行评分。
  • 自我反思 —— 对行动者采取的行动和评估者生成的评分进行反思。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

探索的Single-Agent存在几个问题:工具太多可能会使选择复杂化,上下文变得过于复杂,任务可能需要专业化。

相反,可以转向Multi-Agents,即多个Agents相互互动以及与它们的环境互动的框架:

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

这些Multi-Agent系统通常由专业化的代理组成,每个Agent都配备了自己的一套工具,并由一个主管监督。主管管理Agent之间的通信,并可以为专业化的代理分配特定的任务。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

每个Agent可能有不同的工具类型可用,也可能有不同的记忆系统。

在实践中,有几十种Multi-Agent架构,其核心有两个组成部分:

  • Agent初始化 —— 如何创建各个(专业化的)代理?
  • Agent协调 —— 如何协调所有代理?

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

人类行为的交互式仿真

可以说最具影响力且坦率地说非常酷的多代理论文之一是“Generative agents: Interactive simulacra of human behavior”。创建了可以模拟可信人类行为的计算软件代理,他们将其称为生成性代理。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

每个生成性代理被赋予的档案使它们以独特的方式行事,并有助于创造更有趣和动态的行为。

每个Agent都用三个模块(记忆、计划和反思)初始化,非常类似于我们之前看到的 ReAct 和 Reflexion 的核心组件。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

它们共同允许代理自由地进行行为并相互互动。因此,Agent之间几乎没有协调,因为它们没有特定的目标需要努力实现。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

模块化框架

无论你选择哪种框架来创建Multi-Agent系统,它们通常由几个要素组成,包括其档案、对环境的感知、记忆、计划和可用行动。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

流行框架是 AutoGen、MetaGPT 和 CAMEL。每个框架在Agent之间的通信方式上略有不同。但归根结底,它们都依赖于这种协作性的沟通。Agent有机会相互交流,以更新它们的当前状态、目标和下一步行动。

最近几周,这些框架的增长呈爆炸式增长。

收藏必备!LLM Agents全栈技术深度解析:40+图解带你掌握记忆、工具与计划三大核心组件,从单智能体到Multi-Agent框架入门指南

2025 年将是令人兴奋的一年,AI Agents将迎来更多的落地,什么时候入局AI Agents都不晚!

读者福利大放送:如果你对大模型感兴趣,想更加深入的学习大模型,那么这份精心整理的大模型学习资料,绝对能帮你少走弯路、快速入门

如果你是零基础小白,别担心——大模型入门真的没那么难,你完全可以学得会

你要做的特别简单:跟着我的讲解走,照着教程里的步骤一步步操作就行。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

现在这份资料免费分享给大家,有需要的小伙伴,直接VX扫描下方二维码就能领取啦↓↓↓
在这里插入图片描述

数据显示,2023 年我国大模型相关人才缺口已突破百万,这一数字直接暴露了人才培养体系的严重滞后与供给不足。而随着人工智能技术的飞速迭代,产业对专业人才的需求将呈爆发式增长,据预测,到 2025 年这一缺口将急剧扩大至 400 万!!
在这里插入图片描述

大模型学习路线汇总

大模型实战项目&配套源码

大模型学习必看书籍PDF

大模型超全面试题汇总

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
获取方式

有需要的小伙伴,可以保存图片到VX扫描下方二维码免费领取【保证100%免费】
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最适合零基础的!!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/241473.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 上午7:18
下一篇 2026年3月16日 上午7:18


相关推荐

关注全栈程序员社区公众号