LLM智能体(LLM Agents)正在迅速普及,似乎逐渐取代了我们熟悉的传统对话式LLM。这些令人惊叹的能力并非凭空而来,而是需要多个组件协同工作。
本文包含超过60张定制插图,将深入探讨LLM智能体的领域、其核心组件以及多智能体框架的工作原理。
通过连续采样多个词,我们可以模拟对话并让LLM生成更长的回答。

然而,当我们继续“对话”时,任何LLM都会暴露出其主要缺点之一:它无法记住之前的对话!
此外,LLM在许多任务上表现不佳,例如基本的数学运算(乘法和除法):
这是否意味着LLM很糟糕?绝对不是!LLM不需要全能,因为我们可以借助外部工具、记忆系统和检索机制来弥补其不足。
通过外部系统,LLM的能力可以得到增强。Anthropic将其称为“增强型LLM”。
智能体的定义
智能体是可以被视为通过传感器感知环境并通过执行器作用于环境的任何事物。
——Russell & Norvig,《人工智能:现代方法》(2016)
智能体与环境交互,通常由以下几个重要组件组成:
- 环境——智能体交互的世界
- 传感器——用于观察环境
- 执行器——用于与环境交互的工具
- 效应器——决定如何从观察到行动的“大脑”或规则

该框架适用于各种与不同环境交互的智能体,例如与物理环境交互的机器人或与软件交互的AI智能体。
通过“增强型LLM”,智能体可以通过文本输入(因为LLM通常是文本模型)观察环境,并通过工具(如网络搜索)执行某些操作。
为了选择采取哪些行动,LLM智能体有一个关键组件:规划能力。为此,LLM需要能够通过链式思维等方法进行“推理”和“思考”。

这种规划行为使智能体能够理解当前情境(LLM)、规划下一步(规划)、采取行动(工具)并跟踪已采取的行动(记忆)。

Agent 智能体
可以说,一个系统越“智能”,LLM就越能决定系统的行为方式。
在接下来的部分中,我们将通过LLM智能体的三个主要组件——记忆、工具和规划——探索各种自主行为的方法。
LLM是一种健忘的系统,或者更准确地说,在交互过程中不会进行任何记忆。
例如,当你向LLM提问后紧接着再问另一个问题时,它不会记住前者。
我们通常将这种记忆称为短期记忆,也叫工作记忆,它充当即时上下文的缓冲区。这包括LLM智能体最近采取的行动。
然而,LLM智能体还需要记录可能数十个步骤,而不仅仅是最近的行动。
这被称为长期记忆,因为LLM智能体理论上可能需要记录数十甚至数百个步骤。

让我们探索几种赋予这些模型记忆的小技巧。
短期记忆
发布者:Ai探索者,转载请注明出处:https://javaforall.net/238368.html原文链接:https://javaforall.net
