本文基于开源项目进行解读与拓展
- 官方项目地址:GitHub – microsoft/ai-agents-for-beginners
- 项目许可证:MIT License
本文中的代码示例、课程结构与核心概念均来源于上述微软官方开源项目。笔者在深入学习的过程中,记录了个人笔记,并对关键知识点和实践中可能遇到的疑惑添加了详细的说明与注释,旨在帮助初学者更好地理解与上手。
AI代理是使大型语言模型(LLM)能够执行作的系统,它通过为 LLM 提供工具和知识访问权限来扩展其功能。

1)大语言模型(LLM):
它解析了AI代理背后的推理。使用 LLM 构建 AI 代理的优势在于它们能够解释人类语言和数据。
- 这里的推理指的是:能够识别用户请求的任务,制定计划来完成该任务并执行该计划的操作。
2)执行操作(Performs Action):
- 在 AI Agent 系统外:LLMs 仅限于根据用户提示生成内容或信息的情况。
- 在 AI Agent 系统内:LLMs 可以通过解释用户请求并使用其环境中可用的工具来完成任务。
3)访问工具(Access To Tools):
LLM 可以访问哪些工具由它运行的环境和 AI Agent 的开发者定义。
4)记忆 + 知识(Knowledge):
在用户和代理之间的对话上下文中,记忆可以是短期的。从长远来看,除了环境提供的信息之外,AI 代理还可以从其他系统、服务、工具甚至其他代理中检索知识。
- 短期记忆:用户与代理之间对话的上下文。
- 长期记忆:允许代理随着时间的推移改进完成任务的数据集合。
Agent 智能体
1)开放式问题(Open-Ended Problems ):
允许 LLM 确定完成任务所需的步骤,因为它不能总是硬编码到工作流程中。
2)多步骤流程(Multi-Step Processes):
需要一定复杂程度的任务,其中 AI Agent 需要在多个回合中使用工具或信息,而不是单次检索。
3)随时间改进(Improvement Over Time):
代理可以通过接收来自其环境或用户的反馈来随着时间的推移进行改进的任务,以便提供更好的实用性。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/242719.html原文链接:https://javaforall.net
