第 5 篇 | 接入 PS API 工具系统:给 AI 智能体装 “手脚”,从 “能回答” 到 “能做事”

第 5 篇 | 接入 PS API 工具系统:给 AI 智能体装 “手脚”,从 “能回答” 到 “能做事”

  • 第 2 篇:接入 LLM—— 给智能体装上 “大脑”,实现第一个可交互 Demo
  • 第 3 篇:集成提示工程,让通义千问更懂 PS API 修图需求(精准回答 + 格式化输出)
  • 第 4 篇:引入对话上下文,给智能体赋予 “记忆”,记住多轮聊天内容

承接上一篇的记忆模块开发,本篇将完成智能体的关键能力升级 —— 接入 PS API 工具系统,搭建标准化 LangChain 工具调用框架,让智能体从只会解答 PS API 问题的理论派,升级为能实际调用 PS API 执行修图操作的行动派,同时兼容记忆模块,保证工具调用的上下文连贯性。

本文核心目标

  1. 搭建适配通义千问 LLM 的 LangChain 标准化工具调用框架;
  2. 封装 PS API 基础调用函数(以图片抠图为例,选用 Remove.bg API);
  3. 实现用户提问→解析指令→调用 PS API→返回结果的完整业务流程;
  4. 兼容前三篇的记忆模块,让工具调用具备上下文连贯性。

本次开发以Remove.bg API为实操载体(轻量化、免费额度充足、新手易接入),环境配置延续前序系列内容,仅新增 PS API 相关配置,步骤如下:

1. 核心依赖安装

与系列前序文章保持一致,无需额外安装新依赖。

2. 环境变量配置

在文件中配置通义千问密钥(延续之前)+ 新增 Remove.bg API 密钥,配置格式如下:

 

AI Agent 的核心是能自主决策调用哪个工具的 LLM,但它只能识别符合 LangChain Tool 规范的对象,直接的裸 API / 本地函数 / 数据库,Agent 无法直接调用。

工具封装的本质

给不同格式的工具(API / 本地函数 Agent 智能体 / 数据库)套上统一的翻译层,让 Agent 能实现 3 个核心操作:

  1. 看懂工具功能(通过字段描述);
  2. 知道传参规则(通过定义参数校验模型);
  3. 直接触发执行(通过实现方法定义核心逻辑);
  4. 拿到标准化返回结果(统一返回格式,方便 Agent 解析)。

简单来说:不封装的工具,对 Agent 而言就像 “中国人看纯英文说明书”—— 看不懂、不会用。

4 套通用工具封装套路(全覆盖所有场景)

以下封装模板为通用型,可直接套用在第三方 API、本地函数、数据库、新手极简开发等所有场景,核心原则是「继承 BaseTool + 实现_run 方法」,按自身需求选择即可。

套路 0:新手友好型 LangChain 工具调用(极简兼容版)

专为编程新手设计,放弃严格的 BaseTool+Pydantic 标准化约束,以最小改动、最高兼容性、最低报错率为核心,优先保证代码跑通,适合 LangChain 入门 / 快速落地简单工具调用场景。

 

套路 1:调用第三方 API(如 PS API / 天气 API / 支付 API)

标准化封装模板,适配所有第三方 HTTP/HTTPS API,带参数校验,适合生产环境开发。

 

套路 2:调用本地函数(如本地图片处理 / 数据计算 / 文件操作)

适配本地自定义函数,无需联网,核心是将本地函数封装为 Agent 可识别的 Tool,带参数校验。

 

套路 3:调用数据库(如 MySQL/Redis/MongoDB 查询)

适配数据库查询场景,以 MySQL 为例,封装为标准化 Tool,仅支持查询操作(避免误操作)。

 

工具调用通用规则(新增工具无需改核心逻辑)

不管新增多少工具,Agent 的核心调用逻辑永远无需修改,只需将封装好的工具实例加入列表即可,实现工具解耦、灵活扩展

 

基于上述套路 0(新手友好) 封装 Remove.bg API 工具类,实现图片抠图API 额度查询两大核心功能,强化路径校验、异常处理,适配新手开发,直接复用即可。

 

将上述封装的Remove.bg API 工具类通义千问 LLM系列第四篇的记忆模块进行整合,实现自然语言解析→工具自主调用→结果返回→上下文记忆的完整闭环,代码可直接运行。

  1. 环境验证:确保文件中和配置正确;
  2. 文件准备:在程序工作目录放入测试图片(如);
  3. 启动程序:直接运行上述代码,输入指令即可测试,示例指令:
    • 抠图测试:
    • 额度查询:
    • 自定义保存路径:
  4. 调试技巧:开启后,控制台会打印 Agent 的工具调用全过程,可根据日志排查参数 / 路径问题。

本篇完成了智能体工具调用能力的核心开发,后续系列将继续升级:

  • 实现 PS API 多工具联动(抠图 + 缩放 + 裁剪 + 调色);
  • 优化 Agent 的工具选择逻辑,提升决策准确性;
  • 实现智能体的 Web 可视化部署,脱离控制台交互;
  • 接入更多图片处理 API,打造完整的 AI 图片处理助手。

本系列为AI 智能体从 0 到 1 开发实战硬核内容,涵盖 LLM 接入、提示工程、记忆模块、工具调用、多工具联动等核心知识点,所有教程均为可直接运行的实战代码,适配新手入门和开发者进阶。

更多 AI 智能体开发实战、LangChain 进阶技巧、PS API/AI 工具接入教程,将首发在公众号【SLAM 与 AI 智能体】,扫码关注即可获取系列完整代码、工具封装模板、API 密钥申请教程,避免走弯路,快速实现 AI 智能体从 “能说” 到 “能做” 的升级!

 

首发在公众号【SLAM 与 AI 智能体】关注本号,点赞后在后台回复「chap5」即可提前获取本文配套源码,不错过更新。

👉立即领取:

  • 本文完整可运行代码

(资源仅对关注用户开放)

欢迎在评论区留言讨论:你在工具封装过程中遇到了哪些问题?想让智能体接入哪些实用工具?一起交流 AI 智能体开发技巧~

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/283587.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月15日 下午1:18
下一篇 2026年3月15日 下午1:19


相关推荐

关注全栈程序员社区公众号