经常有朋友问我,如何打造一个商用 AI Agent(智能体)?
- 是选择 Coze?Dify?还是 LangGraph ?
- 过程中有哪些注意事项?
- 我的数据应该存储在哪里?
- 为什么某些网页用这个工具无法抓取到内容?
- ······
因此,在 2025 年初,我结合这两年的 AI Agent 的开发经验,启动了一个合集《从零到一打造 AI Agent》。
内容包含了 AI Agent 的理论、实操和案例,我将一步步展示如何打造一个商用 AI Agent 的完整过程。
如果你是非技术人员,这对你来说非常有帮助;如果你是技术人员,这个视频将帮助你少走一些弯路,快速上手!
全文 3900 字,可以先收藏。Agent 智能体
关注我,及时收到后续内容。
这篇内容将从整体上介绍打造 AI Agent 的七个步骤,分别是需求梳理、软件选型、提示工程、数据库、构建 UI 界面、测试评估和部署发布。

梳理工作流
第一步,我们需要做的工作就是梳理需求。
首先,我们需要明确,做这个 AI Agent 是为了帮我们解决什么问题?
- 如果你是一位自媒体从业者,可能会希望做一个 AI Agent 来帮你处理一些重复性的工作,如找对标、找热点、做分析、写初稿等,这样你可以把精力集中在内容创作上;
- 如果你是一位贸易公司的老板,可能会希望做一个 AI Agent 来帮你汇集来自不同平台的订单,并在各个平台之间进行产品询价和价格比较。
记住,你需要重点梳理的是那些重复性的、机械化的、不需要太多思考的工作,越详细越好。
当然,你也可以借助 AI 工具,与它交流,形成初稿后,再进行补充。
你是一位工作流梳理专家,请帮我梳理
<自媒体编辑>
这个角色在日常工作中需要重复干的工作,并标记处哪些可以由 AI 来协助,哪些主要我来去做,先以表格的形式(工作内容/AI协助/人工来做)输出,我当认为表格的内容完整后,我回复“继续”,你再以mermaid流程图的形式输出,每个流程节点需要注明是否可由AI协助完成,流程图为横向。
自媒体编辑>
用到哪些工具
梳理完需求后,我们需要根据梳理的工作流,罗列出需要用到的工具。
例如,采集数据需要网页抓取工具;发布文章,需要对接微信公众平台。
因此,工具的选型也非常重要。借助不同的工具,可以让 AI Agent 在不同的系统之间自动化地执行任务,从而减少人工操作。
第二步,我们需要根据场景选择 AI Agent 开发平台,选择合适的大模型,并选用不同的工具来执行不同系统的操作。
选择哪个 AI Agent 平台
先说说 AI Agent 开发平台,Dify、Coze、FastGPT 等这么多无代码 Agent 开发平台,我们该选择哪个比较合适呢?
- Coze 只能使用云端,不能在本地部署。
- Dify 是完全开源的,没有限制,但在知识问答方面的能力较弱。
- FastGPT 的使用有一定限制,但在知识回答方面的能力相对较强。
更高级的开发平台,如 LangGraph、CrewAI 等,可以让 AI 自我规划并执行任务,但是需要编写代码。
是否选择这些平台,取决于我们的具体需求,当然也可以混合使用。
这就要求我们深入了解每个开发平台的特点,它擅长什么、不擅长什么,存在哪些明显的缺陷。只有掌握了这些信息,才能根据我们的场景做出合适的选型。
选择哪个 LLM
再说说大模型的选择,现在有海外的 OpenAI、Claude、Gemini,也有国内的 Kimi、通义千问和近期爆火的 DeepSeek,还有一些开源模型如 LLaMA、Grok,也有像 Mistral 这样的小模型。

那么,基于你的 AI Agent 场景,在这么多模型中,最合适的应该选择哪个?
如果你没有隐私数据,最好的选择是 OpenAI 和 Claude,因为它们是头部大模型。如果你仅仅是做翻译、总结文章等任务,选择国内的大模型效果也差不多,当前 DeepSeek 的性价比很高。
选择哪个模型,需要根据你的具体使用场景,当然也可以考虑混合使用。这个时候,建议你深入了解不同模型的能力。
- • 小模型和大模型有什么区别?
- • 哪个模型的推理能力最强?
- • 8K、32K 等同一个模型的不同大小有什么区别?
- • 如果本地部署,什么样的配置能运行什么样的模型?这些模型的能力如何?
- • 如果使用云端大模型,模型的计费单价是多少?
- • 是否可以混合使用不同的模型?
- • 企业隐私数据能否使用云端大模型?
这些问题,我会在后续的内容中会逐一讲解。
选择哪些工具
最后,就是工具选择。工具是一种能力,它可以是生成一张图片,也可以是到互联网上去搜索,甚至可以是与一个系统进行对接。
AI Agent 开发平台的能力仅仅是利用大模型的能力,因此,如果需要与外部系统进行交互,就需要用到工具。工具大致可以分为有 API 接口的和无 API 接口的两类。
有 API 接口的工具,对接起来就非常简单。在 Coze、Dify 等平台上,已经集成了许多工具,可以直接配置和使用。
而对于无 API 接口的工具,就需要通过 RPA(机器人流程自动化)来处理。简单来说,RPA 是一种可以通过控制浏览器来执行一系列操作的自动化工具。
第三步,提示工程是 AI Agent 的核心,好的提示词能够大大提升大模型输出的准确性。
- 一个好的提示词能帮助 AI Agent 准确地理解任务,提高大模型的输出质量。
- 一个好的提示词可以减少 token 的消耗,降低成本。
- 一个好的提示词可以帮助 AI Agent 理解上下文,确保对话的连贯性。
因此,我们需要掌握如何编写有效的提示词。
- • 什么是 CRISPE 框架?
- • 什么是 BROKE 框架?
- • 什么是 ICIO 框架?
- • 什么是 CoT(思维链)?
我们还需要了解与大模型交互的规则,例如:
- • 一篇长文分多次输出比一次性输出的质量更高。
- • 使用不同的符号将不同信息分隔开,可以增强大模型的理解。
- • 给出示例能帮助大模型快速理解你的要求。
- • 对于复杂任务,将其拆解为若干步骤,引导大模型分步执行,效果更佳。
- • 明确输出内容的限定,如字数、格式、风格、语言难度等。
ICIO 框架:
- • Intruction(任务):明确指出希望 AI 执行的具体任务,如“翻译一段文本”或“撰写一篇关于 AI 伦理的博客文章”。
- • Context(背景):提供任务的背景信息,帮助 AI 理解任务的上下文,例如,“这段文本是用于公司内部会议的开场白”。
- • Input Data(输入数据):指定 AI 需要处理的具体数据,如“请翻译以下句子:‘人工智能正在改变世界’”。
- • Output Indicator(输出格式):设定期望的输出格式和风格,例如,“请以正式的商务英语风格翻译”。
BROKE 框架:
- • Background(背景):例如,“你正在为一家初创科技公司撰写一篇关于其最新产品的新闻稿。”
- • Role(角色):指定 AI 作为“新闻稿撰写者”,以便它能够以专业的角度回答问题。
- • Objectives(目标/任务):给出任务描述,如“撰写一篇吸引人的新闻稿,突出产品的独特卖点。”
- • Key Result(关键结果):设定回答的关键结果,例如,“使用正式和专业的语言,包含产品的主要功能和市场定位。”
- • Evolve(改进):在 AI 给出回答后,提供三种改进方法,如“调整语言风格以吸引目标受众”,“增加产品使用案例”,或“优化结构以提高阅读流畅性”。
CRISPE 框架:
- 1. Capacity and Role(角色):明确 AI 在交互中应扮演的角色,如教育者、翻译者或顾问。
- 2. Insight(背景):提供角色扮演的背景信息,帮助 AI 理解其在特定情境下的作用。
- 3. Statement(任务):直接说明 AI 需要执行的任务,确保其理解并执行用户的请求。
- 4. Personality(格式):设定 AI 回复的风格和格式,使其更符合用户的期望和场景需求。
- 5. Experiment(实验):如果需要,可以要求 AI 提供多个示例,以供用户选择最佳回复。
CoT 框架:
Chain-of-Thought,一种引导大模型像人类一样,按照顺序一步步思考问题解决方案的方法。
主要包括 Few-Shot CoT 和 Zero-Shot CoT 两种应用方式。
Few-Shot CoT(少量示例)
描述思考步骤,先理解客户需求,再考虑
<目标>
,最后给出推荐并解释原因。
目标>
同时提供示例,这些示例展示 AI 如何依思维链思考给出答案。
Zero-Shot CoT(没有示例)
简单地增加一句提示词即可:
让我们一步步的思考(Let’s think step by step)
第四步,AI Agent 运行过程中产生的聊天记录、采集数据等内容存放到哪里?这个时候就需要数据库了。
对于非技术人员,我建议使用飞书的多维表格,因其可视化程度高、易于操作、对接简单。
不足之处是,当数据量变大时,读取速度会变慢,且无法处理复杂的业务逻辑。
而对于技术人员,可以使用 MySQL、NoSQL 等常用的数据库。
第五步,构建属于你自己的 UI 界面。在 Coze 上,你可以 DIY 自己的界面,而在 Dify 上则有现成的界面,只是不能修改。
这两个平台也都可以发布成服务 API,也就是说,你可以不使用它们提供的界面,而是独立开发一个界面,与其对接。
如果你要开发自己的界面,可以借助 Cursor 这样的 AI 编程平台,来定制开发一个。
还有一个原因需要你自己开发一个界面,那就是在 Coze 和 Dify 上,你可以定义多个 AI Agent,你可以用自己定义的界面来调用,这样可以让你在使用时,始终在一个界面上操作。
第六步,测试评估。测试是确保你的 AI Agent 不会出现错误,例如程序报错、大模型无法处理用户请求等问题。
评估则是确保 AI Agent 输出的回复是正确的。在评估的过程中,我们需要不断优化 AI Agent,确保它能够输出正确的回答,并减少 token 的消耗。
我们可以使用 LangSmith 来监控项目的运行。
LangSmith 帮助你更好地使用大模型:
- • 调试和测试:它可以帮助你找出程序中的问题,并提供解决方案,确保 AI Agent 能够正确地回答问题或完成任务。
- • 评估:通过创建各种测试案例,来测试 AI Agent 的表现,比如它回答问题的准确性和可靠性。
- • 监控:它可以实时观察 AI Agent 的工作状态,比如处理请求的速度、花费的成本等。
- • 日志记录:它可以记录 AI Agent 在工作过程中所有的详细信息,包括接收到的问题、给出的回答以及使用的参数等,方便你进行分析和改进。

第七步,部署发布。不同的 AI Agent 开发平台有不同的部署方式。Coze 可以直接发布到豆包、小程序等平台上,而 Dify 则可以直接发布为 Web 应用,或者嵌入到你的系统当中。
如果你是独立开发的 AI Agent,那么你可以购买服务器进行独立部署。
这就是我将在合集《从零到一打造 AI Agent》里介绍的一系列内容,非常开心与你一起深入研究这些内容,帮助你打造属于你自己的完美 AI Agent。
我相信你还有很多问题,后续的内容我们将一起深入研究和探讨。
如果你喜欢这个这篇文章,别忘了点赞、收藏和关注我,这样你就不会错过后续更详细的教程!
如果你有任何问题或想要探讨的内容,欢迎留言告诉我。
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
四、AI大模型商业化落地方案

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/242975.html原文链接:https://javaforall.net
