【helloAgent】第三次打卡：智能体经典范式

Ai探索者 • 2026年3月16日下午1:12 • 全栈程序员 • 阅读 2

第三次开始聚焦Agent的具体范式了，也就是Agent应该以何种方式运作？最经典的三种(1)ReAct 按图索骥，走一步看一步（2）Plan-and-Sovle 先列出计划再执行（3）Reflection 先打草稿，再不断优化形成文章。

请添加图片描述

在这里插入图片描述

比如说模拟面试的场景就可以混合范式。首先针对用户的背景进行面试题归纳（plan-and-solve）；然后根据用户对面试的反馈逐一去迭代问题（react）；最后面试结束，根据用户反馈给出综合评估与优化方案（Reflection）

要知道大模型的输出可能是锁不住格式的，正则表达式相当于是一个固定的mask。正常可能输出是这样的 … 。但万一输出抽风变成 …
或者 < thought>…
亦或是… 这样的呢?我们为了让输出更鲁棒，可以试一试RL微调，拉高正确格式奖励，避免错误输出；亦或是完全放弃正则，再用LLM做一个格式筛查，不符合的继续做就行了。

（未完待续）

发布者：Ai探索者，转载请注明出处：https://javaforall.net/235856.html原文链接：https://javaforall.net

【helloAgent】第三次打卡：智能体经典范式

关于作者

Ai探索者网站注册用户

【helloAgent】第三次打卡：智能体经典范式

关于作者

Ai探索者网站注册用户

相关推荐

2025年最新的 Claude 国内使用指南（支持Claude 4、Claude 4.5）

工信部专家提示 “龙虾”更新后依然存在安全风险

[保姆级教程] 还没有安装OpenClaw？试试智谱最新发布的AutoClaw

Claude Code新手入门指南：AI编程助手完全教程

扣子（Coze）Coze智能体飞书插件授权配置指南

完整教程：《以 Trae 为桥：高效集成豆包 1.6 API 的实践与思考》