【helloAgent】第三次打卡:智能体经典范式

【helloAgent】第三次打卡:智能体经典范式

第三次开始聚焦Agent的具体范式了,也就是Agent应该以何种方式运作?最经典的三种(1)ReAct 按图索骥,走一步看一步(2)Plan-and-Sovle 先列出计划再执行 (3)Reflection 先打草稿,再不断优化形成文章。

请添加图片描述

在这里插入图片描述

比如说模拟面试的场景就可以混合范式。首先针对用户的背景进行面试题归纳(plan-and-solve);然后根据用户对面试的反馈逐一去迭代问题(react);最后面试结束,根据用户反馈给出综合评估与优化方案(Reflection)

要知道大模型的输出可能是锁不住格式的,正则表达式相当于是一个固定的mask。正常可能输出是这样的 。但万一输出抽风变成
或者 < thought>…
亦或是… 这样的呢?我们为了让输出更鲁棒,可以试一试RL微调,拉高正确格式奖励,避免错误输出;亦或是完全放弃正则,再用LLM做一个格式筛查,不符合的继续做就行了。

(未完待续)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/235856.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午1:12
下一篇 2026年3月16日 下午1:12


相关推荐

关注全栈程序员社区公众号