为什么不建议构建多智能体？《Don’t Build Multi-Agents》博客解读

最近几个月在做复杂智能体，结合自己的实际经历，正有一些感想和踩坑想吐槽下；正好今天看到这篇

Don’t Build Multi-Agents

博客，深有共鸣；所以决定对这篇博客内容进行结合个人观点的解读分析，供大家参考；

该博客针对当前AI代理开发领域的流行框架—Multi-Agent范式提出针对性批判，并提出构建可靠AI智能体的核心原则。

作者（Walden Yan）开篇直指问题——认为当前流行的多代理框架（Multi-Agent范式，如OpenAI的Swarm和Microsoft的AutoGen）违背了认知可靠性的基本原理：

作者类比了Web开发史：1993年诞生HTML，2013年React革新前端开发。2025年的AI智能体领域类似“原始HTML时代”，缺乏成熟框架。主流库如OpenAI的Swarm和微软的AutoGen推广多智能体架构，但作者认为这是错误方向。

（来源：原文配图，展示任务分解导致的上下文割裂）

作者（Walden Yan）提出两个不可妥协的构建可靠代理的基本规则：

智能体的每个动作必须基于系统中所有相关决策的完整上下文。
问题示例：当主智能体将任务拆分为子任务（如“构建Flappy Bird克隆”拆分为“背景”和“小鸟”子任务）时，若子智能体Agent 智能体仅接收子任务而缺乏主任务历史，可能误解需求（如将背景误做成超级玛丽风格）。
解决方案：传递完整的智能体轨迹（agent trace），而非单个消息。
生物学基础：人脑前额叶皮质持续整合感官输入和工作记忆。

（来源：原文配图，展示上下文串联传递模式，但并行过程中可能因缺乏协调而导致潜在的冲突决策）

违反这两个原则的架构本质是脆弱的

毕竟，当前大模型本身也是单线程的范式（just predict next token）

基于上述原则，作者提出二种可靠架构方案：

2. 压缩中继：上下文压缩模型（Context Compression Model）

总结：

架构类型	上下文处理方式	可靠性指数	适用场景
基础单线程	原始全量上下文 -> 信息无损压缩	★★★★☆	中、短任务（10分钟内）
压缩中继	动态摘要关键决策 -> 信息有损压缩	★★★☆☆	长任务（几十分钟甚至几小时）

案例：

本人之前复现的Deepsearch属于单线程

manus属于压缩中继类型

当智能体范式从多线程回归单线程，也就意味着未来的大模型需要更关注上下文窗口（支持更长的上下文窗口），正如sam altman在前些天的一个访谈节目中提到的那样：

访谈节目

sam altman：

一个非常小的模型，拥有超人类的推理能力，运行速度极快，有
1 万亿 token 的上下文窗口，并能调用你能想到的所有工具。在这个设定下，问题是什么、模型有没有现成知识或数据，其实都不重要”

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/236743.html原文链接：https://javaforall.net

为什么不建议构建多智能体？《Don’t Build Multi-Agents》 博客解读