Chain-of-Agents: OPPO推出通用智能体模型新范式,多榜单SOTA,模型代码数据全开源

Chain-of-Agents: OPPO推出通用智能体模型新范式,多榜单SOTA,模型代码数据全开源

OPPO个性化AI实验室负责人,主要研究方向是AI个性化、智能体的自主进化和强化学习、以及大模型和智能体的记忆系统等。本文核心贡献者均来自OPPO个性化AI实验室的AI智能体团队。

近年来,以多智能体系统(MAS)为代表的研究取得了显著进展,在深度研究、编程辅助等复杂问题求解任务中展现出强大的能力。现有的多智能体框架通过多个角色明确、工具多样的智能体协作完成复杂任务,展现出明显的优势。然而,现阶段的 MAS 依然面临一些关键限制:

  • 计算开销高:智能体之间频繁冗余的通信和复杂的工作流设计导致效率不高。
  • 泛化能力有限:面对新领域或新任务时,需要大量的 prompt 设计与工作流配置。
  • 缺乏数据驱动的学习能力:难以通过智能体任务数据实现持续提升性能。
  • 底层的大语言模型(LLMs)未原生支持多轮、多智能体、多工具交互,仍依赖 prompt 工程实现。

同时,近期兴起的工具融合推理(TIR)模型,通过显式地将工具使用融入推理过程,显著提升了单智能体框架(如 ReAct)在信息检索任务中的表现。然而,传统的 TIR 模型,无法直接支持多智能体系统的原生训练与协作。

针对上述瓶颈,本文提出了一种全新的智能体推理范式——Chain-of-Agents(CoA)。与传统的 TIR 模型仅支持单一智能体的「思考-Agent 智能体行动-观察」模式不同,CoA 框架能够灵活定义多个角色和工具的智能体,在单一模型内动态激活,实现端到端的多智能体协作。

  • 论文:https://www.arxiv.org/abs/2508.13167
  • 主页:https://chain-of-agents-afm.github.io/
  • 代码:https://github.com/OPPO-PersonalAI/Agent_Foundation_Models
  • 模型:https://huggingface.co/collections/PersonalAILab/afm-models-e11d0b21a67c015ba8
  • 数据:https://huggingface.co/collections/PersonalAILab/afm-datasets-eaad360ea5ccdcde1

与传统的 MAS 相比,CoA 无需复杂的 prompt 和工作流设计,降低了智能体间的通信开销,并支持端到端训练,显著提升了系统的效率和泛化能力。经过训练后,具备原生 CoA 问题求解能力的模型称为 Agent Foundation Model(AFM)。

在实验上,AFM 展示了卓越的性能和高效的推理能力,在近 20 项复杂任务和基准测试中全面刷新记录:在 Agentic 任务中,其在 GAIA 基准上以 32B 模型实现了 55.4% 的 Pass@1 成功率;在代码推理方面,AFM 在 LiveCodeBench v5 上的 47.9% 准确率和在 CodeContests 上的 32.7% 成绩均显著超越现有 TIR 方法。同时,它将推理成本(token 消耗)减少高达 85.5%,在保持领先性能的同时大幅提升效率。

CoA 的架构范式

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/244013.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月15日 下午9:14
下一篇 2026年3月15日 下午9:14


相关推荐

关注全栈程序员社区公众号