01
智能体的定义
如果说去年是大型语言模型(LLM)的元年,那么今年可以称之为智能体(AI Agent)的元年,根据智能体(AI Agent)架构和组成方式不同,智能体可进一步分为两类:
02
智能体核心灵魂组成部分
2.1 智能体运行时核心组件
用一个简洁公式概括智能体的核心构成:智能体(AI Agent) = 大语言模型 (LLM) + 记忆 (Memory) + 规划 (Planning) + 工具 (Tools)+反馈(Reflection),智能体核心组件介绍如下:
图1:智能体的核心组件
2.2 RAG (检索增强生成)在企业落地最佳实践
检索增强生成(RAG)Agent 智能体技术辅助智能体提升信息存储利用率,提高信息更新速度,增强内容生成的可追溯性,支持智能体的持续学习和迭代。RAG 技术结合了信息检索(Retrieval)和文本生成(Generation),通过从外部知识库中检索相关信息来辅助生成更准确和上下文相关的文本这不仅是解决知识性幻觉、“开卷考试”的条件,从根本上降低了其“凭空捏造”的风险。
在企业级的复杂场景中,Naive RAG即简单地将用户问题向量化后进行搜索效果往往不佳,迫切需要采用更先进的RAG技术栈解决召回率(Recall)和精准度(Precision)的瓶颈,企业级RAG优化主要核心步骤如下:
随着RAG技术的发展,智能体在调用RAG技术时变得更加智能和高效,尤其是在面对复杂的需要多级拆解的问题时:
03
智能体成熟度模型:从简单工具到自主集群
腾讯研究院的《企业级智能体产业落地研究报告》提供了一个极具价值的 L1-L5 能力分级框架,模型的核心划分依据是智能体的自主性以及它与人类的协作关系,市场上主流智能体“绝大多数产品仍停留在 L1-L2 级别”,例如企业落地的“数字员工”主要是 L1 的智能知识库和 L2 的流程自动化助手,但是Gartner 预测到 2028 年70% 的 AI 应用将使用多智能体系统(L5)。
表1:L1-L5 能力分级框架
04
主流平台与框架对比:智能体构建者的工具箱
4.1 主流低代码平台对比:Coze VS Dify VS n8n
Coze 和 Dify 是原生智能体平台(以 LLM 为核心),n8n 是自动化平台(以流程为核心)。
表2:Coze VS Dify VS n8n平台对比
4.2 框架的核心思想:LangChain & LlamaIndex
05
智能体的“社会化”:协同、协议与互联
由于每个智能体往往只擅长特定领域的一件或者一类任务,复杂事件的完成需要多个不同功能的智能体一起完成,那么智能体之间如何协同、协议与互联的呢?不同公司纷纷推出了支持智能体互联的协议,可以分为上下文协议和智能体交互协议两类,其中前一类比较典型的有Anthropic的模型上下文协议(model context protocol,MCP),后一类比较典型的有智能体网络协议(agent network protocol,ANP)、谷歌的智能体对智能体协议(Agent2Agent,A2A)等。
5.1 新兴的AI协议“三件套”
以下是新兴的AI协议“三件套”核心协议草案(资料来源:中国信通院、中移/联通白皮书等):
5.2 产业落地:应用场景蓝图
图2:智能体应用场景
上图清晰地展示了智能体在金融、零售、文旅、教育、医学、出行、互联网等14个行业上百个具有代表性的智能体应用场景(图片来源于《企业级智能体产业落地研究报告》),其核心价值还体现在识别出那些最迫切需要“自主生产力”的业务环节,并设计出“稳定可用”乃至“成熟好用”的智能体解决方案,推动技术从“可能”走向“可行”,从“可行”走向“价值”。
另外IDC数据显示,超过64%的中国企业已进入智能体的测试验证和采购培训阶段,预计到2028年中国企业级智能体应用市场规模将达到270 亿美元。与此同时,生成式AI正加速渗透各个领域,2028年预计中国生成式AI占AI市场总投资规 模比例将达到30.6%,突破300亿美元,五年年复合增长率(CAGR)高达51.5%。当前,软件与信息服务行业以41亿美元领跑投资规模,预计2028年将达149亿美元;此外,医疗健康、能源、制造、交通出行和教育五大行业投资增速值得关注,预计将保持在64.3%-67.2%的高速年复合增长率,展示出强大发展潜力。
06
结论
如果说去年是大模型的元年,那么今年是智能体的(AI Agent)的元年,与此同时,智能体正推动AI基础设施从“资源规模导向”转向“业务价值创造”。智能体需要的不再是通用的算力,而是对特定能力的支撑。智能体的规模化落地,对AI基础设施提出了四大全新要求:
AI基础设施的演进加速智能体落地:反过来,新一代的AI基础设施正在通过提供“AI Agent服务平台”来加速智能体的落地。未来的AI基础设施不再仅仅是“卖算力”,而是会提供包括Agent运行时、安全沙箱、可观测性工具、乃至MCP协议栈等开箱即用的技术组件。这使得我们不必从零开始构建智能体的“身体”和“神经系统”,极大地降低了构建和部署智能体的门槛,让智能体的规模化应用成为可能。
往
期
回
顾
媲美英伟达下一代GPU Scale-up:字节版NVLink重塑MegaScale万卡集群网络?
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/239925.html原文链接:https://javaforall.net
