本文深入解析AI Agent的定义、发展、核心模块及产业链格局。AI Agent作为智能体的“大脑”,具备独立思考、自主执行和持续迭代能力,区别于传统虚拟助手,能真正“行动”。文章梳理了AI Agent与LLM、RAG、Copilot的关系,阐述了其发展四阶段(执行者、辅助者、参与者、协调者),并剖析了记忆、规划、工具、执行四大核心模块。市场方面,2025年被视为AI Agent元年,预计至2028年市场规模将达8520亿元,年均复合增长率72.7%,应用场景广泛,产业链涵盖基础设施、研发集成、应用终端等环节。建议关注科大讯飞、金山办公等AI Agent应用及垂类应用公司。

1、定义:
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。 在AI领域,被赋予了一层新的含义:具有自主性、反应性、交互性等特征的智能“代理”。能够基于目标和对现状能力的认知,在环境约束中,依赖特定资源和现有工具,找到行动规则并将行动拆解为必要的步骤,自主执行步骤,达成目标。
AI Agent智能体比较难理解,简单点,agent就好比你的私人代理。比如你是一家公司的总经理,那agent就是你的总经理助,你只需要给他设定目标和检查结果,其他都可交给他,他能把复杂流程的干的出色,还帮您分析给出最优建议,并最终向你汇报。
Al Agent 具备三个核心能力:
(1)独立思考: Al Agent 能够根据给定任务目标和约束条件,进行任务规划和问题拆解,形成执行步骤(即工作流);
(2)自主执行:能够调取各类组件和工具,按照执行步骤依次执行,实现任务目标;
(3)持续迭代: AlAgent能够自动记录任务目标、工作流和执行结果,基于结果反馈,沉淀专家知识和案例。
2、与Copilot 、LLM、RAG的联系&区别
(1)LLM
LLM,Large Language Model,即 大语言模型,是基于海量文本数据训练的深度学习模型,能够生成自然语言文本、深入理解文本含义,并处理各种自然语言任务,如文本摘要、问答、翻译等。简单理解是语言的逻辑推理,如我们常见的Chat GPT、文心一言、豆包、Kimi等
Agent 是智能体,LLM就是智能体的“大脑”,核心控制器,能提升AI Agent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验。
AI Agent =LLM x (规划+记忆+工具+行动)
(2)RAG
RAG(Retrieval Augmented Generation)即检索增强生成,通过结合大型语言模型与检索机制,显著提升了生成内容的准确性和相关性。其核心在于利用向量数据库存储和检索大量上下文信息,以辅助生成模型在生成文本时做出更明智的决策。这种方法不仅提高了生成内容的质量,还增强了模型的解释性和可控性。
在大模型时代,由于之前训练好的大模型数据没有跟新,为了解决LLM知识有限的问题,需要把外部的新知识提供给LLM进行学习,让它理解之后表达出来,这时候就需要用到RAG技术,RAG 通过加入外部数据(如本地知识库、实时数据等)来增强 AI 模型的检索和生成能力,提高信息查询增强过程和生成质量。比如:文心一言的插件服务,支持把实时又或者私有化知识提供给LLM。
(3)Copilot
Al Copilot 是微软推出的一款人工智能助手,基于大模型技术的智能化应用,不仅可以聊天,还能搜索、编辑文档,生成图像等,提升工作效率。AI Copilot 基于微软的 Prometheus 模型,该模型基于 OpenAI 的 GPT-4 构建,具备强大的文本生成和数据处理能力
Copilot 需要人的指挥;Agent则是直接面对目标任务,具有自主记忆、推理、规划和执行的全自动能力,因此终极形态的AI Agent只需要用户的起始指令和结果的反馈,过程中并不需要人的介入。自主性是 Al Agent 和 Al Copilot 之间最大的区别。Al Copilot 是“副驾驶”,只是提供建议而非决策,Al Agent 是“主驾驶”需要真正做出决策并开展行动。
(4)三者的联系
AI Agent 会利用 LLM 的推理能力,把问题进行拆解,形成一个一个的小问题,并定义好这些小问题之间的前后关系,先处理哪个,再处理哪个。然后按照顺序,调用 LLM 、 RAG 或者外部工具,来解决每一个小问题,直至解决最初的问题。
Copilot是 Agent 的发展过程和探索,是单纯的copilot,基于企业自身的决策进行智能辅助、智能决策,还是最终呈现出Agent的形态。业界一个形象的比喻,如果说copilot是单纯的二维世界,那么Agent则是三维空间,从二维到三维,需要的不再是scaling law的强大魔力,而更多是业务关系的本质理解,即产业大模型的训练和出发点应该是什么。
目前 AI Agent 已经在B端大量使用,按照AI在企业的业务流程智能化程度,可以将 Al Agent 分成四个阶段:执行者、辅助者、参与者、协调者。
第一阶段:“执行者”,按照既定规则和流程执行任务,不具备决策和调整流程能力,适用于重复性高场景;
第二阶段:“辅助者”,能够根据实际情况提供相关信息和建议,辅助业务人员做出决策;
第三阶段:“参与者”,具备一定自主决策能力,能够基于实际情况调整业务流程中的某些环节优化整个流程,但还是基于一定现有流程框架实现:
第四阶段:“协调者”,能够深入理解业务流程的目标和本质,根据环境条件变化,提出全新业务流程设计方案,执行到位,达成业务目标。
当前在B端企业办公等少数应用场景已经达到“参与者”阶段,还未出现“协调者”阶段应用。
另外,我们以感知能力、认知能力、执行能力、规划能力 4个维度来评判,AI agent 从单一的感知、利用督促来获得认知、半自动化的执行和规划,到超高精准的感知、利用环境自主学习提升认知、100%全面自动化执行计划和反思能力的迭代(类似于智能汽车无人驾驶的L1向L4完全无人驾驶趋势发展)
未来,其工作范式也将从面向过程VS面向目标转变,从以人为中心到以人为辅助的智能进化。

AI Agent 核心四大模块的: 记忆、规划、工具和执行,我们认为,需要重点关注的是记忆、规划和工具相关组件的建设。

1、记忆包含短期记忆和长期记忆,
短期记忆:所有的上下文学习都是利用模型的短期记忆来学习的。反应的是 Agent 的当前情况,即在执行任务和与环境交互时产生的信息和数据,它存储了 Agnet 最近的感知输入、目标以及中间内部推理的结果;
长期记忆:为 Agent提供了在较长时间内保留和调用(无限)信息的能力,通常是通过利用外部向量存储和快速检索。包括语义记忆、程序记忆和情景记忆。其中,语义记忆是可用自然语言描述的记忆;程序记忆是企业内部的业务流程与 SOP; 情景记忆是过去业务情景的复现。
2、规划包含工作流、思维链、提示词工程等,主要是通过这些方式,充分激发大模型的能力,实现针对任务目标的问题拆解和任务规划。
规划模块将利用LLM来分解一个详细的计划,其中将包括子任务以帮助解决用户问题。用于任务分解的常用技术包括思路链和思念之树可分别分为单路径推理和多路径推理。
子目标和分解: Agent将大型任务分解为较小的、可管理的子目标,从而能够高效处理复杂任务,
反思和完善: Agent可以对过去的行为进行自我批评和自我反省,从错误中吸取教训并为未来的步骤进行改进,从而提高最终结果的质量。
3、工具分成执行类工具、算法类工具和信息类工具。
执行类:主要是成熟应用程序,如计算器等,弥补大模型的能力短板(不擅长数值计算等问题);
算法类:包含规则引擎算法、机器学习算法、深度学习算法以及基于大模型开发的 AI 算法;
信息类:主要是具备实效性工具,解决大模型信息滞后问题(如天气、日历等)。
综合来看,【记忆】和【规划】是当前学术概念下的关键功能点,但受限于市场发展早期,在实际的商业产品落地中【记忆】和【规划】能力未必能完全呈现。
2025年被定义于 AI Agent 的元年,先看训练数据上,2022年,全球数据规模已达到103ZB (1ZB=十万万亿字节),中国数据规模达到23.9ZB; 预计2027年,全球数据规模可达到 284.3ZB,中国数据量规模则可达到 76.6ZB,近五年的CAGR为 26%,超过全球增长速度。
国产大模型自2023年7月开始进行密集发布,截至2023年7月,国产大模型累计数量达到300个,并且涉及金融、制造、电商、法律、教育、医疗、娱乐等多个垂直细分领域。
中国 AIAgent市场潜力无限,在企业B端、消费C端均大有可为。2023年中国AI Agent市场规模为554亿元,预计至2028年将达8520亿元,其年均复合增长率为72.7%。AI Agent于2023年正式引入行业并重新定义,随着AI的发展,垂直领域的AI Agent 正逐渐成为新宠,其市场规模预计可达SaaS的十倍,创造超过 3000亿美元的独角兽企业。

AI Agent市场规模包括ToC端和 ToB端的应用价值:
1)在B端场景下,AIAgent将对 SaaS应用进行全面重构,与传统知识库结构化管理模式相比,AIAgent的向量数据库能自动学习和理解文档,实现更加高效知识管理;
2)在C端场景下,AAgent作为生成式AI的商业化应用,可以广泛应用于电商、教育、旅游、酒店以及客服等行业,带来传统行业的升级转型。
AI Agent产业链上游可以分为基础设施与技术供应商;中游为 AI Agent研发与集成商,主要可以分为系统集成厂商、软件开发厂商以及解决方案供应商,其中目前大部分企业正在处于优化产品和探索应用场景阶段;下游主要为应用与终端客户。
- 上游:基础设施与技术提供商
国内主要可以分为AI芯片、服务器集成厂商、算法框架、大模型厂商、数据服务商以及云计算平台等
(1)算法框架:业内通常使用谷歌Tensorflow和脸书Pytorch作为AI算法框架,昇思MindSpore于2023年打造业界首个AI融合框架,提供全面的分布式并行能力。
(2)大模型:AI Agent的核心驱动力是大语言模型。因此,大型的开发者在产业链中占据重要地位,提供基础模型和算法支持,使得AI Agent能够具备感知、理解、决策和执行的能力。2024年国产大模型前十名单:字节豆包、月之暗面Kimi、百度文心一言、清华智谱AI、科大讯飞讯飞星火、昆仑万维天工等
(3)AI 芯片 :是灵魂,当前主流的AI agent 芯片主要分为三类,GPU、FPGA、ASIC:
①、GPU:英伟达NVIDIA一家独大,占据81%的市场份额,其次是AMD和Intel,分别占据18%和1%的市场份额;国内厂商:寒武纪、景嘉微、海光信息、天数智芯,功能和应用领域等方面都有了提升;
②、ASIC :博通AVGO、美满电子MRVL 两家全球巨头;国内寒武纪、芯原股份、嘉楠科技 CAN 也在奋力直追;
③、FPGA:安路科技是国内FPGA业务领军企业;复旦微电是FPGA芯片重要供应商。
(4)服务器: 国内龙头公司:inspur浪潮、 Sugon 中科曙光和华为;
(5)数据服务:国外:澳大利亚的Appen;国内:浪潮 、 标贝科技是龙头
2.中游AI Agent研发与集成商:
负责将大模型与其他技术组件(如规划、记忆、工具使用和行动模块)相结合,开发出具有特定功能和应用场景的 AI Agent产品。通常拥有强大的研发团队和技术实力,能够不断优化和迭代产品以满足市场需求。
(1)系统集成:国内头部是–联想 、科大讯飞、用友 、钉钉 、 况客科技、 Moka公司
(2)软件平台开发:面壁智能 、实在智能、汇智智能 、澜码科技 、联汇等都是国内不错的公司;
(3)解决方案提供商: 华为云 、百度智能云、 阿里云、 腾讯云 京东云 天翼云等国内公司。
3.下游应用厂商:
AI Agent的应用场景广泛,包括智能客服、个人助理、自动驾驶、软件开发、财务管理等多个领域。应用厂商根据不同行业和场景的需求,利用A Agent 技术开发出各种应用产品和服务,直接面向终端用户,负责产品的推广和销售。
(1)应用开发者:旷视、海康微视、云从科技、云知声等巨头
(2)行业服务商:科大讯飞、地平线、海尔智家、大疆、格灵深瞳等企业
附AI Agent 产业链图谱


随着OpenAI 的 Operator 智能体采用了“计算机使用智能体(Computer-Using Agent,CUA)模型,结合了 GPT-4o 的视觉识别能力和高级推理技术,可以通过截图“理解”网页,并像人类一样精准操作鼠标和键盘、进行交互,无需使用特定于操作系统或网络的 API,让AI 智能体实现跨越式进步。
目前,已经有许多的大厂纷纷涌入这场AI Agent 攻城略地,就如最近微软上线 Microsoft 365 Copilot Chat,通过 GPT-4o AI 模型驱动,为 微软 365 商业用户提供安全的 AI 聊天体验,并接入按用量计费的 Agents 应用;而国内、字节豆包、百度、小米等多家科技公司也在疯狂厮杀,已在旗舰产品中融入大模型,促使应用生态调整接口。头部科技公司均在悄然发力C端市场,推出了自研Al agent,并在新旗舰产品中融入大模型促使应用生态调整接口,逐步形成模型生态。
未来,AI Agent的市场规模可能是SaaS市场的10倍,甚至部分取代Saas,相信很快,AI Agent将迈向更高层次的协作与协同工作阶段,AI Agent集群与AI Agent网络,以空前规模、洪荒之势重新定义生产力和问题解决能力。而垂直细分的AI Agent应用将遍地生花,其应用领域之广,将占领人们生活的方方面面。。。
最后,建议关注的AI Agent 应用公司如下:
AI Agent 应用:科大讯飞、金山办公、彩讯股份、焦点科技、鼎捷数智、泛微网络、拓尔思、迈富时、汉得信息、致远互联、金蝶国际等;
AI 垂类应用:三月之暗面 Kimi 教程六零、万兴科技、昆仑万维、虹软科技、润达医疗、美图公司、商汤-W 等。
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【】


我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是激活成功教程困局、推动AI发展的关键。


1、大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

2、大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

3、AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

4、大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

5、大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

适用人群

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【】

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/274127.html原文链接:https://javaforall.net
