- 一、海外代表公司及产品
- 二、中国代表公司及产品概览
- 三、各家模型版本详表(按公司)
- 四、技术路线与开源/闭源速览
- 五、信息更正与 2025–2026 动态速览
- 六、其他值得关注的生态
- 七、关键能力横向对比与跑分榜单
- 免责声明
本文按时间线与公司梳理大模型应用、主要公司与产品。
OpenAI(美国)
| 产品/模型 |
时间 |
说明 |
| Codex |
2021 起 |
专为编程设计,GitHub Copilot 技术基础。 |
| ChatGPT |
2022.11 |
基于 GPT-3.5 的对话式 AI,多轮对话、写作、编程;大模型「出圈」标志。 |
| GPT-4 系列 |
2023 起 |
多模态、插件与 GPTs,演变为 AI 应用平台。 |
Anthropic(美国)
| 产品/模型 |
时间 |
说明 |
| Claude 系列 |
2023 起 |
长文本与安全对齐,企业文档分析、代码审查等。 |
| Claude Code |
2025.02 起 |
终端 AI 编程助手,多语言、自动改代码与测试。 |
| Claude Sonnet 4.5 |
2025.09 |
复杂推理与自主编程,OSWorld 等测试表现突出。 |
| Claude Agent SDK |
2025.10 |
构建金融、个人助理等自主智能体。 |
| Claude Cowork |
2026 起 |
对话式创建定制插件,融入 HR、运营、设计等流程。 |
| 公司 |
产品/品牌 |
时间 |
说明 |
| 百度 |
文心一言 (ERNIE Bot) |
2023.03 |
多语言、多模态,金融、政务、教育等。 |
| 阿里巴巴 |
通义千问 / 千问 |
2023.09 |
超大规模语言模型,多轮对话、创作、推理;后开源 72B/32B 等;2026.03 品牌统一为「千问」。 |
| 字节跳动 |
豆包 |
2023 下半年 |
轻量、响应快,结合抖音/头条生态;豆包 2.0 支持全模态与长链路 Agent。 |
| 科大讯飞 |
星火认知大模型 |
2023 起 |
中文理解与教育场景,星火 App、教育机器人等。 |
| 商汤科技 |
商量 SenseNova |
2023 起 |
视觉+文本多模态,智慧城市、自动驾驶、医疗影像等。 |
| MiniMax |
abab / MiniMax 大模型 |
2023 起 |
对话与轻量部署,内容生成、智能客服;M2.5 等面向 Agent 与编程。 |
| 智谱 AI |
ChatGLM / GLM 系列 |
2023 起 |
中文优化、开源多,科研、教育、企业服务。 |
| 昆仑万维 |
天工 Skywork |
2023 起 |
多语言、开放 API,内容创作、办公自动化。 |
| 百川智能 |
百川大模型 |
2023 起 |
中文通用,搜索增强、知识问答。 |
| 深度求索 |
DeepSeek 系列 |
2024.12 起 |
VL2/V3 等开源,政务、医疗、金融等;增长迅速。 |
OpenAI
| 时间 |
模型/产品 |
版本/代号 |
说明 |
| 2022-11 |
ChatGPT |
GPT-3.5 |
对话式 AI,引爆大模型热潮。 |
| 2023-03 |
GPT-4 |
GPT-4 |
多模态大模型。 |
| 2023-03 |
GPT-4 Turbo |
gpt-4-1106-preview 等 |
成本与上下文优化。 |
| 2023-09 |
DALL·E 3 |
– |
文生图,深度集成 ChatGPT。 |
| 2024-02 |
Sora |
– |
文生视频。 |
| 2024-05 |
GPT-4o |
gpt-4o |
原生多模态,音视频实时交互。 |
| 2024-07 |
GPT-4o mini |
gpt-4o-mini |
轻量、低成本。 |
| 2024-09 |
o1 |
o1-preview / o1 |
推理模型,「先思考再回答」。 |
| 2024-12 |
o3 |
– |
面向 STEM 与复杂推理。 |
注:截至当前,OpenAI 官方旗舰仍以 GPT-4o / GPT-4o-mini 及 o 系列为主;GPT-5 等名称为媒体或社区说法,以官网发布为准。
Anthropic
| 时间 |
模型/产品 |
版本/代号 |
说明 |
| 2023-03 |
Claude |
Claude 1.0 |
安全与对话。 |
| 2024-03 |
Claude 3 |
Opus / Sonnet / Haiku |
系列化,Opus 最强、Haiku 最快。 |
| 2024-06 |
Claude 3.5 |
Claude 3.5 Sonnet |
推理与长文本增强。 |
| 2025-02 |
Claude 3.7 |
Claude 3.7 Sonnet |
「扩展思维」模式。 |
| 2025 起 |
Claude 4.x |
Claude 4.0 / 4.1 等 |
新一代系列。 |
阿里巴巴(通义千问 / 千问)
| 时间 |
模型/产品 |
版本/代号 |
说明 |
| 2023-04 |
通义千问 |
Qwen1 |
开源 7B–72B。 |
| 2024-06 |
通义千问 |
Qwen2 |
代码能力提升,多编程语言。 |
| 2024 |
通义千问 |
Qwen2.5 |
性能与资源均衡。 |
| 2025-04 |
通义千问 |
Qwen3 |
旗舰,MoE,256K 上下文。 |
| 2025-12 |
通义千问 |
Qwen3-VL / Qwen3-Omni |
视觉-语言;全模态(文本/图像/音频/视频)。 |
| 2026-03 |
千问 |
品牌统一 |
AI 核心品牌统一为「千问」。 |
字节跳动(豆包)
| 时间 |
模型/产品 |
版本/代号 |
说明 |
| 2024-05 |
豆包 |
豆包 1.0 |
多模态,依托抖音生态。 |
| 2025 |
豆包 |
豆包 1.5 |
语音与内容生成优化。 |
| 2026-02 |
豆包 |
豆包 2.0 (Seed 2.0) |
全模态感知与长链路 Agent。 |
百度(文心一言)
| 时间 |
模型/产品 |
版本/代号 |
说明 |
| 2023-03 |
文心一言 |
ERNIE Bot 1.0 |
基于文心大模型对话。 |
| 2024 |
文心一言 |
ERNIE Bot 4.0 |
逻辑推理与代码增强。 |
| 2025 |
文心一言 |
ERNIE Bot 4.5 / 5.0 |
多模态与行业应用。 |
深度求索(DeepSeek)
| 时间 |
模型/产品 |
版本/代号 |
说明 |
| 2024 |
DeepSeek |
DeepSeek-V2 / V2.5 |
MoE,高性价比。 |
| 2024-12 |
DeepSeek |
DeepSeek-V3 |
超大 MoE,671B 科大讯飞 星火 教程 总参数。 |
| 2025-01 |
DeepSeek |
DeepSeek-R1 |
推理专用,数学与代码。 |
| 2026-02/03 |
DeepSeek |
DeepSeek-V4 |
长上下文、多模态等(以官方发布为准)。 |
注:V3.2、R1-0528 等多为社区或媒体称呼,正式版本以官网为准。
智谱 AI(GLM)
| 时间 |
模型/产品 |
版本/代号 |
说明 |
| 2023 |
ChatGLM |
ChatGLM2 / 3 |
开源对话,长文本。 |
| 2024-06 |
智谱大模型 |
GLM-4 |
旗舰,128K 上下文。 |
| 2024 |
智谱大模型 |
GLM-4.5 / 4.6 |
推理与多模态。 |
| 2025 |
智谱大模型 |
GLM-5、GLM-4 Plus、CogView4、CogVideoX 等 |
对话、多模态、图文/视频生成。 |
其他中国厂商(选列)
| 公司 |
模型/产品 |
版本/说明 |
| 百川智能 |
百川大模型 |
Baichuan 1/2/3/4,Baichuan-M2(医疗),Baichuan4-Finance。 |
| MiniMax |
海螺AI、MiniMax-01 |
视频生成;线性注意力、长文本。 |
| 昆仑万维 |
天工 Skywork |
Skywork-MoE、Skywork-OR1-32B、Skywork-R1V3-38B。 |
| 零一万物 |
Yi 系列 |
Yi 1.5/1.6/Large,Yi-Vision,Yi-Coder。 |
| 上海 AI Lab |
InternLM |
InternLM2.5,InternLM-Math,InternVL-Chat。 |
其他国际主流(选列)
| 公司 |
模型/产品 |
版本/说明 |
| Google |
Gemini |
Gemini 1.5 Pro(百万级上下文)、2.0、2.5。 |
| Meta |
Llama |
Llama 2/3、3.1(含 405B)、3.2、3.3。 |
| IBM |
Granite |
Granite 3.2、Granite Vision。 |
| xAI |
Grok |
Grok-1.5/2/3 及 mini 等。 |
4.1 技术路线与特色(选列)
| 公司/产品 |
架构/路线特点 |
典型能力侧重 |
| OpenAI |
密集 Transformer、o 系列推理模型 |
多模态、实时交互、推理与代码 |
| Anthropic |
宪法 AI、混合推理(快/扩展思维) |
长文本、安全对齐、编程与智能体 |
| Google |
Gemini、多模态与搜索整合 |
百万级上下文、多模态、生态整合 |
| Meta |
LLaMA 系列,开源可商用 |
开源基座、多规模、多模态版本 |
| 阿里 千问 |
Qwen 系列,MoE(Qwen3) |
长上下文、代码、开源与多模态 |
| 深度求索 |
DeepSeek-V/R 系列,MoE |
高性价比、推理(R1)、数学与代码 |
| 智谱 |
GLM 系列,CogView/CogVideo |
中文、多模态、图文/视频生成 |
| 字节 豆包 |
多模态、Seed 系列 |
全模态、抖音/飞书生态、Agent |
| 百度 文心 |
ERNIE,多模态 |
搜索与文库整合、行业应用 |
| 月之暗面 Kimi |
长上下文、Agent |
超长文本、长文档阅读、推理 |
4.2 开源与闭源速查(概览)
| 类型 |
代表产品/系列 |
说明 |
| 闭源 / API 为主 |
ChatGPT(GPT-4o)、Claude、Gemini、文心、豆包、Kimi |
能力强、迭代快;依赖厂商 API 与合规。 |
| 开源可商用 |
LLaMA、Qwen、DeepSeek、GLM、Yi、InternLM、百川、混元图像 |
可私有化部署、微调;社区与生态活跃。 |
| 开源 + 闭源双线 |
千问(开源 Qwen + 闭源服务)、智谱(开源 GLM + 闭源) |
兼顾开放与商业产品。 |
4.3 应用场景速览
| 场景 |
典型产品/方向 |
| 通用对话与写作 |
ChatGPT、Claude、千问、文心、豆包、Kimi |
| 编程与代码 |
Claude Code、GitHub Copilot、DeepSeek-R1、Qwen、GLM |
| 办公与效率 |
Copilot、飞书/豆包、通义、WPS AI、钉钉 |
| 教育 |
星火、文心、Kimi(长文档)、各类作业辅导与口语 |
| 政务与 ToG |
文心、通义、DeepSeek、华为盘古、360 智脑 |
| 金融与合规 |
千问、文心、百川金融、Claude、企业版模型 |
| 多模态创作 |
DALL·E、Sora、可灵、混元图像、CogView、海螺AI |
| 终端与硬件 |
小爱、蓝心、OPPO 等手机/车机;千问 AI 眼镜 |
信息更正
- GPT-5 系列:截至当前,OpenAI 未正式发布 GPT-5、5.1 等;旗舰仍为 GPT-4o / GPT-4o-mini 及 o 系列。
- DeepSeek:V3.2、R1-0528 等多为非官方版本号,官方里程碑以 DeepSeek-V3、DeepSeek-R1 等为准。
2025–2026 关键动态(选列)
| 时间 |
公司/机构 |
模型/产品 |
关键信息 |
| 2025-01 |
深度求索 |
DeepSeek R1 |
推理专用,数学与代码,性价比高。 |
| 2025-02 |
智谱 AI |
GLM-5 |
新一代旗舰,复杂任务与视频生成。 |
| 2025-02 |
字节跳动 |
豆包 2.0 |
多模态与长视频理解。 |
| 2025-02 |
快手 |
可灵 3.0 |
图/文生视频、智能编辑。 |
| 2025-02 |
腾讯 |
混元图像 3.0 |
开源图生图,图片编辑、风格变换、老照片修复等。 |
| 2025-03 |
阿里巴巴 |
千问 AI 眼镜 |
首款 AI 硬件,点外卖、订酒店等。 |
| 2025-09–11 |
蚂蚁集团 |
百灵大模型 |
Ring-1T、Ling-1T 等开源与多模态。 |
| 2026-02 |
蚂蚁集团 |
百灵 Ming-Flash-Omni 2.0、Ring-2.5-1T、企业版 |
全模态、万亿参数思考模型、企业场景。 |
| 2026-02/03 |
深度求索 |
DeepSeek V4 |
长上下文、多模态(以官方为准)。 |
| 2026-03 |
阿里巴巴 |
千问 |
品牌统一为「千问」。 |
| 公司/体系 |
产品/定位 |
说明 |
| 华为云 |
盘古大模型 |
NLP、CV、科学计算,分层解耦,工业、金融等。 |
| 科大讯飞 |
星火认知大模型 |
中文与教育,AI 学伴、口语陪练、智能客服等。 |
| 京东 |
言犀大模型 |
智能客服与导购,零售、物流。 |
| 360 |
360 智脑 |
通用问答与搜索增强,安全分析、内容审核、API。 |
| 月之暗面 |
Kimi |
超长文本与多轮对话,长文档阅读,科研、法律等。 |
| 腾讯 |
混元大模型 |
通用与多模态,含混元图像等;应用于内部产品与开放能力。 |
| 小米 / vivo / OPPO |
小爱大模型、蓝心大模型等 |
终端侧大模型,手机、家居等本地化体验。 |
关键能力横向对比(简要)
下表为公开评测与报道中的典型表现,供参考;具体以各榜单与官网为准。
| 模型(公司) |
代码生成 |
数学推理 |
多模态 |
| Claude Opus 4.x (Anthropic) |
SWE-bench 等领先,多文件与复杂工程 |
ARC-AGI 等推理突出 |
长上下文、文档/代码库、多模态 |
| GPT-4o / o 系列 (OpenAI) |
SWE-bench 第一梯队 |
AIME 等稳健 |
文本/图像/音频/视频,实时交互 |
| DeepSeek V3/R1 (深度求索) |
性价比高,接近前沿 |
AIME、高考数学等顶尖 |
当前以文本为主 |
| Qwen 3.x (阿里) |
SWE-bench 国产第一梯队 |
AIME 顶尖 |
长上下文、Qwen-VL 图文 |
| GLM-5 (智谱) |
SWE-bench 国产顶尖 |
AIME 优秀 |
200K 上下文,多模态增强 |
| Kimi K2.x (月之暗面) |
长文档代码理解强 |
AIME 等竞赛领先 |
超长文本与 Agent |
| 豆包 2.0 (字节) |
工程能力快速追赶 |
高考数学等优秀 |
文/图/视频,抖音/飞书集成 |
| 文心 5 (百度) |
公开编程基准较少 |
公开数学专项较少 |
与搜索、文库等深度整合 |
主流跑分榜单与评测网站
| 类型 |
名称 |
网址/说明 |
| 综合/对战 |
Chatbot Arena (LMSys) |
chat.lmsys.org;用户对战 Elo 排名。 |
| 综合/多维 |
Artificial Analysis |
artificialanalysis.ai;速度、价格、准确率等。 |
| 开源 |
Hugging Face Open LLM Leaderboard |
huggingface.co/spaces/Hugg… 等。 |
| API 热度 |
OpenRouter Rankings |
openrouter.ai/rankings;按调… |
| 中文/国内 |
AI 工具集 – 大模型评测 |
ai-bot.cn;国内外模型评测汇总。 |
| 中文/国内 |
AIGC 大模型排行榜 |
aigc.izzi.cn;多场景综合排行。 |
| 专项 |
SWE-bench |
真实 GitHub 项目 Bug 修复能力。 |
| 专项 |
AIME / MATH |
数学竞赛与数学基准。 |
| 专项 |
OSWorld / AgentBench |
操作系统操作与智能体任务。 |
本文整理自公开报道与评测信息,时间与版本以各公司官网与正式发布为准。能力对比与榜单会随评测更新而变化,请以各站点最新数据为准。
参考资料:公开报道、各公司官网与评测站点整理。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/282295.html原文链接:https://javaforall.net