国家互联网办公室于4月最新披露的数据显示,截至目前,已成功通过备案的人工智能大模型数量达到了346家 。
本文罗列了大模型完整清单、常用大模型的特点。文末附完整清单下载链接!



如下介绍当前国内主流大模型,介绍其特点及使用场景。
1. 百度文心一言(ERNIE Bot)
- 开发背景:由百度基于飞桨深度学习平台和文心知识增强大模型构建,旨在填补国内在ChatGPT类产品上的空白。
- 技术特点:具备知识增强、检索增强和对话增强的技术特色,能够回答各种问题,协助创作,并进行多模态生成。
- 应用场景:广泛应用于文学创作、商业文案创作、数理逻辑推算、中文理解以及多模态生成等领域。
2. 阿里巴巴通义千问
- 开发背景:由阿里巴巴自主研发,旨在提供高效、智能的语言处理能力。
- 技术特点:基于深度学习技术,能够进行复杂的语言理解和生成,支持多领域的知识和语言理解。
- 应用场景:广泛应用于内容创作、自动翻译、文本摘要等多个场景。
3. 腾讯混元大模型
- 开发背景:由腾讯研发,基于Transformer神经网络架构,具有万亿参数规模。
- 技术特点:具备强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
- 应用场景:广泛应用于智能对话、内容创作、多模态生成等领域。
4. 华为盘古大模型
- 开发背景:由华为研发,涵盖NLP、CV和科学计算等多个领域,与昇腾芯片、昇思语言、ModelArts平台深度结合。文心一言 ERNIE Bot 教程
- 技术特点:支持多模态内容生成,具备强大的中文理解和生成能力,采用文本+代码融合训练方式。
- 应用场景:广泛应用于智能客服、创意营销、会议助手、代码助手等多个场景。
5. 科大讯飞星火大模型
- 开发背景:由科大讯飞研发,旨在提供对话、写作、编程等功能,支持语音交互。
- 技术特点:具备跨语言、跨领域的知识理解和推理能力,支持多模态输入和表达。
- 应用场景:广泛应用于知识学习与内容创作、科研任务、数学问题解决等领域。
6. 智谱AI ChatGLM
- 开发背景:由智谱AI研发,基于GLM基础架构,支持多语言。
- 技术特点:采用多阶段增强预训练方法,支持代码生成和执行,具备多模态理解能力。
- 应用场景:广泛应用于企业客服、文本生成、知识图谱构建等领域。
7. DeepSeek R1
DeepSeek 是由深度求索(DeepSeek)自主研发的高性能大语言模型,以其开源、轻量化和强大的多场景适应能力受到广泛关注。
为用户提供智能对话、推理、AI搜索、文件处理、翻译、解题、创意写作、编程等多种服务。

完整清单:
https://www.cac.gov.cn/2024-04/02/c_1713729983803145.htm
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/266725.html原文链接:https://javaforall.net
