百度正式开源文心4.5系列模型

2025年6月30日，百度宣布文心4.5系列模型正式开源。此次开源包括10款不同规模的模型，其中包括参数量为47B和3B的混合专家（MoE）模型，以及0.3B的稠密参数模型。文心4.5的开源文件包括预训练权重和推理代码，已上传至Hugging Face、GitHub以及飞桨星河社区，供全球开发者使用。

文心4.5通过联合训练文本和视觉两种模态来提高模型在多模态任务中的表现。该模型使用了多模态异构混合专家结构，结合了多维旋转位置编码，并在损失函数计算中增强了专家间的正交性。这一架构旨在提升模型对多模态信息的理解，同时保持不同模态的独立性。

文心4.5在训练过程中采用了异构混合并行和负载均衡策略，提升了训练吞吐量。推理方面，采用了量化技术（如4-bit和2-bit量化），以减少计算开销，并通过动态角色转换和解码分离部署等技术优化推理过程。这些措施旨在提高在不同硬件平台上的推理性能。

文心4.5还对模型进行了后训练，以适应不同的实际应用需求。大语言模型（LLM）侧重于语言理解与生成任务，而多模态模型则优化了视觉语言理解。每个模型通过多阶段的后训练技术（如SFT和DPO）进行进一步优化，以确保其在特定任务中的表现。

文心4.5系列模型在多个基准测试中取得了良好的成绩。例如，ERNIE-4.5-300B-A47B模型在28个基准测试中超过了DeepSeek-V3模型，特别是在推理和知识密集型任务方面表现较好。ERNIE-4.5-21B-A3B模型尽管参数量较小，但在多个数学和推理任务中表现出了竞争力。

为了支持开发者的使用，文心4.5系列模型提供了一些开源工具：

这些工具的发布旨在帮助开发者更高效地使用和部署文文心一言 ERNIE Bot 教程心4.5模型。

文心4.5系列模型已上线到文心一言（https://yiyan.baidu.com），支持免费体验。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/267603.html原文链接：https://javaforall.net

百度正式开源文心4.5系列模型

关于作者

全栈程序员-站长

相关推荐

瑞士人工智能的制胜秘诀：小国如何挑战科技巨头

2025年人工智能行业智能客服技术发展与应用案例报告.docx

GLM-4.5详测，这次智谱真的重回巅峰了

2026必学！AI大模型架构全解析：基础模型、微调与插件谁更重要？（收藏必备）

2026版国内国外主流AI大模型LLM API接口调用完整指南（附 Python／Java 对照代码）

人工智能如何搞怪