二、原生多模态基础大模型,多项评测超Qwen3、DeepSeek-V3

二、原生多模态基础大模型,多项评测超Qwen3、DeepSeek-V3

二、原生多模态基础大模型,多项评测超Qwen3、DeepSeek-V3

智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 云鹏

李彦宏出手!百度大模型终于开源

自此,百度成为国内继腾讯、阿里、字节之后的又一家开源大厂,这也是百度面向大模型进入应用爆发黄金时期的最新举措。

GitHub:https://github.com/PaddlePaddle/ERNIE

技术报告:https://yiyan.baidu.com/blog/posts/ernie4.5

Reddit上的开发者认为,百度此次开源的模型中小参数的版本对内存受限的配置是不错的选择,他还认为300B可以和DeepSeek 文心一言 ERNIE Bot 教程 V3 671B战斗,21B可以与阿里Qwen 30B战斗。

李彦宏出手!百度大模型终于开源

也有开发者指出,百度此次开源的模型中,28B模型在基础文本能力上增加了视觉功能很酷。

李彦宏出手!百度大模型终于开源

开发者也在期待百度文心大模型4.5 Turbo的开源

李彦宏出手!百度大模型终于开源

其图片理解涵盖照片、电影截图、网络梗图、漫画、图标等多种形态,也能理解音视频中的场景、画面、人物等特征,并且在生成名人、物品等方面更具真实性。

李彦宏出手!百度大模型终于开源

▲文心4.5系列模型与Qwen3、DeepSeek-V3基准测试比较

百度官方公众号提到,文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。模型权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低后训练和部署门槛。

对于原生多模态大模型,3月初,百度创始人、CEO李彦宏在人民网发表的署名文章就提到:“原生多模态大模型,打破之前先训练单模态模型再拼接的方式,通过统一架构实现文本、图像、音频、视频等多模态数据的原生级融合,实现对复杂世界的统一理解,这是迈向通用人工智能(AGI)的重要一步。”

文心大模型4.5系列背后的关键技术创新包括:

李彦宏出手!百度大模型终于开源

针对百度此次开源,南加州大学计算机科学副教授、三星年度人工智能研究员Sean Ren在接受外媒采访时提到:“每当一个大型实验室开源一个强大的模型时,它都会提高整个行业的标准。百度的举动给OpenAI和Anthropic等闭源模型的提供商带来了压力,迫使它们证明API和高价的合理性。”

Sean Ren认为虽然大多数消费者并不关心模型代码是否开源,但他们确实在意更低的成本、更好的性能以及对其语言或地区的支持。这些好处通常来自于开源模型,它为开发人员和研究人员提供了更大的自由度,可以更快地进行迭代、定制和部署。”

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/263021.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午10:04
下一篇 2026年3月12日 下午10:05


相关推荐

关注全栈程序员社区公众号