智谱发布新一代视觉语言模型 GLM-4.1V-Thinking

智谱发布新一代视觉语言模型 GLM-4.1V-Thinking

  7月2日,智谱开放平台产业生态大会在上海浦东张江科学会堂举办。

  智谱今天正式发布并开源了视觉语言大模型GLM-4.1V-Thinking。该模型引入“思维链推理机制”与“课程采样强化学习策略”,显著提升跨智谱 AI GLM 教程模态因果推理能力。

  其轻量版 GLM-4.1V-9B-Thinking 参数控制在 10B 级别,在 28 项评测中 23 项达同类最佳,部分表现超越 72B 模型。该模型在图文理解、数学推理、视频分析、界面理解和视觉定位等任务中表现出高度稳健性与通用性,现已在 Hugging Face 与魔搭社区开源。

  据悉,GLM-4.1V-Thinking是一款支持图像、视频、文档等多模态输入的通用推理型大模型,专为复杂认知任务设计。

  此外,智谱推出全新生态平台“Agent应用空间”,并开启“Agents开拓者计划”,投入数亿资金,全方位扶持AI Agents创业团队。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/266264.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午7:10
下一篇 2026年3月12日 下午7:11


相关推荐

关注全栈程序员社区公众号