2.12国产大模型集体更新,一文看懂怎么选

2.12国产大模型集体更新,一文看懂怎么选

  • 最近国产AI圈有点热闹,短短一周内智谱GLM-5、MiniMax M2.5纷纷发布,DeepSeek V4灰度测试中,阿里的Qwen 3.5也快了。顺便说一下Kimi K2.5,之前也更新了,性价比不错。
模型 状态 特点 GLM-5 已发布 744B参数,专注Agent和复杂任务 MiniMax M2.5 已发布 编程能力强,接近Opus 4.6 Kimi K2.5 已发布 性价比高,日常用 DeepSeek V4 灰度测试 200B参数,100万上下文 Qwen 3.5 即将发布 预计开源,本地部署

GLM-5:从写代码到AI工程师

智谱这次升级幅度不小,从GLM-4.7的355B参数直接干到744B,训练数据也从23T涨到28.5T tokens。

官方定位从“VibeCoding”转向“Agentic Engineering”,简单说就是以前帮你写写代码,现在能处理复杂的多步骤任务,更适合做Agent和系统工程。

网友评价:“评分超过Gemini 3 Pro,是目前开源模型里最高的”,但也提到“算力紧张,需要排队”。


MiniMax M2.5:国产编程王者

MiniMax这次主打编程能力,网友实测后反馈比较多:“和Claude Opus 4.6打得有来有回”、“国产最强编程模型”。

内测期间提供无限token,有人直接把Go写的微服务转成Rust,3亿token生成3万行代码,Rust大佬看完说“像模像样”。


Kimi K2.5:性价比不错

月之暗面之前更新的版本,主要特点是便宜。有人从Claude Sonnet 4.5切换过来,日花费从50美元降到4美元。

长文本处理能力也不错,网友实测改了近300个文件。不过也有人吐槽“感觉还是有点慢”。


DeepSeek V4:神秘的灰度测试

目前需要更新App到1.7.4版本才有机会体验,注意这智谱 AI GLM 教程次灰度的200B不是正式V4,是个中间版本。

主要卖点是100万上下文和知识截止到2025年5月。网友说“代码生成比V3.2好一些”,但也提到“前端能力还没到K2.5的等级”。


Qwen 3.5:还在憋大招

阿里的下一代模型,预计本周发布。前几代Qwen以开源友好著称,这次应该也会开源权重。

网友说:“如果今晚DeepSeek发车,Qwen 3.5今晚也会发,那就内战爆发了”。适合需要本地部署的用户。


  • 写代码、做开发 → MiniMax M2.5
  • 复杂项目、跑Agent → GLM-5
  • 性价比、日常用 → Kimi K2.5
  • 本地部署、开源需求 → 等Qwen 3.5
  • 免费尝鲜 → DeepSeek App

这次更新确实比较密集,国产模型从之前的双月更变成月更,整体水平也上来了。大家根据自己需求选一个试试就行,不用想太复杂。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/265904.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午7:30
下一篇 2026年3月12日 下午7:30


相关推荐

关注全栈程序员社区公众号