智谱GLM-4.5实测,全栈开发功能的10个优缺点

智谱GLM-4.5实测,全栈开发功能的10个优缺点

智谱 AI GLM 教程

智谱在HuggingFace和ModelScope开源了两个专门给智能体应用打造的MoE架构模型。

看了下他们的参数,GLM-4.5总共3550亿参数,激活参数320亿;GLM-4.5-Air总共1060亿参数,激活参数120亿。而且都遵循MIT协议。

GLM-4.5在12个评测基准上的综合评分,位列开源模型第一。

智谱设计了52个编程任务来对模型测试。GLM-4.5跟Claude 4 Sonnet、Kimi K2、Qwen3-coder模型 PK,胜率分别达到40.4%、53.9%和80.8%。52道编程任务题和编程轨迹也在HuggingFace上开源了。GLM-4.5模型评测体验GLM-4.5主打功能:全栈开发、Artifacts、PPT。最近AI大厂都在卷AI编程,着重说说网页版的全栈开发,暂时不讨论Artifacts和PPT。从交互角度看,完全依靠自然语言进行编程,和lovable、v0相似,属于No Code无代码编程。这个功能适合编程刚入门和不会编程的用户。比Cursor、Cline、TRAE等需要编程基础的软件更容易上手。从技术上看,采用了云端虚拟机技术,代码文件和命令行都在云端虚拟机沙盒内运行,不占用用户本地资源。Manus也是这种云端虚拟机的形式,刚开始服务人数非常有限。而claude code、腾讯CodeBuddyIDE则是在本地环境中运行。我让它帮我做一个图书管理系统的前后端,前端页面和代码结构都有了,可惜任务中断了,无法把图书加到后端数据库中。放一张效果图:

结合我用过的其他Vibe Coding工具使用体验大概总结一下:全栈开发功能总结优点1.适合无编程基础的用户使用:无代码编程,低门槛。2.本地文件系统安全:沙盒环境运行代码。3.技术栈丰富:支持8种以上编程语言、前后端技术栈。支持移动开发、云原生和DevOps、机器学习、区块链等。4.人性化产品设计:先写前端页面让用户看到效果,增加用户成就感和用户留存。5.任务规划更合理:执行任务前先思考。6.智能体能力不错:支持文件读写、文件搜索、系统操作、任务管理等工具,工具调用较为精准。缺点1.当前稳定性较差:经常断开连接导致任务中断,需要从头再来。我试了好几次都没完成一个全栈任务,所以全栈能力很难评价。2.与本地文件交互较弱:沙盒环境与本地隔离。3.云端负载压力大:云端运行大量虚拟机,使用人数过多容易导致服务中断。4.无IDE:如果想手动修改代码不方便。5.缺少独立的计划/对话模式:对话直接触发虚拟机启动浪费资源。最后总的来说,GLM-4.5刚刚发布,有的地方还不完善可以理解。急需解决的问题可能是服务器扩容,让用户的任务起码能完整完成,且不说完成后前后端是否能成功联通。个人感觉全栈开发功能有点像代码版的Manus。不过,智谱在工程能力上一直在国内处于领先水平,深度研究功能、GLM-PC到现在的全栈开发、Artifacts都可以证明。从价格上看,GLM-4.5的API价格也几乎是国内最低。目前GLM-4.5的全栈开发功能,可在国际版中体验,在国内版中暂未开放。国际地址:chat.z.ai国内地址:chatglm.cn

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/268222.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午5:20
下一篇 2026年3月12日 下午5:20


相关推荐

关注全栈程序员社区公众号