智谱GLM-4.5实测，全栈开发功能的10个优缺点

智谱 AI GLM 教程

智谱在HuggingFace和ModelScope开源了两个专门给智能体应用打造的MoE架构模型。

看了下他们的参数，GLM-4.5总共3550亿参数，激活参数320亿；GLM-4.5-Air总共1060亿参数，激活参数120亿。而且都遵循MIT协议。

GLM-4.5在12个评测基准上的综合评分，位列开源模型第一。

智谱设计了52个编程任务来对模型测试。GLM-4.5跟Claude 4 Sonnet、Kimi K2、Qwen3-coder模型 PK，胜率分别达到40.4%、53.9%和80.8%。52道编程任务题和编程轨迹也在HuggingFace上开源了。GLM-4.5模型评测体验GLM-4.5主打功能：全栈开发、Artifacts、PPT。最近AI大厂都在卷AI编程，着重说说网页版的全栈开发，暂时不讨论Artifacts和PPT。从交互角度看，完全依靠自然语言进行编程，和lovable、v0相似，属于No Code无代码编程。这个功能适合编程刚入门和不会编程的用户。比Cursor、Cline、TRAE等需要编程基础的软件更容易上手。从技术上看，采用了云端虚拟机技术，代码文件和命令行都在云端虚拟机沙盒内运行，不占用用户本地资源。Manus也是这种云端虚拟机的形式，刚开始服务人数非常有限。而claude code、腾讯CodeBuddyIDE则是在本地环境中运行。我让它帮我做一个图书管理系统的前后端，前端页面和代码结构都有了，可惜任务中断了，无法把图书加到后端数据库中。放一张效果图：

结合我用过的其他Vibe Coding工具使用体验大概总结一下：全栈开发功能总结优点1.适合无编程基础的用户使用：无代码编程，低门槛。2.本地文件系统安全：沙盒环境运行代码。3.技术栈丰富：支持8种以上编程语言、前后端技术栈。支持移动开发、云原生和DevOps、机器学习、区块链等。4.人性化产品设计：先写前端页面让用户看到效果，增加用户成就感和用户留存。5.任务规划更合理：执行任务前先思考。6.智能体能力不错：支持文件读写、文件搜索、系统操作、任务管理等工具，工具调用较为精准。缺点1.当前稳定性较差：经常断开连接导致任务中断，需要从头再来。我试了好几次都没完成一个全栈任务，所以全栈能力很难评价。2.与本地文件交互较弱：沙盒环境与本地隔离。3.云端负载压力大：云端运行大量虚拟机，使用人数过多容易导致服务中断。4.无IDE：如果想手动修改代码不方便。5.缺少独立的计划/对话模式：对话直接触发虚拟机启动浪费资源。最后总的来说，GLM-4.5刚刚发布，有的地方还不完善可以理解。急需解决的问题可能是服务器扩容，让用户的任务起码能完整完成，且不说完成后前后端是否能成功联通。个人感觉全栈开发功能有点像代码版的Manus。不过，智谱在工程能力上一直在国内处于领先水平，深度研究功能、GLM-PC到现在的全栈开发、Artifacts都可以证明。从价格上看，GLM-4.5的API价格也几乎是国内最低。目前GLM-4.5的全栈开发功能，可在国际版中体验，在国内版中暂未开放。国际地址：chat.z.ai国内地址：chatglm.cn

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/268222.html原文链接：https://javaforall.net

智谱GLM-4.5实测，全栈开发功能的10个优缺点

关于作者

全栈程序员-站长

相关推荐

刚刚，估值远超200亿的智谱启动IPO

【图文】Codex接入Kimi K2／GLM-4.6 环境配置指南 (Windows／macOS／Ubuntu)

GLM-4v-9b实战教程：构建教育AI助教——试卷图片自动批改系统

【ChatGLM4系列】入门介绍以及API调用

New API 项目对智谱清言 GLM-4-AllTools 模型的支持分析

智谱AI发布开源GLM