智谱 AI GLM 教程
智谱在HuggingFace和ModelScope开源了两个专门给智能体应用打造的MoE架构模型。
看了下他们的参数,GLM-4.5总共3550亿参数,激活参数320亿;GLM-4.5-Air总共1060亿参数,激活参数120亿。而且都遵循MIT协议。
GLM-4.5在12个评测基准上的综合评分,位列开源模型第一。
智谱设计了52个编程任务来对模型测试。GLM-4.5跟Claude 4 Sonnet、Kimi K2、Qwen3-coder模型 PK,胜率分别达到40.4%、53.9%和80.8%。52道编程任务题和编程轨迹也在HuggingFace上开源了。GLM-4.5模型评测体验GLM-4.5主打功能:全栈开发、Artifacts、PPT。最近AI大厂都在卷AI编程,着重说说网页版的全栈开发,暂时不讨论Artifacts和PPT。从交互角度看,完全依靠自然语言进行编程,和lovable、v0相似,属于No Code无代码编程。这个功能适合编程刚入门和不会编程的用户。比Cursor、Cline、TRAE等需要编程基础的软件更容易上手。从技术上看,采用了云端虚拟机技术,代码文件和命令行都在云端虚拟机沙盒内运行,不占用用户本地资源。Manus也是这种云端虚拟机的形式,刚开始服务人数非常有限。而claude code、腾讯CodeBuddyIDE则是在本地环境中运行。我让它帮我做一个图书管理系统的前后端,前端页面和代码结构都有了,可惜任务中断了,无法把图书加到后端数据库中。放一张效果图:
结合我用过的其他Vibe Coding工具使用体验大概总结一下:全栈开发功能总结优点1.适合无编程基础的用户使用:无代码编程,低门槛。2.本地文件系统安全:沙盒环境运行代码。3.技术栈丰富:支持8种以上编程语言、前后端技术栈。支持移动开发、云原生和DevOps、机器学习、区块链等。4.人性化产品设计:先写前端页面让用户看到效果,增加用户成就感和用户留存。5.任务规划更合理:执行任务前先思考。6.智能体能力不错:支持文件读写、文件搜索、系统操作、任务管理等工具,工具调用较为精准。缺点1.当前稳定性较差:经常断开连接导致任务中断,需要从头再来。我试了好几次都没完成一个全栈任务,所以全栈能力很难评价。2.与本地文件交互较弱:沙盒环境与本地隔离。3.云端负载压力大:云端运行大量虚拟机,使用人数过多容易导致服务中断。4.无IDE:如果想手动修改代码不方便。5.缺少独立的计划/对话模式:对话直接触发虚拟机启动浪费资源。最后总的来说,GLM-4.5刚刚发布,有的地方还不完善可以理解。急需解决的问题可能是服务器扩容,让用户的任务起码能完整完成,且不说完成后前后端是否能成功联通。个人感觉全栈开发功能有点像代码版的Manus。不过,智谱在工程能力上一直在国内处于领先水平,深度研究功能、GLM-PC到现在的全栈开发、Artifacts都可以证明。从价格上看,GLM-4.5的API价格也几乎是国内最低。目前GLM-4.5的全栈开发功能,可在国际版中体验,在国内版中暂未开放。国际地址:chat.z.ai国内地址:chatglm.cn
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/268222.html原文链接:https://javaforall.net
