我替你们试了智谱GLM-4.6,写代码这事儿,它真行!

我替你们试了智谱GLM-4.6,写代码这事儿,它真行!

图片

大家好,我是冷逸,今天给大家实测智谱最新推出的GLM-4.6模型

昨天,智谱发布了新一代旗舰模型GLM-4.6。

一句话介绍:这可能是国内性能&性价比都是最好的coding模型。

更具体来说:GLM-4.6在CC环境下的74个真实编程均超过Claude-4-Sonnet,上下文窗口从128K升级到200K,推理提升,支持在推理过程中调用工具,搜索和写作能力有所提升,最低20元包月可以畅玩。

图片

GLM-4.6在8大基准中对齐Claude Sonnet 4/Claude Sonnet 4.5

同时,GLM-4.6已适配寒武纪、摩尔线程,首次在国产芯片上实现FP8+Int4混合量化部署,大幅降低推理成本。

模型已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope上同步开源。


图片

一手实测

真实体验,胜于榜单。下面,我们从编程能力、上下文支持、推理能力、搜索能力以及写作能力等多个角度进行实测体验。

测试平台主要是Z.ai,模型选择“GLM-4.6”。

1)编程能力

编程部分,我累计跑了5个case,也都同步在DeepSeek V3.2和Claude 4.5中测过,先来看下横向对比。

图片
图片
图片
图片
图片

总的来说,5个case里,GLM-4.6的完成度最高,甚至部分case的表现超过Claude 4.5。DeepSeek V3.2的表现,则比较一般。

然后,我们来细看下GLM-4.6在每个case里的表现。

案例1:《星际穿越》解析PPT

让大模型写HTML式PPT,一直比较考验模型的搜索、coding和审美能力。我们让GLM-4.6制作一份《星际穿越》电影解析的PPT。

打开联网功能,输入Prompt:

图片

速度极快,不到一分钟就把PPT写好了。

有实料、实图,审美在线。GLM模型做PPT,果然还是手拿把掐。

案例2:创建3D星云特效

这属于我们的祖传Prompt了,看看GLM-4.6表现如何。

特效很棒,一次完成,还增加了一些设置菜单。

图片

case体验地址:

https://chat.z.ai/space/z009c85dg9h1-art

而同样的prompt,Claude 4.5和 3.2都是一团雪花。

图片

案例3:创建地球足迹

这个case用GLM-4.5跑还不太顺畅,要多抽几次才能出来。4.6版一次出,而且它增加了很多真实的图片素材。

这对应了他们在官方介绍中所说的:“GLM-4.6增强了模型的工具调用和搜索智能体,在智能体框架中表现更好。”

case体验地址:

https://chat.z.ai/space/t059e8r0bsw1-art

案例4:开发“微旅程”网站

功能齐全,往期、收藏、主题切换,应有尽有。

图片

案例5:设计电商网站

多样审美,也能具备。高度指令遵循,指哪打哪。

图片

case体验地址:

https://chat.z.ai/space/a0f9e8h5pzn0-art

案例6:设计调酒模拟器

也是一次生成,交互逻辑无bug,还设计了一些有趣的过渡动画和微交互,比如液体波动动画,渐变色背景营造酒吧氛围。

case体验地址:

https://chat.z.ai/space/h0g958kc29a1-art

2)上下文能力

智谱官方介绍,GLM-4.6的上下文已从128k升级到200k。200k也就是20万tokens,差不多是20万中文汉字/15万英文单词。

最近,OpenAI要下场做GEO了。他们早前发布的这篇论文很值得一读:《WebGPT: Browser-assisted question-answering with uman feedback》。

图片

论文网址:

https://arxiv.org/pdf/2112.09332

但是全英文啊,32页论文差不多有10多万字,读起来太困难了。于是丢给GLM-4.6,输入指令:

图片

这是GLM-4.6给我做的知识卡片,这下能看懂了。

图片

(可上下滑动,查看全图)

Case地址:

https://chat.z.ai/space/m0x9u8ppxqb0-art

3)推理能力

这是一道小学奥数题,根据示例图来算加减数学题。

图片

不知道大家能不能算出来,反正我是看不懂,所以直接丢给GLM-4.6。

图片

用了6个步骤,得出答案:15。

图片

公布正确答案,确实是15。GLM-4.6解和答,都对。

图片

再考几道脑筋急转弯。

问:地球上有70%的海洋和30%的陆地,那么剩下的30%海洋和70%陆地去哪儿了?

GLM-4.6轻松识破我的诡计。

图片

难倒多个大模型的英文字母倒写问题,GLM-4.6也能轻松做对。而且还智慧地给出了2个答案。

图片

问:用毒蛇的毒毒毒蛇,毒蛇会不会被毒蛇的毒毒死?

这个经典的绕口令问题,GLM-4.6思考得挺清晰的。

图片

4)写作能力

最后,是写作能力,我们继续用上祖传提示词(作者李继刚)。

这历史侧写能力,是有点水平的。

图片

(可上下滑动,查看全图)

智谱 AI GLM 教程比如这几句,“那是一只怎样的眼睛啊。布满血丝,深陷在眼窝里,却亮得像两簇鬼火。我们四目相对,都吓了一跳。他猛地缩了回去,我也踉跄着后退几步,差点摔倒。”

包括今天这篇文章的标题,也是由「GLM-4.6」自己起的。

Prompt是:

整体都还不错,我最终选了风格四的第一个。

图片
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/268934.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午4:38
下一篇 2026年3月12日 下午4:39


相关推荐

关注全栈程序员社区公众号