大家好,我是冷逸,今天给大家实测智谱最新推出的GLM-4.6模型。
昨天,智谱发布了新一代旗舰模型GLM-4.6。
一句话介绍:这可能是国内性能&性价比都是最好的coding模型。
更具体来说:GLM-4.6在CC环境下的74个真实编程均超过Claude-4-Sonnet,上下文窗口从128K升级到200K,推理提升,支持在推理过程中调用工具,搜索和写作能力有所提升,最低20元包月可以畅玩。
GLM-4.6在8大基准中对齐Claude Sonnet 4/Claude Sonnet 4.5
同时,GLM-4.6已适配寒武纪、摩尔线程,首次在国产芯片上实现FP8+Int4混合量化部署,大幅降低推理成本。
模型已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope上同步开源。
一手实测
真实体验,胜于榜单。下面,我们从编程能力、上下文支持、推理能力、搜索能力以及写作能力等多个角度进行实测体验。
测试平台主要是Z.ai,模型选择“GLM-4.6”。
1)编程能力
编程部分,我累计跑了5个case,也都同步在DeepSeek V3.2和Claude 4.5中测过,先来看下横向对比。
总的来说,5个case里,GLM-4.6的完成度最高,甚至部分case的表现超过Claude 4.5。DeepSeek V3.2的表现,则比较一般。
然后,我们来细看下GLM-4.6在每个case里的表现。
案例1:《星际穿越》解析PPT
让大模型写HTML式PPT,一直比较考验模型的搜索、coding和审美能力。我们让GLM-4.6制作一份《星际穿越》电影解析的PPT。
打开联网功能,输入Prompt:
速度极快,不到一分钟就把PPT写好了。
有实料、实图,审美在线。GLM模型做PPT,果然还是手拿把掐。
案例2:创建3D星云特效
这属于我们的祖传Prompt了,看看GLM-4.6表现如何。
特效很棒,一次完成,还增加了一些设置菜单。
case体验地址:
https://chat.z.ai/space/z009c85dg9h1-art
而同样的prompt,Claude 4.5和 3.2都是一团雪花。
案例3:创建地球足迹
这个case用GLM-4.5跑还不太顺畅,要多抽几次才能出来。4.6版一次出,而且它增加了很多真实的图片素材。
这对应了他们在官方介绍中所说的:“GLM-4.6增强了模型的工具调用和搜索智能体,在智能体框架中表现更好。”
case体验地址:
https://chat.z.ai/space/t059e8r0bsw1-art
案例4:开发“微旅程”网站
功能齐全,往期、收藏、主题切换,应有尽有。
案例5:设计电商网站
多样审美,也能具备。高度指令遵循,指哪打哪。
case体验地址:
https://chat.z.ai/space/a0f9e8h5pzn0-art
案例6:设计调酒模拟器
也是一次生成,交互逻辑无bug,还设计了一些有趣的过渡动画和微交互,比如液体波动动画,渐变色背景营造酒吧氛围。
case体验地址:
https://chat.z.ai/space/h0g958kc29a1-art
2)上下文能力
智谱官方介绍,GLM-4.6的上下文已从128k升级到200k。200k也就是20万tokens,差不多是20万中文汉字/15万英文单词。
最近,OpenAI要下场做GEO了。他们早前发布的这篇论文很值得一读:《WebGPT: Browser-assisted question-answering with uman feedback》。
论文网址:
https://arxiv.org/pdf/2112.09332
但是全英文啊,32页论文差不多有10多万字,读起来太困难了。于是丢给GLM-4.6,输入指令:
这是GLM-4.6给我做的知识卡片,这下能看懂了。
(可上下滑动,查看全图)
Case地址:
https://chat.z.ai/space/m0x9u8ppxqb0-art
3)推理能力
这是一道小学奥数题,根据示例图来算加减数学题。
不知道大家能不能算出来,反正我是看不懂,所以直接丢给GLM-4.6。
用了6个步骤,得出答案:15。
公布正确答案,确实是15。GLM-4.6解和答,都对。
再考几道脑筋急转弯。
问:地球上有70%的海洋和30%的陆地,那么剩下的30%海洋和70%陆地去哪儿了?
GLM-4.6轻松识破我的诡计。
难倒多个大模型的英文字母倒写问题,GLM-4.6也能轻松做对。而且还智慧地给出了2个答案。
问:用毒蛇的毒毒毒蛇,毒蛇会不会被毒蛇的毒毒死?
这个经典的绕口令问题,GLM-4.6思考得挺清晰的。
4)写作能力
最后,是写作能力,我们继续用上祖传提示词(作者李继刚)。
这历史侧写能力,是有点水平的。
(可上下滑动,查看全图)
智谱 AI GLM 教程比如这几句,“那是一只怎样的眼睛啊。布满血丝,深陷在眼窝里,却亮得像两簇鬼火。我们四目相对,都吓了一跳。他猛地缩了回去,我也踉跄着后退几步,差点摔倒。”
包括今天这篇文章的标题,也是由「GLM-4.6」自己起的。
Prompt是:
整体都还不错,我最终选了风格四的第一个。
发布者:Ai探索者,转载请注明出处:https://javaforall.net/268934.html原文链接:https://javaforall.net
