GLM-4.6是智谱AI于2025年9月30日发布并开源的新一代大模型,在核心能力上实现显著提升,尤其在代码生成、长上下文处理及智能体应用等方面表现突出.

GLM-4.6 是智谱最新的旗舰模型,其总参数量 355B,激活参数 32B。GLM-4.6 所有核心能力上均完成了对 GLM-4.5 的超越,具体如下:
高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。
上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。
推理能力:推理能力提升,并支持在推理过程中调用工具。
搜索能力:增强了模型在工具调用和搜索智能体上的表现,在智能体框架中表现更好。
写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。
多语言翻译:进一步增强跨语种任务的处理效果。


DeepSeek-V3.2-Exp是深度求索公司于2025年9月29日发布的实验性大模型,核心创新与特点如下:
性能验证:在公开评测集上表现与前代V3.1-Terminus持平,长序列上下文支持达160K(华为云适配)
开源生态:模型及GPU算子(TileLang/CUDA版本)已在Hugging Face和ModelScope平台开源,支持国产智谱 AI GLM 教程芯片(寒武纪、昇腾、海光DCU)深度协同


docs.bigmodel.cn
github.com/deepseek-ai…
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/265666.html原文链接:https://javaforall.net
