智谱开源GLM-ASR-Nano-2512模型推动端侧AI普及!

智谱开源GLM-ASR-Nano-2512模型推动端侧AI普及!



今日,智谱正式发布并开源GLM-ASR系列语音识别模型,并同步上线了基于该模型打造的桌面端智谱AI输入法“小凹”,面向所有用户开放。

智谱 AI GLM 教程image.png

智谱表示,希望通过这款输入法让用户实现“动动嘴,活就干了”,从传统的语音转文字,延伸至直接用语音完成各类操作。

GLM-ASR-2512作为智谱新一代语音识别模型,支持将语音实时转化为文字。

在多场景、多语种、多口音的真实环境下测试,该模型保持行业领先水平,字符错误率(CER)仅为0.0717。

基于此,智谱还开源了端侧模型GLM-ASR-Nano-2512,参数量仅1.5B,但在开源语音识别领域表现达到SOTA,并在部分测试中超越若干闭源模型。

该模型能够在本地运行,实现高精度识别的同时,兼顾隐私保护和低延迟交互。

智谱AI输入法基于GLM-ASR系列模型开发,用户在PC端即可通过语音实现自然、流畅的交互。除了精准的语音转文字功能,输入法还整合了翻译、改写、情绪转换等大模型能力,让语音不仅是输入手段,更能直接作为指令控制文本生成和编辑。

用户可在同一界面完成听写、改写、翻译及智能润色,整个过程无需在不同应用间切换,实现“理解-执行-替换”的一体化操作。

此外,智谱AI输入法支持千人千面的人设切换功能,可根据不同场景自动调整文字风格。例如,在工作场景中,碎碎念的口语能转化为条理清晰的汇报;在生活场景中,则可呈现温柔俏皮的聊天风格。

自12月10日起,所有用户都可以下载使用这款输入法,智谱还免费赠送2000积分,相当于28天的体验时长。


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/270099.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午3:18
下一篇 2026年3月12日 下午3:18


相关推荐

关注全栈程序员社区公众号