就在刚才,智谱推出了两个语音识别模型:闭源的 GLM-ASR 和开源的 GLM-ASR-Nano-2512。与过去他们更多关注通用大模型或多模态模型不同,这次聚焦的是语音转文字(ASR)任务,尤其面向中文语境、方言与复杂环境。以下是对这两款模型已知公开资料的整理与分析。
GLM-ASR 被智谱官方描述为一款新一代语音识别模型:“将语音转为高质量文本”,可用于从日常聊天到会议记录、工作文档、客服语音、视频字幕等多种场景。
该模型未开源,但是价格很便宜。根据官方计费页面,GLM-ASR 的价格为
,而OpenAI的价格大约是$0.006 / minute,换算月0.04元/一分钟,似乎GLM更贵。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。
发布者:Ai探索者,转载请注明出处:https://javaforall.net/266349.html原文链接:https://javaforall.net
