【亲测免费】 THUDM／GLM-4-Voice 使用教程

Ai探索者 • 2026年3月12日下午2:03 • 智谱 • 阅读 2

GLM-4-Voice 是由智谱 AI 推出的一款端到端的语音对话模型。该模型能够理解和生成中英文语音，实现实时语音对话，并且可以根据用户指令调整语音的情感、语调、语速和方言等属性。GLM-4-Voice 由三个主要部分组成：GLM-4-Voice-Tokenizer、GLM-4-Voice-Decoder 和 GLM-4-Voice-9B。这些组件共同工作，提供高质量的语音对话体验。

首先，克隆项目仓库并安装依赖：

启动模型服务：

如果需要使用 Int4 精度启动，请运行：

启动 web 服务：

启动后，可以在浏览器中访问来使用 web demo。

以下是 GLM-4-Voice 的一些应用案例和最佳实践：

控制情绪：例如，用轻柔的声音引导用户放松。
改变语速：根据需要调整语速，如加快语速以模拟激动情绪。
生成方言：为用户提供方言语音，如东北话、重庆话等。
实时对话：模型支持实时语音对话，可以即时生成回复。

GLM智谱 AI GLM 教程-4-Voice 的生态项目包括但不限于：

CosyVoice：GLM-4-Voice 使用的 Flow Matching 模型结构。
Transformers：用于初始化和加载模型权重。
GLM-4：GLM-4-Voice-9B 模型的基础。

以上是 GLM-4-Voice 的使用教程，希望对您有所帮助。

发布者：Ai探索者，转载请注明出处：https://javaforall.net/271471.html原文链接：https://javaforall.net

【亲测免费】 THUDM／GLM-4-Voice 使用教程

关于作者

Ai探索者网站注册用户

【亲测免费】 THUDM／GLM-4-Voice 使用教程

关于作者

Ai探索者网站注册用户

相关推荐

免费无限次使用的智谱AI Slides，呈现了类似Manus的PPT生成新功能

深化战略合作，优刻得接入智谱最强开源多模态GLM-4.5V

智谱发布新一代视觉语言模型 GLM-4.1V-Thinking

全球AI编程模型最新排名：Claude、GPT-5与GLM-4.6并驾齐驱，开发者迎来新工具时代

智谱发布旗下 GLM-4.5 模型，连免费 API 都升级了

再获2亿投资！智谱AI又有大动作——