(本期作为一个小提醒,就不发视频了)
喜欢用GPT-SoVITS的小朋友们,你们好啊,我是五字,今天有小伙伴向我反映,为什么用了整合包,还需要单独下载模型,ta已经挂了一个gpt 教程晚上了,才下了50%,甚至打算下到明天早上()
上期视频:
于是我立刻着手解决,经过一段时间的排查,从代码里发现了调用逻辑
图1-语音识别工具
参考图1,一般情况下,当我们点击【开启语音识别】时,软件会自动从huggingface上下载相应的模型文件,同时保存在【C:Users{用户名}.cachehuggingfacehub】和【G:GPT-SoVITS_V4_cachehuggingfacehub】
而瓦塔西提供的整合包里只有【G:GPT-SoVITS_V4_cachehuggingfacehub】,软件调用时就会识别到缺少【C:Users{用户名}.cachehuggingfacehub】,导致需要重新下载模型,再加上大部分小伙伴没有用魔法,所以下载速度往往很慢
这里大家可以下载我单独整理好的模型:models–Systran–faster-whisper-large-v3.zip,链接: https://pan.baidu.com/s/12utEI5JocLuz1qWUkuZRfw 提取码: krdk
图2-解压选项
参考图2,下载好后解压,一定要选择解压到models–…这个选项,而且不要有任何的重命名操作,然后我们就会得到一个名为【models–Systran–faster-whisper-large-v3】的文件夹
图3-文件夹放置位置
参考图3,打开【C盘-用户(User)-{自己的电脑名字}-.cache-huggingface-hub】,把刚才解压好的文件夹放进来
然后关闭重启软件即可
还需要任何帮助,欢迎加入瓦塔西的答疑咕嘎,任何问题都会帮助大家尽力解决的,喜欢请多多关注,我喜欢你们!
备注:RVC教程真的快出了(绝对是本周)
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/238452.html原文链接:https://javaforall.net
