0这是一个已经配好的 so-vits-svc-cu128 镜像,主要用来做“变声 / 歌声转换”。
你可以把它理解成一个现成工具包,里面已经放好了:
新手不需要自己安装 Python、CUDA、依赖包,通常直接启动就能用。
先打开终端,进入这个项目目录后执行:
sovits start webui
如果这个命令没识别出来,也可以直接运行:
./scripts/sovits start webui
如果你只想在本地打开,不使用公网分享链接,用这个命令:
sovits start webui --local
启动成功后,终端里会显示两个地址,通常是:
http://127.0.0.1:7860
http://xxxxxxxx.live
用你自己电脑的浏览器 (不是镜像电脑!) 打开第二个(.live)地址,就能看到 WebUI 页面。第一个地址是镜像环境本机的IP, 不会搞穿透的话可以不用.
最简单的流程是下面这几个步骤:
.wav 文件WebUI 里有“训练”标签页,按顺序做:
dataset_raw/如果你只是想先试效果,也可以先用别人已经训练好的模型直接做推理。
推理就是把一个声音转换成另一个声音。
基本操作:
转换完成后,会生成输出音频。
进入带环境的命令行:
sovits start cmd
启动 TensorBoard 看训练日志:
sovits start tensorboard
本地模式启动 TensorBoard:
sovits start tensorboard --local
优先试:
./scripts/sovits start webui
如果还是不行,说明命令别名还没装好,需要先把启动脚本加到 PATH。
第一次启动会加载环境和模型,稍微慢一点是正常的。
可以启动,但训练和推理都会很慢,适合简单测试,不适合正式使用。
最稳妥的做法是:
.wavdataset_raw/:原始音频数据dataset/44k/:重采样后的数据logs/44k/:训练日志和检查点trained/:导出的可用模型pretrain/:预训练模型这个项目用于合法的语音合成和研究场景。请只使用你有权处理的音频数据。

支持自启动