优云智算
控制台
立即注册
So-VITS-SVC-CU128 (即开即用, 无需部署)
So-VITS-SVC的2026全新Fork, 已经预配置好环境, 开箱即用. 支持Cuda12.8和RTX50系显卡, 训练/推理速度大大加快!
star0
0/小时
v1.0
最新

so-vits-svc-cu128 镜像使用说明

1. 这是什么

这是一个已经配好的 so-vits-svc-cu128 镜像,主要用来做“变声 / 歌声转换”。

你可以把它理解成一个现成工具包,里面已经放好了:

  • 可直接打开的 WebUI 图形界面
  • 已配置好的 Python 运行环境
  • 常用预训练模型
  • 示例数据和训练目录

新手不需要自己安装 Python、CUDA、依赖包,通常直接启动就能用。

2. 一键启动命令

先打开终端,进入这个项目目录后执行:

sovits start webui

如果这个命令没识别出来,也可以直接运行:

./scripts/sovits start webui

如果你只想在本地打开,不使用公网分享链接,用这个命令:

sovits start webui --local

3. 启动后怎么打开

启动成功后,终端里会显示两个地址,通常是:

http://127.0.0.1:7860
http://xxxxxxxx.live

用你自己电脑的浏览器 (不是镜像电脑!) 打开第二个(.live)地址,就能看到 WebUI 页面。第一个地址是镜像环境本机的IP, 不会搞穿透的话可以不用.

4. 新手怎么用

最简单的流程是下面这几个步骤:

第一步:准备音频

  • 只上传 .wav 文件
  • 数据集名字、文件名尽量用英文、数字、下划线
  • 不要把文件乱放,建议每个说话人单独一个文件夹

第二步:进入“训练”页

WebUI 里有“训练”标签页,按顺序做:

  1. 检查环境
  2. 上传数据集或整理 dataset_raw/
  3. 重采样
  4. 生成文件列表和配置
  5. 提取特征和 F0
  6. 开始训练主模型

如果你只是想先试效果,也可以先用别人已经训练好的模型直接做推理。

第三步:进入“推理”页

推理就是把一个声音转换成另一个声音。

基本操作:

  1. 选择模型文件
  2. 选择配置文件
  3. 点击“加载模型”
  4. 上传要转换的音频
  5. 点“音频转换”

转换完成后,会生成输出音频。

5. 常用命令

进入带环境的命令行:

sovits start cmd

启动 TensorBoard 看训练日志:

sovits start tensorboard

本地模式启动 TensorBoard:

sovits start tensorboard --local

6. 常见问题

1)命令找不到

优先试:

./scripts/sovits start webui

如果还是不行,说明命令别名还没装好,需要先把启动脚本加到 PATH。

2)启动很慢

第一次启动会加载环境和模型,稍微慢一点是正常的。

3)没有 GPU 能不能用

可以启动,但训练和推理都会很慢,适合简单测试,不适合正式使用。

4)数据集格式报错

最稳妥的做法是:

  • 只用 .wav
  • 文件名用英文
  • 每个说话人单独一个文件夹

7. 这个镜像里常见的目录

  • dataset_raw/:原始音频数据
  • dataset/44k/:重采样后的数据
  • logs/44k/:训练日志和检查点
  • trained/:导出的可用模型
  • pretrain/:预训练模型

8. 说明

这个项目用于合法的语音合成和研究场景。请只使用你有权处理的音频数据。

@SHW
镜像信息
已使用0
运行时长
0 H
支持自启动
镜像大小
60GB
最后更新时间
2026-06-28
支持卡型
RTX40系RTX50系48G RTX40系3080Ti2080Ti30902080A800
+8
框架版本
PyTorch-any(自带环境)
CUDA版本
any(自带环境)
应用
JupyterLab: 8888
版本
v1.0
2026-06-28
PyTorch:any(自带环境) | CUDA:any(自带环境) | 大小:60.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台