控制台

立即注册

So-VITS-SVC-CU128 (即开即用, 无需部署)

So-VITS-SVC的2026全新Fork, 已经预配置好环境, 开箱即用. 支持Cuda12.8和RTX50系显卡, 训练/推理速度大大加快!

0元/小时

v1.0

so-vits-svc-cu128 镜像使用说明

1. 这是什么

这是一个已经配好的 so-vits-svc-cu128 镜像，主要用来做“变声 / 歌声转换”。

你可以把它理解成一个现成工具包，里面已经放好了：

可直接打开的 WebUI 图形界面
已配置好的 Python 运行环境
常用预训练模型
示例数据和训练目录

新手不需要自己安装 Python、CUDA、依赖包，通常直接启动就能用。

2. 一键启动命令

先打开终端，进入这个项目目录后执行：

sovits start webui

如果这个命令没识别出来，也可以直接运行：

./scripts/sovits start webui

如果你只想在本地打开，不使用公网分享链接，用这个命令：

sovits start webui --local

3. 启动后怎么打开

启动成功后，终端里会显示两个地址，通常是：

http://127.0.0.1:7860
http://xxxxxxxx.live

用你自己电脑的浏览器 (不是镜像电脑!) 打开第二个(.live)地址，就能看到 WebUI 页面。第一个地址是镜像环境本机的IP, 不会搞穿透的话可以不用.

4. 新手怎么用

最简单的流程是下面这几个步骤：

第一步：准备音频

只上传 .wav 文件
数据集名字、文件名尽量用英文、数字、下划线
不要把文件乱放，建议每个说话人单独一个文件夹

第二步：进入“训练”页

WebUI 里有“训练”标签页，按顺序做：

检查环境
上传数据集或整理 dataset_raw/
重采样
生成文件列表和配置
提取特征和 F0
开始训练主模型

如果你只是想先试效果，也可以先用别人已经训练好的模型直接做推理。

第三步：进入“推理”页

推理就是把一个声音转换成另一个声音。

基本操作：

选择模型文件
选择配置文件
点击“加载模型”
上传要转换的音频
点“音频转换”

转换完成后，会生成输出音频。

5. 常用命令

进入带环境的命令行：

sovits start cmd

启动 TensorBoard 看训练日志：

sovits start tensorboard

本地模式启动 TensorBoard：

sovits start tensorboard --local

6. 常见问题

1）命令找不到

优先试：

./scripts/sovits start webui

如果还是不行，说明命令别名还没装好，需要先把启动脚本加到 PATH。

2）启动很慢

第一次启动会加载环境和模型，稍微慢一点是正常的。

3）没有 GPU 能不能用

可以启动，但训练和推理都会很慢，适合简单测试，不适合正式使用。

4）数据集格式报错

最稳妥的做法是：

只用 .wav
文件名用英文
每个说话人单独一个文件夹

7. 这个镜像里常见的目录

dataset_raw/：原始音频数据
dataset/44k/：重采样后的数据
logs/44k/：训练日志和检查点
trained/：导出的可用模型
pretrain/：预训练模型

8. 说明

这个项目用于合法的语音合成和研究场景。请只使用你有权处理的音频数据。

@SHW

镜像信息

已使用0 次

运行时长

0 H

支持自启动

镜像大小

60GB

最后更新时间

2026-06-28

支持卡型

RTX40系RTX50系48G RTX40系3080Ti2080Ti30902080A800

框架版本

PyTorch-any(自带环境)

CUDA版本

any(自带环境)

应用

JupyterLab: 8888

版本

v1.0

2026-06-28

PyTorch:any(自带环境) | CUDA:any(自带环境) | 大小:60.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分