登录
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪
star8
0/小时
v1.0

CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪

镜像简介

本镜像基于CosyVoice3语音合成与克隆系统,支持多音字精准控制、个性化音色保存及API流式调用,具备实时音频降噪能力。提供高质量的语音生成与复刻功能,适用于虚拟助手、有声内容制作、多场景交互语音及定制化语音服务。该环境目前可免费部署使用,助力用户轻松实现专业级语音AI应用集成。

镜像使用指南

该镜像支持自启动,创建实例,初始化后,需要等待服务编译启动,大概4分钟左右,可以输入命令 tail -50f /root/wan/cosyvoice.txt 查看启动日志 image.png 随后点击 SD-WEBUI 按钮即可,上传音色文件或者选择音色,点击生成即可

0.png

支持接口API调用

接口格式:http://你的实例ip地址:8188/?text=你好,测试一下&speaker=jok老师 其他参数:streaming=1&instruct=使用四川话

1.png

视频教程:https://www.bilibili.com/video/BV1Hoq8BjEQ8/

@刘悦的技术博客
刘悦的技术博客认证作者
镜像信息
已使用171
运行时长
2995 H
支持自启动
镜像大小
120GB
最后更新时间
2026-01-28
支持卡型
RTX50系RTX40系48G RTX40系3080Ti30902080Ti2080A800
+8
框架版本
PyTorch-2.8
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-01-28
PyTorch:2.8 | CUDA:12.8 | 大小:120.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台