CosyVoice3,多音字控制,音色保存,接口API调用,流式接口,音频降噪

镜像简介

本镜像基于CosyVoice3语音合成与克隆系统，支持多音字精准控制、个性化音色保存及API流式调用，具备实时音频降噪能力。提供高质量的语音生成与复刻功能，适用于虚拟助手、有声内容制作、多场景交互语音及定制化语音服务。该环境目前可免费部署使用，助力用户轻松实现专业级语音AI应用集成。

该镜像支持自启动，创建实例，初始化后，需要等待服务编译启动，大概4分钟左右，可以输入命令 tail -50f /root/wan/cosyvoice.txt 查看启动日志随后点击 SD-WEBUI 按钮即可，上传音色文件或者选择音色，点击生成即可

支持接口API调用

@刘悦的技术博客

认证作者

镜像信息

已使用487 次

运行时长

5350 H

支持自启动

镜像大小

120GB

最后更新时间

2026-01-28

支持卡型

RTX50系RTX40系48G RTX40系3080Ti30902080Ti2080A800

框架版本

PyTorch-2.8

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.0

2026-01-28

PyTorch:2.8 | CUDA:12.8 | 大小:120.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

产品

快速入口

镜像合集