镜像社区
部署GPU实例
文档中心
常见问题(FAQ)
语音
Zonos-v0.1
一个领先的开源文本到语音(TTS)模型,专为生成自然流畅的语音而设计。
0/小时
v1.0

Zonos 镜像使用教程

Zonos项目介绍

Zonos 是一款由 Zyphra 开发的先进开源文本到语音(TTS)模型,基于超过 20 万小时的多语言语音数据训练而成。它能够生成自然流畅的语音,并在表达力和音质上超越许多顶级 TTS 提供商。Zonos 支持零样本语音合成和语音克隆,能够通过几秒钟的参考音频复现说话人的语音特征。

开源地址:github.com/Zyphra/Zonosr

此外,它还支持多语言(英语、日语、中文、法语和德语等)、音频前缀输入和精细的语音控制成。无论是在智能助手、内容创作还是多语言应用中,Zonos 都展现了强大的功能和易用性,为语音合成领域带来了新的突破。

镜像使用教程

1. 先选择GPU型号,再点击“立即部署”

2. 待实例初始化完成后,会自动启动 Zonos 服务,访问地址:

> http://IP:7860/

IP替换外网IP,外网IP可以在控制台-基础网络(外)中获取

image

Zonos 项目目录: /root/Zonos

手动启动命令:

python /root/Zonos/gradio_interface.py

成功进入web界面如下图所示

image

配置

  • 最低:3080Ti(1 卡)
  • 推荐:RTX40 系(1 卡)
镜像信息
@HelloGitHub
已使用
12
镜像大小70GB
最近编辑2025-02-25
支持卡型
RTX40系48G RTX40系3080Ti3090
+4
框架版本
PyTorch-2.6.0
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.0
2025-07-03
PyTorch:2.6.0 | CUDA:12.4 | 大小:70.00GB