登录
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥
star5
0/小时
v1.1

voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥

镜像简介

Voice-Pro 镜像为您提供专业的视频语音本地化一站式解决方案。它能对视频进行精准的多语言配音翻译,并克隆特定人声,实现声音的高度还原与定制。无论是直译对白、适配旁白,还是将视频声音完整汉化,均可高效完成。本镜像集成先进语音合成与克隆技术,支持本地化处理,助您轻松跨越语言障碍,为视频内容注入更具亲和力与专业度的声音表达。

镜像使用教程

1、 创建实例

创建实例

2、启动后点击「SD-WebUI」 voice pro会在新的网页窗口打开(方法一)

创建示例后,等待启动完成,单击启动图标 SD-WebUI (如不成功,稍微等几分钟再点击) image.png

image.png

快速运行指令进入 voice pro(方法二)

启动应用

在终端中运行以下命令启动WebUI:

/bin/bash /root/run.sh

或者:

cd /root/voice-pro && ./start_app.sh

启动成功后,在浏览器中访问:http://localhost:7860


运行界面截图

image.png

image.png

image.png

image.png


bug反馈可以加入科哥专属群交流➕ 广告勿进!​

描述图片内容

科哥在UCloud镜像列表【不断更新中】:

  • https://kege-aigc.feishu.cn/docx/L3FVdQl7kom8Ckx7QiicQj2VnEd

  • 想给视频做多语言配音,或者克隆特定声音,市面上的商业工具动不动就按字符收费,长期下来成本实在太高。

  • 最近关注到 Voice-Pro 这个项目,原本是付费软件,后来开发者宣布彻底开源免费,直接把“视频翻译+语音克隆”的门槛打了下来。

  • 整合了从 外网英文 视频下载、人声分离、语音识别到翻译配音的全流程,支持使用 - WhisperX 进行高精度字幕生成,更能通过 F5-TTS 和 CosyVoice 实现零样本声音克隆。

  • 原项目英文,刚刚使用claude改的。

  • 相当于在本地部署了一个免费版的 ElevenLabs,对于有视频出海需求或想做多语言内- 容的朋友,这绝对是省钱利器。

@科哥AIGC
科哥AIGC认证作者
镜像信息
已使用20
运行时长
10 H
支持自启动
镜像大小
60GB
最后更新时间
2026-01-20
支持卡型
3090RTX40系48G RTX40系2080Ti3080Ti2080A800H20P40V100SA100RTX50系
+12
框架版本
PyTorch-2.8
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.1
2026-01-20
PyTorch:2.8 | CUDA:12.8 | 大小:60.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台