voice pro给视频做多语言配音翻译克隆特定视频声音直译视频声音本地化汉化构建by科哥一键部署

控制台

立即注册

voice pro给视频做多语言配音翻译克隆特定视频声音直译视频声音本地化汉化构建by科哥

0元/小时

v1.1

voice pro给视频做多语言配音翻译克隆特定视频声音直译视频声音本地化汉化构建by科哥

镜像简介

Voice-Pro 镜像为您提供专业的视频语音本地化一站式解决方案。它能对视频进行精准的多语言配音翻译，并克隆特定人声，实现声音的高度还原与定制。无论是直译对白、适配旁白，还是将视频声音完整汉化，均可高效完成。本镜像集成先进语音合成与克隆技术，支持本地化处理，助您轻松跨越语言障碍，为视频内容注入更具亲和力与专业度的声音表达。

镜像使用教程

1、创建实例

创建实例

2、启动后点击「SD-WebUI」 voice pro会在新的网页窗口打开（方法一）

创建示例后，等待启动完成，单击启动图标 SD-WebUI （如不成功，稍微等几分钟再点击）

快速运行指令进入 voice pro（方法二）

启动应用

在终端中运行以下命令启动WebUI：

/bin/bash /root/run.sh

或者：

cd /root/voice-pro && ./start_app.sh

启动成功后，在浏览器中访问：http://localhost:7860

运行界面截图

bug反馈可以加入科哥专属群交流➕ 广告勿进！

科哥在UCloud镜像列表【不断更新中】：

https://kege-aigc.feishu.cn/docx/L3FVdQl7kom8Ckx7QiicQj2VnEd
想给视频做多语言配音，或者克隆特定声音，市面上的商业工具动不动就按字符收费，长期下来成本实在太高。
最近关注到 Voice-Pro 这个项目，原本是付费软件，后来开发者宣布彻底开源免费，直接把“视频翻译+语音克隆”的门槛打了下来。
整合了从外网英文视频下载、人声分离、语音识别到翻译配音的全流程，支持使用 - WhisperX 进行高精度字幕生成，更能通过 F5-TTS 和 CosyVoice 实现零样本声音克隆。
原项目英文，刚刚使用claude改的。
相当于在本地部署了一个免费版的 ElevenLabs，对于有视频出海需求或想做多语言内- 容的朋友，这绝对是省钱利器。

@鸡你太美

认证作者

镜像信息

已使用27 次

运行时长

11 H

支持自启动

镜像大小

60GB

最后更新时间

2026-04-27

支持卡型

3090RTX40系48G RTX40系2080Ti3080Ti2080A800H20P40V100SA100RTX50系

+12

框架版本

PyTorch-2.8

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v1.1

2026-04-27

PyTorch:2.8 | CUDA:12.8 | 大小:60.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分

voice pro给视频做多语言配音翻译克隆特定视频声音 直译视频声音本地化 汉化构建by科哥

镜像简介

镜像使用教程

1、 创建实例

2、启动后点击「SD-WebUI」 voice pro会在新的网页窗口打开（方法一）

快速运行指令进入 voice pro（方法二）

启动应用

运行界面截图

bug反馈可以加入科哥专属群交流➕ 广告勿进！​

​

科哥在UCloud镜像列表【不断更新中】：

voice pro给视频做多语言配音翻译克隆特定视频声音直译视频声音本地化汉化构建by科哥

1、创建实例

bug反馈可以加入科哥专属群交流➕ 广告勿进！