镜像社区
部署GPU实例
文档中心
常见问题(FAQ)
数字人
LLM
LiveTalking
实时交互数字人,支持ernerf、musetalk、wav2lip多种模型
0/小时
v1.4
v1.3
v1.2
v1.1

镜像使用教程

该镜像有两种启动方式,参考下面“快速使用”和“使用声音克隆”两种方法

注意:防火墙端口开放tcp 8010,udp 50000-51000

一、快速使用

1. 先选择GPU型号,再点击“立即部署”

image

2. 待实例初始化完成后,在控制台-应用中打开“JupyterLab”

image

3. 进入JupyterLab后,新建一个终端Terminal,在Terminal中运行如下命令

conda activate nerfstream
cd /workspace/LiveTalking
python app.py --transport webrtc --model wav2lip --avatar_id wav2lip256_avatar1

当出现以下运行结果时,即可在浏览器里打开 http://serverip:8010/webrtcapi.html

image

serverip可以在控制台-基础网络(外)复制得到

image

进入web界面后点击start,能看到数字人视频。然后输入文字并点击send,数字人会播报输入文字

image

二、使用声音克隆

1. 如启动方法一,进入JupyterLab后,新建一个终端Terminal,在终端中输入以下指令启动tts服务

conda activate sovits
cd /workspace/GPT-SoVITS
python api_v2.py

2. 不要关闭前一个正在运行的终端,再新建一个终端,输入以下指令启动数字人服务

conda activate nerfstream
cd /workspace/LiveTalking

然后根据不同数字人模型运行(只需选择一个运行即可)

  • museltalkpython app.py --model musetalk --transport webrtc --tts gpt-sovits --TTS_SERVER http://127.0.0.1:9880 --REF_FILE ~/zero_shot_prompt.wav --REF_TEXT 希望你以后能够做的比我还好呦

  • wav2lippython app.py --transport webrtc --model wav2lip --avatar_id wav2lip256_avatar1 --tts gpt-sovits --TTS_SERVER http://127.0.0.1:9880 --REF_FILE ~/zero_shot_prompt.wav --REF_TEXT 希望你以后能够做的比我还好呦

3. 最后在浏览器里打开 http://serverip:8010/webrtcapi.html ,点击start,能看到数字人视频。然后输入文字并点击send,数字人会播报输入文字

三、防火墙设置教程

使用该镜像时可能出现数字人无法显示的问题,此时需检查防火墙设置是否正确,防火墙端口需开放tcp 8010,udp 50000-51000

1. 如图所示,在控制台-操作中打开配置防火墙

image

2. 点击“编辑防火墙规则”

image

3. 点击“添加规则”

image

4. 选择指定端口TCP,输入端口号8010;选择全端口UDP,输入端口号50000-51000;再点击下一步

image

5. 检查端口号,点击“确认”后即添加成功,可以回到防火墙规则中确认是否添加

image

镜像信息
@lipku
已使用
98
镜像大小80GB
最近编辑2025-06-12
支持卡型
RTX40系48G RTX40系P403080Ti3090
+5
框架版本
PyTorch-2.4
CUDA版本
12.4
应用
JupyterLab: 8888
自定义开放端口
8010
+1
版本
v1.4
2025-06-24
PyTorch:2.4 | CUDA:12.4 | 大小:80.00GB
v1.3
2025-06-24
PyTorch:2.4 | CUDA:12.4 | 大小:80.00GB
v1.2
2025-06-24
PyTorch:2.4 | CUDA:12.4 | 大小:50.00GB
查看全部