0织梦矩阵混剪 GPU 一体化镜像(Miniconda3 版)
本镜像用于快速部署“织梦矩阵混剪”的 GPU 云端运行环境,适合手机端/网页端连接 GPU 实例完成混剪、配音、字幕识别、数字人驱动和视频渲染等任务。
8799 端口连接使用。本镜像构建和运行所需的基础环境。
nvidia-smi 和各 Conda 环境为准zhimo:织梦混剪应用后端,运行 uvicorn app.main:appdh:GPU 数字人统一服务,运行 run_server.pytts:TTS/ASR 子进程环境latentsync:LatentSync 常驻推理 Worker8799:织梦混剪业务后端,手机端/网页端主要连接端口8383:GPU 统一能力接口,默认用于内部调试或网关调用50100:LatentSync Worker 内部端口50000:TTS 内部端口50001:ASR 内部端口supervisorctl status heygem latentsync_worker zhimo_app
supervisorctl reread
supervisorctl update
supervisorctl start latentsync_worker
supervisorctl start heygem
supervisorctl start zhimo_app
8799。http://实例公网IP:8799
8383 为 GPU 能力服务端口,通常不需要向普通用户开放;如需联调数字人/TTS/ASR,可按需放行或仅在服务器本机访问。在服务器内执行以下命令验证服务是否正常:
nvidia-smi
supervisorctl status heygem latentsync_worker zhimo_app
curl -s http://127.0.0.1:50100/health
curl -s http://127.0.0.1:8383/api/heygem/health
curl -s http://127.0.0.1:8383/api/tts/health
curl -s http://127.0.0.1:8383/api/asr/health
curl -s http://127.0.0.1:8799/api/health
curl -s http://127.0.0.1:8799/api/bootstrap
公网连通性验证:
curl -s http://实例公网IP:8799/api/health
正常情况下应返回类似:
{"ok":true,"message":"","data":{"status":"ok"}}
http://实例公网IP:8799http://实例公网IP:8799/api/healthhttp://127.0.0.1:8383/api/heygem/healthhttps://api.zhimoai.topQ1:手机端提示“服务未就绪”或 /api/health 不通怎么办?
A1: 先确认 zhimo_app 正在运行,再确认云平台已放行 TCP 8799。服务本机通但公网不通时,通常是安全组或端口映射未开放。
Q2:8383 端口需要公网开放吗?
A2: 一般不需要。手机端主要连接 8799,8383 是 GPU 内部能力服务,建议只在调试或网关转发场景使用。
Q3:首次启动为什么显存会占用较高?
A3: LatentSync、TTS、ASR 等模型会常驻加载,以减少后续任务等待时间。RTX 3090 环境下启动后占用约 10GB 以上显存属于正常现象。
Q4:镜像为什么仍有几十 GB?
A4: 核心代码、Conda 环境、LatentSync、TTS/ASR 模型和运行依赖本身占用较大。Miniconda3 版已比通用 PyTorch 大底镜像更精简,实际验证系统占用约 44GB。
Q5:手机端远程出片接口返回“当前卡密不支持在线版”怎么办?
A5: 这是卡密权限限制,不是 GPU 镜像部署失败。请使用支持对应功能的卡密,或走本地版客户端/GPU 直连模式。

支持自启动