LongCat Avatar 1.5｜WebUI 无限时长数字人镜像一键部署

控制台

立即注册

LongCat Avatar 1.5｜WebUI 无限时长数字人镜像

内置简易 WebUI，支持 6 种运行方式，主打高清数字人长视频生成。480P 可用 48G 显卡运行，720P 建议更高规格 GPU，适合低中断率超长视频制作。

0元/小时

v2.0

v1.0

镜像使用指南

教学视频：

本镜像已内置 WebUI。启动实例后，点击 WebUI 即可进入操作页面。

常用模式

WebUI 内置 6 种官方示例，新手主要看两个：

单人图生长视频 上传 1 张人物图 + 1 段音频，适合单人数字人口播。

双人图生长视频 上传 1 张双人图 + 2 段音频，适合双人对话。

段落数怎么算

视频长度由 段落数 决定，不是由音频自动决定。

第 1 段约 3.72 秒。 之后每增加 1 段，约增加 3.2 秒。

公式：

总时长 = 3.72 +（段落数 - 1）× 3.2

常用参考：

1 段 ≈ 3.72 秒 2 段 ≈ 6.92 秒 3 段 ≈ 10.12 秒 4 段 ≈ 13.32 秒 5 段 ≈ 16.52 秒 10 段 ≈ 32.52 秒

比如 12 秒音频，建议选择 4 段，生成后多出来的部分后期裁掉。

单人提示词怎么写

单人提示词不用复杂，按这个顺序写：

人物是谁 + 场景在哪 + 镜头怎么拍 + 表情动作 + 画面稳定清晰

示例：

A medium shot of one person speaking clearly in a clean indoor studio. Natural facial expression, subtle head movement, accurate lip synchronization, stable camera, clean lighting, consistent identity, high quality video.

如果上传了参考图，提示词不要大幅修改人物长相。

参考图负责人物，提示词主要负责场景、镜头和画面质量。

双人模式怎么用

双人模式建议统一按这个规则：

左边人物 = person1 = 人物一音频 右边人物 = person2 = 人物二音频

提示词建议这样写：

Person1 is on the left. Person2 is on the right. They are having a natural conversation.

如果是先后说话：人物一先说，人物二后说。

如果是穿插说话：准备两条等长音频轨，不说话的位置保留静音。这样模型更容易判断哪一段音频应该驱动哪个人物。

任务队列

点击提交后，任务会进入队列。系统会按顺序运行任务，不会同时并行渲染多个任务。

如果生成结果不满意，可以在任务台终止当前任务，让下一个任务继续执行。

本镜像支持快速启动。

启动实例后，可直接进入 ComfyUI 使用，无需手动配置环境。

1. 点击 ComfyUI 启动进入

2. 点击左侧文件夹，选择要运行的工作流

欢迎加入 AI-KSK 镜像使用交流群

@AI-KSK

认证作者

镜像信息

已使用105 次

运行时长

441 H

支持自启动

镜像大小

80GB

最后更新时间

2026-05-24

支持卡型

48G RTX40系RTX50系A800H20A100

框架版本

PyTorch-12.8

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v2.0

2026-05-24

PyTorch:12.8 | CUDA:12.8 | 大小:80.00GB

v1.0

2026-05-23

PyTorch:12.8 | CUDA:12.8 | 大小:80.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得

产品

GPU实例 GPU镜像社区模型API服务 Coding Plan

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分