阿里通义万相开源的一款以音频驱动生成视频的AI模型,它能通过一张图片+音频来生成一段口型同步,表情神态,肢体动作流畅自然的高质量视频,并且支持多种语言.
点击部署GPU实例,选择镜像,建议优先选用
4090 48G显卡,可以直接生成更大的分辨率视频,并且不容易爆显存,点击下方立即部署.
立即部署完成后会自动跳转到控制台,选择已部署的镜像实例点击启动
启动完成后,点击红色框内"ComfyUI"进入前端操作页面,点击蓝色框内“JupyterLab”进入后台文件夹页面,如果点击ComfyUI没反应,请刷新页面