镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
HunyuanVideo-Foley腾讯开源视频音效配音文本配音 汉化构建by科哥
根据一段文本或者视频,生成你的配音
0
0/小时
v1.0

HunyuanVideo-Foley腾讯开源视频音效配音文本配音

本镜像已经设置开机运行,【全部模型已经离线,开机即用!】加载运行需要一定时间

使用教程

1、实例创建完成,等待2分钟加载完毕模型后,在控制台打开【webui】即可进入使用界面;

image

WebUI界面示例

image.png image.png image.png

2、卡顿时候,在控制台,实例【..】那里,点击【重启】,释放资源,等待完成启动,再次打开 【webui】即可进入使用界面;

3、更多高级指令,可以进入jupyterlab,自行操作,例如:

查看进程:

ps -ef |grep python

终止进程:

kill -9 pid

虚拟环境激活命令:

conda activate py310

运行这个重启程序:

cd /root && bash run.sh

有bug请微信科哥: 312088415

关于HunyuanVideo-Foley

是腾讯混元开源的端到端视频音效模型,核心技术聚焦高保真与多模态协同。 其构建大规模文本 - 视频 - 音频数据集,经严格过滤保障质量;采用混合架构, 含多模态 Transformer 块同步处理视听流、单模态块优化音频; 借 Synchformer 实现帧级时序对齐,搭配 REPA 损失函数对齐音频表征; 自研增强音频 VAE 提升重建能力,最终输出 48kHz 高保真音效, 在多项评测中达 SOTA,适用于短视频、影视等多场景。


科哥在UCloud镜像列表:

镜像信息
@科哥AIGC
已使用0
运行时长
0 H
镜像大小
60GB
最后更新时间
2025-09-03
支持卡型
3090RTX40系3080Ti48G RTX40系H20P40A100A8002080
+9
框架版本
PyTorch-2.7
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.0
2025-09-03
PyTorch:2.7 | CUDA:12.4 | 大小:60.00GB
HunyuanVideo-Foley腾讯开源视频音效配音文本配音 汉化构建by科哥一键部署 | 优云智算