登录
Ovi
用于音频视频生成的双主干交叉模态融合
1
0/小时
v1.0

Ovi

Ovi 是一个类似 veo-3 的视频+音频生成模型,能够从文本或文本+图像输入中同时生成视频和音频内容。

🎬 视频+音频生成:同步生成视频和音频内容

📝 灵活输入:支持纯文本或文本+图像条件化

⏱️ 5 秒视频:以 24 帧每秒生成 720×720 区域的 5 秒视频,支持多种长宽比(9:16、16:9、1:1 等)

使用教程

0. 麻烦右上角点个收藏~

318e364f-9c65-489c-9391-b3fb6cd49c26.png

1. 在镜像详情界面点击“使用该镜像创建实例”

image.png

2. 选择GPU型号,再点击“立即部署”

image.png

3. 实例启动后,在控制台中点击“SD-WebUI”

image.png

4.浏览器如图显示,就说明启动成功了

image.png

5.如果页面无响应,点击“JupyterLab”,再双击log.txt可查看启动进度

image.png image.png

6.如果有报错的话,请下载log.txt发到下面的交流群中

image.png

7.提示

7.1 第一次生成会加载模型,所以时间较长。后续生成的速度正常。

十字鱼-镜像作者交流群

image

镜像信息
@十字鱼
十字鱼认证作者
支持自启动
已使用1
运行时长
0 H
镜像大小
120GB
最后更新时间
2025-10-06
支持卡型
RTX40系48G RTX40系3090H20A100A800
+6
框架版本
PyTorch-2.7.0
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-10-06
PyTorch:2.7.0 | CUDA:12.8 | 大小:120.00GB