登录
Cosmos-v1.0
Cosmos-v1.0是英伟达开源的首款物理世界生成模型,可同时处理文本、图像、激光雷达等多模态输入,一键生成高逼真机器人或自动驾驶训练视频
1
0/小时
v1.0

基本介绍

nvidia开源的Cosmos系列模型,能根据输入文本、图像和视频生成视频。

镜像使用教程

实例初始化完成后,进入JupyterLab,新建一个终端,在/root/Cosmos路径下有test.sh,运行下面的命令可以生成5秒的视频,花费时间半小时。

复制模型,注意这步需要扩容磁盘到300G,400G最好

cd ~/Cosmos
cp -r /model/HuggingFace/nvidia  ./

修改test.sh的--checkpoint_dir

--checkpoint_dir ./nvidia/

然后运行

sh test.sh

1. 由于显存不足的原因,--offload相关的参数都得加上

2. 默认是生成121帧,fps为24的视频,参数可在root/Cosmos/cosmos1/models/diffusion/inference/inference_utils.py中查看

镜像信息
@苍耳阿猫
苍耳阿猫认证作者
已使用17
运行时长
4 H
镜像大小
60GB
最后更新时间
2025-11-18
支持卡型
RTX50系RTX40系48G RTX40系A100P40A800
+6
框架版本
PyTorch-2.5.1+cu124
CUDA版本
12.4
应用
JupyterLab: 8888
版本
v1.0
2025-11-18
PyTorch:2.5.1+cu124 | CUDA:12.4 | 大小:60.00GB