Rex-Omni 通过下一个点预测来检测任何事物
Rex-Omni 是一个 3B 参数的多模态大语言模型(MLLM),它将目标检测和一系列其他视觉感知任务重新定义为简单的下一个标记预测问题。
使用教程
0. 麻烦右上角点个收藏~

1. 在镜像详情界面点击“使用该镜像创建实例”

2. 选择GPU型号,再点击“立即部署”

3. 实例启动后(需要等待vllm加载模型,大约5分钟),在控制台中点击“SD-WebUI”

4.浏览器如图显示,就说明启动成功了

5.如果页面无响应,点击“JupyterLab”,再双击log.txt可查看启动进度

6.如果有报错的话,请下载log.txt发到下面的交流群中

十字鱼-镜像作者交流群
