xinference_GPU

Xorbits Inference (Xinference) 是一个开源平台，用于简化各种AI 模型的运行和集成。借助Xinference，可以使用任何开源LLM、Embedding模型和Rerank模型在云端或本地环境中运行推理

0元/小时

v1.0

Xinference 镜像使用教程

Xinference 项目介绍

Xorbits Inference (Xinference) 是一个开源平台，用于简化各种AI 模型的运行和集成。借助Xinference，可以使用任何开源LLM、Embedding模型和Rerank模型在云端或本地环境中运行推理。

xinference-local --host 0.0.0.0 --port 8890

镜像信息

已使用30 次

运行时长

263 H

镜像大小

60GB

最后更新时间

2025-07-14

支持卡型

3080Ti3090RTX40系48G RTX40系2080

框架版本

PyTorch-2.1.0

CUDA版本

12.4

应用

JupyterLab: 8888

版本

v1.0

2025-07-14

PyTorch:2.1.0 | CUDA:12.4 | 大小:60.00GB