1本镜像构建和运行所需的基础环境。
以后启动分两步:先启动 SGLang 后端,再启动最终 UI。
1. 启动 SGLang 后端 如果关机/重启过,先跑这个:
cd /workspace/moss-v07-sglang-lab
. /workspace/moss-v07-sglang-lab/.venv-sglang/bin/activate
SGLANG_VLM_CACHE_SIZE_MB=0 sglang serve --model-path /workspace/moss-v07-sglang-lab/models/MOSS-TTSD-v0.7-with-codec --delay-pattern --trust-remote-code --disable-radix-cache --mem-fraction-static 0.70 --cuda-graph-max-bs 8 --port 30000 --host 0.0.0.0
等看到:
```text
The server is fired up and ready to roll!
就说明后端好了。
2. 另开一个终端,启动 UI 不要关掉第一个 SGLang 终端。新开一个终端跑:
cd /workspace/moss-v07-sglang-lab
. /workspace/moss-v07-cloud-kit/.venv/bin/activate
CUDA_VISIBLE_DEVICES="" PYTHONUNBUFFERED=1 SHARE=1 PORT=7862 python -X faulthandler /workspace/moss-v07-sglang-lab/final_sglang_ui.py
等出现:
```text
Running on public URL: https://xxxx.gradio.live
打开这个链接就行。
如果只是 UI 关了,SGLang 还在 先检查:
python - <<'PY'
import socket
s = socket.socket()
s.settimeout(2)
try:
s.connect(("127.0.0.1", 30000))
print("SGLang 后端还在,可以直接启动 UI")
except Exception as e:
print("SGLang 后端没开,需要先启动后端:", repr(e))
finally:
s.close()
PY
如果显示后端还在,就只跑第 2 步。
