优云智算
控制台
立即注册
Gemma-4 + GPT-OSS-120B 双破限大模型 WebUI 开箱即用镜像
基于 Ollama + Open WebUI 搭建的双破限大模型共享镜像,集成 Gemma-4 与 GPT-OSS-120B 两类核心模型,支持浏览器直接访问与可视化聊天。
star2
0/小时
v1.0
最新

这是一个基于 Ollama + Open WebUI 搭建的双破限大模型镜像,内置 gemma-4-uncensores:31b 和 GPT-OSS-Abliterated 120B 两个模型。两个模型都属于限制较少、表达更开放的版本,适合本地大模型聊天、写作、推理等场景。

镜像里分为 不带 KSK 和 带 KSK 两类模型。 不带 KSK 的是原始模型版本,没有额外性能预设,对显卡性能要求更高,更适合高配置显卡直接发挥模型原本能力。 带 KSK 的是针对显存和运行稳定性做过预设优化的版本,更适合作为共享镜像里的默认使用方案。

目前实测下来,5090 是使用 KSK 预设版本的最低推荐配置。如果租用 5090,使用带 KSK 后缀的模型会相对更稳、更合适;如果租用更高配置的显卡,则可以进一步尝试不带 KSK 的原始模型,并获得更快的推理速度和更高的性能表现。

其中 Gemma 4 31B 对硬件要求相对低一些,24GB 显存的 4090 理论上有机会运行;但 GPT-OSS-Abliterated 120B 对显存和整体配置要求更高,24GB 的 4090 可能会有较大压力,这部分目前没有作为稳定方案正式测试通过。因此,如果想更稳地体验这套镜像,还是更建议从 5090 起步。

这是一套已经做好 自启动 的镜像。租用实例后,服务会自动拉起,用户进入环境后即可通过 Ollama / Open WebUI 直接开始使用,不需要再手动重复部署流程。

@AI-KSK
AI-KSK认证作者
镜像信息
已使用2
运行时长
0 H
支持自启动
镜像大小
170GB
最后更新时间
2026-04-08
支持卡型
RTX50系48G RTX40系A800H20V100SA100RTX40系
+7
框架版本
PyTorch-12.8
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2026-04-08
PyTorch:12.8 | CUDA:12.8 | 大小:170.00GB
logo

隶属于优刻得科技股份有限公司

股票代码:688158

优刻得是中立、安全的云计算服务平台