QwQ-32B-GGUF

QwQ 是 Qwen 系列中的推理模型。与传统的指令调优模型相比，具备思考和推理能力的 QwQ 在下游任务中，特别是在解决难题时，能够显著提升性能。QwQ-32B 是一个中等规模的推理模型，其性能可以与最先进的推理模型相媲美，例如 DeepSeek-R1、o1-mini

0元/小时

v1.0

通义千问 QwQ-32B 镜像使用教程

QwQ 是 Qwen 系列中的推理模型。与传统的指令调优模型相比，具备思考和推理能力的 QwQ 在下游任务中，特别是在解决难题时，能够显著提升性能。QwQ-32B 是一个中等规模的推理模型，其性能可以与最先进的推理模型相媲美，例如 DeepSeek-R1、o1-mini。

此镜像包含 QwQ 32B 模型，具有以下特点：

此镜像基于ollama运行，并安装了open-webui的dev分支实现可视化模型聊天，预先下载了QwQ-32b模型。

注：由于open-webui会出现连接不上open api导致网页暂停加载5分钟的情况，我在bashrc中添加export AIOHTTP_CLIENT_TIMEOUT_MODEL_LIST=5，强制设为只暂停加载5秒。

ollama serve

open-webui serve

镜像信息

@苍耳阿猫

认证作者

已使用30 次

运行时长

21 H

镜像大小

70GB

最后更新时间

2025-07-14

支持卡型

RTX40系48G RTX40系30902080

框架版本

PyTorch-2.3.0+cu121

CUDA版本

12.1

应用

JupyterLab: 8888

版本

v1.0

2025-07-14

PyTorch:2.3.0+cu121 | CUDA:12.1 | 大小:70.00GB