DeepSeek R1 模型进行了小版本升级,当前版本为 DeepSeek-R1-0528。在最新的更新中,DeepSeek R1 通过利用增加的计算资源并在后训练期间引入算法优化机制,显著提高了其推理和推理能力的深度。该模型在各种基准测试评估中表现出出色的性能,包括数学、编程和一般逻辑。它的整体性能现在接近 O3 和 Gemini 2.5 Pro 等领先机型。
DeepSeek-R1-0528-Qwen3-8B是在DeepSeek-R1-0528训练思路的基础上对 Qwen3 8B Base 进行后训练,得到 DeepSeek-R1-0528-Qwen3-8B。该模型在 AIME 2024 上的开源模型中实现了最先进的 (SOTA) 性能,比 Qwen3 8B 高出 +10.0%,与 Qwen3-235B 思维的性能相当。
AIME 24 | AIME 25 | HMMT Feb 25 | GPQA Diamond | LiveCodeBench (2408-2505) | |
---|---|---|---|---|---|
Qwen3-235B-A22B | 85.7 | 81.5 | 62.5 | 71.1 | 66.5 |
Qwen3-32B | 81.4 | 72.9 | - | 68.4 | - |
Qwen3-8B | 76.0 | 67.3 | - | 62.0 | - |
Phi-4-Reasoning-Plus-14B | 81.3 | 78.0 | 53.6 | 69.3 | - |
Gemini-2.5-Flash-Thinking-0520 | 82.3 | 72.0 | 64.2 | 82.8 | 62.3 |
o3-mini (medium) | 79.6 | 76.7 | 53.3 | 76.8 | 65.9 |
DeepSeek-R1-0528-Qwen3-8B | 86.0 | 76.3 | 61.5 | 61.1 | 60.5 |
ollama serve
open-webui serve
账号:root@root.com
密码:root