控制台

立即注册

DeepSeek-R1-0528-Qwen3-8B

DeepSeek R1 模型进行了小版本升级，当前版本为 DeepSeek-R1-0528。在最新的更新中，DeepSeek R1 通过利用增加的计算资源并在后训练期间引入算法优化机制，显著提高了其推理和推理能力的深度。

0元/小时

v1.0

DeepSeek-R1-0528-Qwen3-8B 镜像使用教程

引言

DeepSeek R1 模型进行了小版本升级，当前版本为 DeepSeek-R1-0528。在最新的更新中，DeepSeek R1 通过利用增加的计算资源并在后训练期间引入算法优化机制，显著提高了其推理和推理能力的深度。该模型在各种基准测试评估中表现出出色的性能，包括数学、编程和一般逻辑。它的整体性能现在接近 O3 和 Gemini 2.5 Pro 等领先机型。

DeepSeek-R1-0528-Qwen3-8B

DeepSeek-R1-0528-Qwen3-8B是在DeepSeek-R1-0528训练思路的基础上对 Qwen3 8B Base 进行后训练，得到 DeepSeek-R1-0528-Qwen3-8B。该模型在 AIME 2024 上的开源模型中实现了最先进的（SOTA）性能，比 Qwen3 8B 高出 +10.0%，与 Qwen3-235B 思维的性能相当。

	AIME 24	AIME 25	HMMT Feb 25	GPQA Diamond	LiveCodeBench (2408-2505)
Qwen3-235B-A22B	85.7	81.5	62.5	71.1	66.5
Qwen3-32B	81.4	72.9	-	68.4	-
Qwen3-8B	76.0	67.3	-	62.0	-
Phi-4-Reasoning-Plus-14B	81.3	78.0	53.6	69.3	-
Gemini-2.5-Flash-Thinking-0520	82.3	72.0	64.2	82.8	62.3
o3-mini (medium)	79.6	76.7	53.3	76.8	65.9
DeepSeek-R1-0528-Qwen3-8B	86.0	76.3	61.5	61.1	60.5