登录
cp2k
cp2k-v2025.2
0
0/小时
v2025.2

CP2K (GPU Accelerated Version)

1. 简介 (Introduction)

CP2K 是一款著名的开源量子化学与固态物理计算软件包,能够执行原子模拟、电子结构计算(DFT)、从头算分子动力学(AIMD)等任务。

本版本专为 NVIDIA RTX 4090 (Ada Lovelace) 架构优化,基于 CUDA 12.8 编译。

  • 核心特性:使用 GPW (Gaussian and Plane Waves) 方法。
  • GPU 加速:已启用 DBCSR (Distributed Block Compressed Sparse Row) 加速,矩阵乘法运算将卸载至 GPU 执行。
  • 依赖环境:OpenMPI, OpenBLAS, FFTW3, CUDA 12.8。

2. 快速开始 (Running Benchmarks)

以下步骤演示如何运行标准的 H2O-64(64个水分子的 DFT 计算)基准测试,以验证 GPU 加速是否生效。

步骤 1:设置环境变量

在运行计算前,建议设置以下并行参数以获得最佳性能(针对单卡 4090 + 多核 CPU):

# 添加 CP2K 可执行文件到路径 (根据你的实际安装位置)
export PATH=/workspace/cp2k-2025.2/exe/local_cuda:$PATH

# 设置 OpenMP 线程数 (建议设置为 CPU 物理核心数,例如 16)
export OMP_NUM_THREADS=16

# 增加堆栈大小以防止内存溢出错误
export OMP_STACKSIZE=512M
ulimit -s unlimited

步骤 2:进入测试目录

CP2K 自带了丰富的测试用例,我们使用标准的 QS 基准测试:

cd /workspace/cp2k-2025.2/benchmarks/QS

步骤 3:运行测试命令

使用 mpirun 启动计算。

  • -np 1:使用 1 个 MPI 进程(对应 1 张 GPU)。
  • --allow-run-as-root:如果你在 Docker/容器的 root 用户下运行,必须加此参数。
mpirun --allow-run-as-root -np 1 cp2k.psmp -i H2O-64.inp -o H2O-64.out

步骤 4:验证 GPU 状态

在任务运行时,打开一个新的终端窗口,输入以下命令监控显卡:

watch -n 1 nvidia-smi

预期现象:

  • Volatile GPU-Util:数值应该在波动(例如 10% - 90%),表明 GPU 正在参与计算。
  • Processes:进程列表中应出现 cp2k.psmp

步骤 5:检查输出结果

任务完成后(或运行几步后),检查输出文件 H2O-64.out 确认 GPU 被识别:

# 检查是否识别到 NVIDIA RTX 4090
grep "DBCSR| ACC:" H2O-64.out

# 预期输出类似:
# DBCSR| ACC: Number of devices: 1
# DBCSR| ACC: Device 0: NVIDIA GeForce RTX 4090

镜像信息
@苍耳阿猫
苍耳阿猫认证作者
已使用0
运行时长
0 H
镜像大小
60GB
最后更新时间
2025-12-18
支持卡型
RTX40系
+1
框架版本
PyTorch-v2025.2
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v2025.2
2025-12-18
PyTorch:v2025.2 | CUDA:12.8 | 大小:60.00GB