cp2k

cp2k-v2025.2

0元/小时

v2025.2

CP2K (GPU Accelerated Version)

1. 简介 (Introduction)

CP2K 是一款著名的开源量子化学与固态物理计算软件包，能够执行原子模拟、电子结构计算（DFT）、从头算分子动力学（AIMD）等任务。

本版本专为 NVIDIA RTX 4090 (Ada Lovelace) 架构优化，基于 CUDA 12.8 编译。

核心特性：使用 GPW (Gaussian and Plane Waves) 方法。
GPU 加速：已启用 DBCSR (Distributed Block Compressed Sparse Row) 加速，矩阵乘法运算将卸载至 GPU 执行。
依赖环境：OpenMPI, OpenBLAS, FFTW3, CUDA 12.8。

2. 快速开始 (Running Benchmarks)

以下步骤演示如何运行标准的 H2O-64（64个水分子的 DFT 计算）基准测试，以验证 GPU 加速是否生效。

步骤 1：设置环境变量

在运行计算前，建议设置以下并行参数以获得最佳性能（针对单卡 4090 + 多核 CPU）：

# 添加 CP2K 可执行文件到路径 (根据你的实际安装位置)
export PATH=/workspace/cp2k-2025.2/exe/local_cuda:$PATH

# 设置 OpenMP 线程数 (建议设置为 CPU 物理核心数，例如 16)
export OMP_NUM_THREADS=16

# 增加堆栈大小以防止内存溢出错误
export OMP_STACKSIZE=512M
ulimit -s unlimited

步骤 2：进入测试目录

CP2K 自带了丰富的测试用例，我们使用标准的 QS 基准测试：

cd /workspace/cp2k-2025.2/benchmarks/QS

步骤 3：运行测试命令

使用 mpirun 启动计算。

-np 1：使用 1 个 MPI 进程（对应 1 张 GPU）。
--allow-run-as-root：如果你在 Docker/容器的 root 用户下运行，必须加此参数。

mpirun --allow-run-as-root -np 1 cp2k.psmp -i H2O-64.inp -o H2O-64.out

步骤 4：验证 GPU 状态

在任务运行时，打开一个新的终端窗口，输入以下命令监控显卡：

watch -n 1 nvidia-smi

预期现象：

Volatile GPU-Util：数值应该在波动（例如 10% - 90%），表明 GPU 正在参与计算。
Processes：进程列表中应出现 cp2k.psmp。

步骤 5：检查输出结果

任务完成后（或运行几步后），检查输出文件 H2O-64.out 确认 GPU 被识别：

# 检查是否识别到 NVIDIA RTX 4090
grep "DBCSR| ACC:" H2O-64.out

# 预期输出类似：
# DBCSR| ACC: Number of devices: 1
# DBCSR| ACC: Device 0: NVIDIA GeForce RTX 4090

@苍耳阿猫

认证作者

镜像信息

已使用2 次

运行时长

14 H

镜像大小

60GB

最后更新时间

2025-12-18

支持卡型

RTX40系

框架版本

PyTorch-v2025.2

CUDA版本

12.8

应用

JupyterLab: 8888

版本

v2025.2

2025-12-18

PyTorch:v2025.2 | CUDA:12.8 | 大小:60.00GB

隶属于优刻得科技股份有限公司

股票代码：688158

优刻得是中立、安全的云计算服务平台

友情链接 :

优刻得|PICPIK.AI|LangChain中文网

产品

GPU实例 GPU镜像社区模型API服务

快速入口

文档中心 API文档用户协议

镜像合集

AI4S 数字人 TTS语音 Wan2.2 视频超分