0Rosetta 是由诺奖得主 David Baker 团队开发的生物大分子建模与设计权威软件,被誉为“蛋白质世界的 CAD”。
核心逻辑: 它基于物理化学原理(能量函数)和蒙特卡洛采样算法,通过海量计算寻找生物大分子的最低能量状态(即最稳定的天然结构)。
三大核心功能:
cd /workspace
mkdir rosetta_test
cd rosetta_test
目的:测试 Rosetta 能否正确读取 PDB 结构,加载数据库,并计算物理能量。这是最简单的任务。
下载泛素(Ubiquitin, PDB ID: 1UBQ)的结构文件。它是结构生物学的“小白鼠”。
wget https://files.rcsb.org/download/1ubq.pdb
(如果没有 wget,可以用 apt install wget 安装)
使用你刚刚编译好的 score_jd2 应用。
注意:因为你在 Docker 容器内是 root 用户,使用 MPI 需要加 --allow-run-as-root。
# -np 2 表示使用 2 个 CPU 核心并行
mpirun --allow-run-as-root -np 2 score_jd2.mpi.linuxgccrelease \
-s 1ubq.pdb \
-out:file:scorefile 1ubq_score.sc
查看生成的 1ubq_score.sc 文件:
cat 1ubq_score.sc
成功标志:
你应该能看到类似表格的输出。找到 total_score 这一列,如果不为 0,说明物理引擎工作正常。
目的:测试 Rosetta 的采样(Sampling)能力。这会让蛋白质动起来,寻找更低能量的构象。这比单纯打分更耗时,更能验证系统稳定性。
我们生成 2 个结构 (-nstruct 2) 来测试 MPI 并行是否真的在工作。
mkdir output_relax
mpirun --allow-run-as-root -np 2 relax.mpi.linuxgccrelease \
-s 1ubq.pdb \
-nstruct 2 \
-relax:default_repeats 1 \
-out:path:all ./output_relax \
-out:suffix _test
-nstruct 2: 生成 2 个结果。-relax:default_repeats 1: 降低计算量,快速出结果(默认是 5 或更多)。-out:path:all ./output_relax: 把结果存到指定文件夹,保持整洁。查看输出目录:
ls -l output_relax
成功标志: 你应该看到以下文件:
score_test.sc:包含两个结构的打分文件。1ubq_test_0001.pdb:第一个优化后的结构。1ubq_test_0002.pdb:第二个优化后的结构。
认证作者