sbatchの書式が Torque/OpenPBS系と結構違う.
Torque/OpenPBS系の書式でslrumを動かせるツールが「slurm-torque」パッケージです
インストール
dnf localinstall ./rpmbuild/RPMS/x86_64/slurm-torque-23.02.4-1.el8.x86_64.rpm \
./rpmbuild/RPMS/x86_64/slurm-perlapi-23.02.4-1.el8.x86_64.rpm
使ってみて
基本、qsubコマンドでgpuリソースは管理対象外みたい.
slurm環境でインターラクティヴモードを使ってみる.
qsub -l select=1:ncpus=12:ngpus=1 -I * gpuは確保されないみたい。
qsub -l select=1:ncpus=12:host=worker1 * hostは考慮してくれない.
srun -w n1 -n 4 --pty bash *ホスト名 n1 で core4つ使う
srun -w n1 -n 4 --gres=gpu:2 --pty bash *ホスト名 n1 で core4つ使い GPU2枚確保します
バッチジョブ
#!/bin/bash
#PBS -q workq
#PBS -n test-run
#PBS -l select=1:ncpus=12:ngpus=4:host=work1 * ngpusとhostは考慮されないです
cd $PBS_O_WORKDIR * $PBS_O_WORKDIRの環境変数は用意されないです
relion_refine .....
ならslurmでは
#!/bin/bash
#SBATCH -p workq
#SBATCH -n 12 * core数
#SBATCH -G 4 * gpu数
#SBATCH -w worker1 * host指定
cd $SLURM_SUBMIT_DIR
relion_refine .....
[illya@slurm ~]$ ls /opt/slurm/bin/
generate_pbs_nodefile pbsnodes qdel qrerun qstat sacct salloc sbatch scancel scrontab sgather sprio sreport sshare strigger
mpiexec qalter qhold qrls qsub sacctmgr sattach sbcast scontrol sdiag sinfo squeue srun sstat
[illya@slurm ~]$ qstat -Q
Queue Max Tot Ena Str Que Run Hld Wat Trn Ext T
---------------- --- --- --- --- --- --- --- --- --- --- -
workq ? ? yes yes ? ? ? ? ? ? E
[illya@slurm ~]$ qstat -n -1
slurm:
Req'd Req'd Elap
Job id Username Queue Name SessID NDS TSK Memory Time Use S Time
-------------------- -------- -------- -------------------- ------ ----- ----- ------ ----- - -----
3 illya workq bash -- 1 1 -- 71582 R 00:10 n2/1
[illya@slurm ~]$
[illya@slurm ~]$ qdel 3
[illya@slurm ~]$ qstat -n -1
slurm:
Req'd Req'd Elap
Job id Username Queue Name SessID NDS TSK Memory Time Use S Time
-------------------- -------- -------- -------------------- ------ ----- ----- ------ ----- - -----
3 illya workq bash -- 1 1 -- 71582 C 00:11 n2/1
[illya@slurm ~]$
[illya@slurm ~]$ qstat
Job id Name Username Time Use S Queue
------------------- ---------------- --------------- -------- - ---------------
3 bash illya 00:00:11 C workq
[illya@slurm ~]$