slurm/client をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
大事な点
-mungeが動いている事が大事
-firewallは slurm.conf のSrunPortRange値を開ける(tcp)
なので
#code(nonumber){{
[root@slurm-client ~]# cat /etc/redhat-release
Rocky Linux release 9.1 (Blue Onyx)
[root@slurm-client ~]# groupadd -g 5001 munge && useradd ...
[root@slurm-client ~]# dnf install munge
(管理ノードから)
[root@slurm ~]# scp /etc/munge/munge.key slurm-client:/et...
[root@slurm-client ~]# chown munge. /etc/munge/munge.key
[root@slurm-client ~]# systemctl enable munge --now
}}
あとslurmパッケージ
#code(nonumber){{
(同じRHEL9系のn2ノードから)
[root@n2 ~]# scp rpmbuild/RPMS/x86_64/slurm-22.05.7-1.el9...
[root@slurm-client ~]# dnf localinstall slurm-22.05.7-1.e...
[root@slurm-client ~]# mkdir /opt/slurm/etc/
[root@slurm-client ~]# vi /etc/profile.d/slurm.sh
if [ -d /opt/slurm/bin ]; then
export PATH=${PATH}:/opt/slurm/bin
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/opt/slurm/li...
fi
[root@slurm-client ~]# vi /etc/profile.d/slurm.csh
if ( -d /opt/slurm/bin ) then
setenv PATH ${PATH}:"/opt/slurm/bin"
setemv LD_LIBRARY_PATH ${LD_LIBRARY_PATH}:"/opt/slurm/l...
endif
[root@slurm-client ~]#
}}
firewall. 管理ノードのslurm.confに書かれたSrunPortRangeの...
#code(nonumber){{
[root@slurm-client ~]# firewall-cmd --add-port=60001-6300...
[root@slurm-client ~]# firewall-cmd --reload
}}
設定ファイルのコピーを行います
#code(nonumber){{
(管理ノードから)
[root@slurm ~]# scp /opt/slurm/etc/*.conf slurm-client:/o...
}}
もしConfiglessの設定があるなら[[slurm/manager#d2a5c73c]] ...
これで完了.
#code(nonumber){{
[illya@slurm-client ~]$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
workq* up infinite 3 idle n[1-3]
[illya@slurm-client ~]$
}}
***mungeではなく、slurm内のプラグインで計算ノード間の認証...
「slurm-sackd」パッケージを別途インストールします
#code(nonumber){{
[root@slurm-client ~]# rpm -qpli ./slurm-sackd-22.05.7-1....
:
/opt/slurm/sbin/sackd
/usr/lib/.build-id
/usr/lib/.build-id/4a
/usr/lib/.build-id/4a/d47272bca0c58b2bb110802d4e68ca0b9a3...
/usr/lib/systemd/system/sackd.service
[root@slurm-client ~]#
[root@slurm-client ~]# dnf localinstall ./slurm-sackd-22....
[root@slurm-client ~]# systemctl enable sackd --now
}}
終了行:
大事な点
-mungeが動いている事が大事
-firewallは slurm.conf のSrunPortRange値を開ける(tcp)
なので
#code(nonumber){{
[root@slurm-client ~]# cat /etc/redhat-release
Rocky Linux release 9.1 (Blue Onyx)
[root@slurm-client ~]# groupadd -g 5001 munge && useradd ...
[root@slurm-client ~]# dnf install munge
(管理ノードから)
[root@slurm ~]# scp /etc/munge/munge.key slurm-client:/et...
[root@slurm-client ~]# chown munge. /etc/munge/munge.key
[root@slurm-client ~]# systemctl enable munge --now
}}
あとslurmパッケージ
#code(nonumber){{
(同じRHEL9系のn2ノードから)
[root@n2 ~]# scp rpmbuild/RPMS/x86_64/slurm-22.05.7-1.el9...
[root@slurm-client ~]# dnf localinstall slurm-22.05.7-1.e...
[root@slurm-client ~]# mkdir /opt/slurm/etc/
[root@slurm-client ~]# vi /etc/profile.d/slurm.sh
if [ -d /opt/slurm/bin ]; then
export PATH=${PATH}:/opt/slurm/bin
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/opt/slurm/li...
fi
[root@slurm-client ~]# vi /etc/profile.d/slurm.csh
if ( -d /opt/slurm/bin ) then
setenv PATH ${PATH}:"/opt/slurm/bin"
setemv LD_LIBRARY_PATH ${LD_LIBRARY_PATH}:"/opt/slurm/l...
endif
[root@slurm-client ~]#
}}
firewall. 管理ノードのslurm.confに書かれたSrunPortRangeの...
#code(nonumber){{
[root@slurm-client ~]# firewall-cmd --add-port=60001-6300...
[root@slurm-client ~]# firewall-cmd --reload
}}
設定ファイルのコピーを行います
#code(nonumber){{
(管理ノードから)
[root@slurm ~]# scp /opt/slurm/etc/*.conf slurm-client:/o...
}}
もしConfiglessの設定があるなら[[slurm/manager#d2a5c73c]] ...
これで完了.
#code(nonumber){{
[illya@slurm-client ~]$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
workq* up infinite 3 idle n[1-3]
[illya@slurm-client ~]$
}}
***mungeではなく、slurm内のプラグインで計算ノード間の認証...
「slurm-sackd」パッケージを別途インストールします
#code(nonumber){{
[root@slurm-client ~]# rpm -qpli ./slurm-sackd-22.05.7-1....
:
/opt/slurm/sbin/sackd
/usr/lib/.build-id
/usr/lib/.build-id/4a
/usr/lib/.build-id/4a/d47272bca0c58b2bb110802d4e68ca0b9a3...
/usr/lib/systemd/system/sackd.service
[root@slurm-client ~]#
[root@slurm-client ~]# dnf localinstall ./slurm-sackd-22....
[root@slurm-client ~]# systemctl enable sackd --now
}}
ページ名:
1