OpenPBSで作った計算ノード向けパッケージ「openpbs-execution-23.06.06-0.x86_64.rpm」をインストールします
dnf localinstall openpbs-execution-23.06.06-0.x86_64.rpm
途中で下記のようなメッセージが表示されます。
*** PBS Installation Summary
***
*** Postinstall script called as follows:
*** /opt/pbs/libexec/pbs_postinstall execution 23.06.06 /opt/pbs /var/lib/pbs
***
*** No configuration file found.
*** Creating new configuration file: /etc/pbs.conf
*** =======
*** NOTICE:
*** =======
*** The value of PBS_SERVER in /etc/pbs.conf is invalid.
*** PBS_SERVER should be set to the PBS server hostname.
*** Update this value before starting PBS.
***
*** Replacing /etc/pbs.conf with /etc/pbs.conf.23.06.06
*** /etc/pbs.conf has been created.
***
*** Registering PBS as a service.
Synchronizing state of pbs.service with SysV service script with /usr/lib/systemd/systemd-sysv-install.
Executing: /usr/lib/systemd/systemd-sysv-install enable pbs
Created symlink /etc/systemd/system/multi-user.target.wants/pbs.service → /usr/lib/systemd/system/pbs.service.
***
*** PBS_HOME is /var/lib/pbs
*** Creating new file /var/lib/pbs/pbs_environment
*** WARNING: TZ not set in /var/lib/pbs/pbs_environment
***
*** The PBS MOM has been installed in /opt/pbs/sbin.
***
*** The PBS commands have been installed in /opt/pbs/bin.
***
*** End of /opt/pbs/libexec/pbs_postinstall
このメッセージに従って計算ノードに調整を加えます
PBS_EXEC=/opt/pbs
PBS_SERVER=openpbs <-- ジョブ管理ノードを記載
PBS_START_SERVER=0
PBS_START_SCHED=0
PBS_START_COMM=0
PBS_START_MOM=1
PBS_HOME=/var/lib/pbs
PBS_CORE_LIMIT=unlimited
PBS_SCP=/bin/scp
PATH=/bin:/usr/bin
TZ=Asia/Tokyo <-- timezoneを指定
$clienthost openpbs <-- ジョブ管理ノードを記載
$tmpdir /scratch <-- scratchディレクトリの指定
$usecp *:/home /home <-- /home, /dataがnfsで繋がっていたらcpを使ってコピーします
$usecp *:/data /data
$restrict_user True <-- 計算ノードへのログインを制御します. jobがこのノードで発行されてたらログインok
$restrict_user_exceptions user1 <--- jobがこのノードで実行されているに関わらずログインできるユーザ
$restrict_user_maxsysid 999 <--- システムプロセスを許可する最大のUID
systemctl start pbs
SELinuxは有効のままで大丈夫.
firewallも有効のままでも構わない.
[root@n1 ~]# getenforce
Enforcing
[root@n1 ~]# firewall-cmd --list-all
public (active)
target: default
icmp-block-inversion: no
interfaces: enp6s18
sources:
services: cockpit dhcpv6-client ssh
ports:
protocols:
forward: no
masquerade: no
forward-ports:
source-ports:
icmp-blocks:
rich rules:
[root@n1 ~]#
計算ノードをジョブ管理ノードに登録します。
これはジョブ管理ノードで行います。まず qmgr を立ち上げて、サブコマンド「create node <計算ノード>」と実行します
[root@openpbs ~]# qmgr
Max open servers: 49
Qmgr:
Qmgr: create node n1
Qmgr: create node s
削除は「delete node n1」「delete node s」とします
正しく登録されたかは qmgr コマンドではサブコマンド「list node <計算ノード>」、もしくはpbsnodesを実行します。
[root@openpbs ~]# pbsnodes -aS
vnode state OS hardware host queue mem ncpus nmics ngpus comment
--------------- --------------- -------- -------- --------------- ---------- -------- ------- ------- ------- ---------
pbs-node1 free -- -- pbs-node1 -- 8gb 4 0 0 --
[root@openpbs ~]#