OpenPBSで作った計算ノード向けパッケージ「openpbs-execution-20.0.1-0.x86_64.rpm」をインストールします

yum localinstall openpbs-execution-20.0.1-0.x86_64.rpm

python3も同時にインストールされます

途中で下記のようなメッセージが表示されます。

*** PBS Installation Summary
***
*** Postinstall script called as follows:
*** /opt/pbs/libexec/pbs_postinstall execution 20.0.1 /opt/pbs /var/lib/pbs
***
*** No configuration file found.
*** Creating new configuration file: /etc/pbs.conf
*** =======
*** NOTICE:
*** =======
*** The value of PBS_SERVER in /etc/pbs.conf is invalid.
*** PBS_SERVER should be set to the PBS server hostname.
*** Update this value before starting PBS.
***
*** Replacing /etc/pbs.conf with /etc/pbs.conf.20.0.1
*** /etc/pbs.conf has been created.
***
*** Registering PBS as a service.
Created symlink from /etc/systemd/system/multi-user.target.wants/pbs.service to /usr/lib/systemd/system/pbs.service.
***
*** PBS_HOME is /var/lib/pbs
*** Creating new file /var/lib/pbs/pbs_environment
*** WARNING: TZ not set in /var/lib/pbs/pbs_environment
***
*** The PBS MOM has been installed in /opt/pbs/sbin.
***
*** =======
*** NOTICE:
*** =======
*** The clienthost entry for the server must be manually
*** modified in /var/lib/pbs/mom_priv/config
*** Update this value before starting PBS.
***
*** The PBS commands have been installed in /opt/pbs/bin.
***
*** End of /opt/pbs/libexec/pbs_postinstall

このメッセージに従って計算ノードに調整を加えます

  • /etc/pbs.conf
    PBS_EXEC=/opt/pbs
    PBS_SERVER=openpbs        <-- ジョブ管理ノードを記載
    PBS_START_SERVER=0
    PBS_START_SCHED=0
    PBS_START_COMM=0
    PBS_START_MOM=1
    PBS_HOME=/var/lib/pbs
    PBS_CORE_LIMIT=unlimited
    PBS_SCP=/bin/scp
  • /var/lib/pbs/pbs_environment
    PATH=/bin:/usr/bin
    TZ=Asia/Tokyo             <-- timezoneを指定
  • /var/lib/pbs/mom_priv/config
    $clienthost openpbs       <-- ジョブ管理ノードを記載
    $tmpdir /scratch          <-- scratchディレクトリの指定
    $usecp *:/home /home      <-- /home, /dataがnfsで繋がっていたらcpを使ってコピーします
    $usecp *:/data /data
    *「$tmpdir」のフォルダはモード 1777(chmod 1777 /scratch)にしないとエラーになる

起動

systemctl start pbs

firewall

SELinuxは有効のままで大丈夫.
firewallも有効のままでも構わない.

[root@n1 ~]# getenforce
Enforcing
[root@n1 ~]# firewall-cmd --list-all
public (active)
  target: default
  icmp-block-inversion: no
  interfaces: eth0
  sources:
  services: dhcpv6-client ssh
  ports:
  protocols:
  masquerade: no
  forward-ports:
  source-ports:
  icmp-blocks:
  rich rules:
 
[root@n1 ~]#

計算ノードの登録

計算ノードをジョブ管理ノードに登録します。
これはジョブ管理ノードで行います。まず qmgr を立ち上げて、サブコマンド「create node <計算ノード>」と実行します

[root@pbs ~]# qmgr
Max open servers: 49
Qmgr:
Qmgr: create node n1
Qmgr: create node s

削除は「delete node n1」「delete node s」とします

正しく登録されたかは qmgr コマンドではサブコマンド「list node <計算ノード>」、もしくはpbsnodesを実行します。

[root@openpbs ~]# pbsnodes -aS
vnode           state           OS       hardware host            queue        mem     ncpus   nmics   ngpus  comment
--------------- --------------- -------- -------- --------------- ---------- -------- ------- ------- ------- ---------
n1              free            --       --       n1              --              4gb       1       0       0 --
n2              free            --       --       n2              --              8gb       2       0       0 --
n3              free            --       --       n3              --              8gb       3       0       0 --
s               free            --       --       s               --             31gb       8       0       0 --
[root@openpbs ~]#

トップ   編集 添付 複製 名前変更     ヘルプ   最終更新のRSS
Last-modified: 2021-05-16 (日) 23:38:49 (74d)