OpenPBSで作った計算ノード向けパッケージ「openpbs-execution-20.0.1-0.x86_64.rpm」をインストールします

yum localinstall openpbs-execution-20.0.1-0.x86_64.rpm

python3も同時にインストールされます

途中で下記のようなメッセージが表示されます。

*** PBS Installation Summary
***
*** Postinstall script called as follows:
*** /opt/pbs/libexec/pbs_postinstall execution 20.0.1 /opt/pbs /var/lib/pbs
***
*** No configuration file found.
*** Creating new configuration file: /etc/pbs.conf
*** =======
*** NOTICE:
*** =======
*** The value of PBS_SERVER in /etc/pbs.conf is invalid.
*** PBS_SERVER should be set to the PBS server hostname.
*** Update this value before starting PBS.
***
*** Replacing /etc/pbs.conf with /etc/pbs.conf.20.0.1
*** /etc/pbs.conf has been created.
***
*** Registering PBS as a service.
Created symlink from /etc/systemd/system/multi-user.target.wants/pbs.service to /usr/lib/systemd/system/pbs.service.
***
*** PBS_HOME is /var/lib/pbs
*** Creating new file /var/lib/pbs/pbs_environment
*** WARNING: TZ not set in /var/lib/pbs/pbs_environment
***
*** The PBS MOM has been installed in /opt/pbs/sbin.
***
*** =======
*** NOTICE:
*** =======
*** The clienthost entry for the server must be manually
*** modified in /var/lib/pbs/mom_priv/config
*** Update this value before starting PBS.
***
*** The PBS commands have been installed in /opt/pbs/bin.
***
*** End of /opt/pbs/libexec/pbs_postinstall
  Verifying  : openpbs-execution-20.0.1-0.x86_64                                                                                                            1/1
 
Installed:
  openpbs-execution.x86_64 0:20.0.1-0
 
Complete!

このメッセージに従って計算ノードに調整を加えます

  • /etc/pbs.conf
    PBS_EXEC=/opt/pbs
    PBS_SERVER=openpbs        <-- ジョブ管理ノードを記載
     :
  • /var/lib/pbs/pbs_environment
    PATH=/bin:/usr/bin
    TZ="Asia/Tokyo"           <-- timezoneを指定
  • /var/lib/pbs/mom_priv/config
    $clienthost openpbs       <-- ジョブ管理ノードを記載

起動

systemctl start pbs

リモートシェル

複数の計算ノードを使ってのmpi計算を行うには、その計算ノードらへのリモートアクセスとそこでのプログラムの実行が必要となる。

リモートアクセスには ssh もしくは rsh でもいいのだが、パスワードなしでアクセスできる仕様にする必要がある。

sshでのパスワードなしアクセスは単に ssh-keygen を使ってパスフレーズなしの自分向けキーを作れば足りる。

ssh-keygen

他rshのなら

yum install rsh-server
systemctl enable rexec.socket rsh.socket
systemctl start rexec.socket rsh.socket
echo "+" > /etc/hosts.equiv

とする

ここでは rsh を使うことを前提としてます

計算ノードの登録

計算ノードをジョブ管理ノードに登録します。
これはジョブ管理ノードで行います。まず qmgr を立ち上げて、サブコマンド「create node <計算ノード>」と実行します

[root@openpbs ~]# qmgr
Max open servers: 49
Qmgr:
Qmgr: create node s

正しく登録されたかは qmgr コマンドではサブコマンド「list node <計算ノード>」、もしくはpbsnodesを実行します。

[root@openpbs ~]# pbsnodes -aS
vnode           state           OS       hardware host            queue        mem     ncpus   nmics   ngpus  comment
--------------- --------------- -------- -------- --------------- ---------- -------- ------- ------- ------- ---------
s               free            --       --       s               --             31gb       8       0       0 --
[root@openpbs ~]#

トップ   編集 添付 複製 名前変更     ヘルプ   最終更新のRSS
Last-modified: 2020-09-15 (火) 05:21:18 (3d)