ほとんどメモ状態

PCをわんさかネットワークで繋げて

どちらを選ぶかは「ジョブ間の依存関係(プロセス間通信のありなし)」と「計算負荷の性質(リソースの要求次第)」で決まる.

あと最近では「サービス」自体をジョブ管理ノードで管理させる. 計算負荷は低いがずっと存在させたいジョブ。incusをqsub/sbatch/srunで作れないか..

構成としては親玉のログインノードと、あとそれにぶら下がる計算ノードに大別.

ログインノードにストレージを配置するか、別にストレージノードを設置する場合がある。簡易にはログインノードに用意する.

ログインノードに持たせる機能

認証機構、nis. ldap. samba-ad とかとか. クラスター外へのサービスとしてsmb共有、webサービス(要ログイン)ならldap, samba-adかな.
ジョブ管理システム slurmやopenpbs. queueの定義でリソース確保制限、時間制限を定義。確保したジョブにsshで入れるとか.
時計サーバ 時間合わせは必須。計算ノードはログインノードの時計サーバを参照させる
ストレージ 単純にnfsでもいいが、場合によってはACLが必要となる場合もあり、NFSv4_ACLで処理できるようにmountコマンドの調整が必要. glusterFS, cephらはリモートでさえもPOSIX ACLが使える.

制限させる
計算ノードへの直接ログインを禁止させ、ジョブ管理経由でないと入れないようにする.
ログインノードで計算を始めさせないように、limitとかでプロセス数らを抑える
topコマンドは自分のみの状況しか写さないとかとか

最新の60件
2025-12-09 2025-12-08 2025-12-07 2025-12-05 2025-11-30 2025-11-27 2025-11-24 2025-11-23 2025-11-19 2025-11-18 2025-11-16 2025-11-05 2025-11-03 2025-11-02 2025-10-31 2025-10-30 2025-10-29 2025-10-28 2025-10-26 2025-10-25 2025-10-24 2025-10-22 2025-10-21 2025-10-17 2025-10-13
  • Cluster
2025-10-11 2025-10-06 2025-10-05 2025-09-30 2025-09-29 2025-09-28 2025-09-25 2025-09-24 2025-09-23 2025-09-21 2025-09-20 2025-09-14 2025-09-13

edit


トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2025-10-13 (月) 16:18:35