ほとんどメモ状態

PCをわんさかネットワークで繋げて

どちらを選ぶかは「ジョブ間の依存関係(プロセス間通信のありなし)」と「計算負荷の性質(リソースの要求次第)」で決まる.

あと最近では「サービス」自体をジョブ管理ノードで管理させる. 計算負荷は低いがずっと存在させたいジョブ。incusをqsub/sbatch/srunで作れないか..

構成としては親玉のログインノードと、あとそれにぶら下がる計算ノードに大別.

ログインノードにストレージを配置するか、別にストレージノードを設置する場合がある。簡易にはログインノードに用意する.

ログインノードに持たせる機能

認証機構、nis. ldap. samba-ad とかとか. クラスター外へのサービスとしてsmb共有、webサービス(要ログイン)ならldap, samba-adかな.
ジョブ管理システム slurmやopenpbs. queueの定義でリソース確保制限、時間制限を定義。確保したジョブにsshで入れるとか.
時計サーバ 時間合わせは必須。計算ノードはログインノードの時計サーバを参照させる
ストレージ 単純にnfsでもいいが、場合によってはACLが必要となる場合もあり、NFSv4_ACLで処理できるようにmountコマンドの調整が必要. glusterFS, cephらはリモートでさえもPOSIX ACLが使える.

制限させる
計算ノードへの直接ログインを禁止させ、ジョブ管理経由でないと入れないようにする.
ログインノードで計算を始めさせないように、limitとかでプロセス数らを抑える
topコマンドは自分のみの状況しか写さないとかとか

最新の60件
2026-06-16 2026-06-14 2026-06-13 2026-06-09 2026-06-08 2026-06-06 2026-06-05 2026-06-04 2026-06-03 2026-05-31 2026-05-28 2026-05-26 2026-05-23 2026-05-22 2026-05-21 2026-05-20 2026-05-19 2026-05-18 2026-05-12 2026-05-11 2026-05-08 2026-05-06 2026-05-05 2026-05-03 2026-04-30 2026-04-29 2026-04-28 2026-04-27 2026-04-25 2026-04-24 2026-04-22 2026-04-21 2026-04-12 2026-04-08 2026-04-06 2026-04-05 2026-04-02 2026-03-26 2026-03-23 2026-03-21 2026-03-19

edit


トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2025-10-13 (月) 16:18:35