running jobs と pending jobs
各queueでのCPU稼働率(nodeのcpu usageを合計して平均に)
未分類情報としてログ解析からjobの開始時間、アサイン時間、終了時間の提示?

トータルジョブ数(running, queuingも含めて)
qstat -QfF json | jq -r '[.Queue[].total_jobs]|add'
 
 
queue状態のジョブ数
 
qstat -QfF json | jq -r '.Queue[].state_count' | awk '{print gensub(/(.*)Queued:([0-9]+) (.*)/,"\\2","1")}' | awk '{sum += $1}END{print sum}'
 
 
running状態のジョブ数
qstat -QfF json | jq -r '.Queue[].state_count' | awk '{print gensub(/(.*)Running:([0-9]+) (.*)/,"\\2","1")}' | awk '{sum += $1}END{print sum}'
 
--------------------------
queue毎なら
qstat -QfF json | jq -r '.Queue[].state_count'
を
qstat -QfF json | jq -r '.Queue.cpu.state_count'
とか
qstat -QfF json | jq -r '.Queue.gpu.state_count'
とか
qstat -QfF json | jq -r '.Queue.workq.state_count'
とかで得られる
 
あるいは「qstart」コマンドの段階で「qstat -QfF json <queue名>」とかにする

トップ   編集 添付 複製 名前変更     ヘルプ   最終更新のRSS
Last-modified: 2022-05-14 (土) 18:05:13 (391d)