running jobs と pending jobs
各queueでのCPU稼働率(nodeのcpu usageを合計して平均に)
未分類情報としてログ解析からjobの開始時間、アサイン時間、終了時間の提示?
トータルジョブ数(running, queuingも含めて)
qstat -QfF json | jq -r '[.Queue[].total_jobs]|add'
queue状態のジョブ数
qstat -QfF json | jq -r '.Queue[].state_count' | awk '{print gensub(/(.*)Queued:([0-9]+) (.*)/,"\\2","1")}' | awk '{sum += $1}END{print sum}'
running状態のジョブ数
qstat -QfF json | jq -r '.Queue[].state_count' | awk '{print gensub(/(.*)Running:([0-9]+) (.*)/,"\\2","1")}' | awk '{sum += $1}END{print sum}'
--------------------------
queue毎なら
qstat -QfF json | jq -r '.Queue[].state_count'
を
qstat -QfF json | jq -r '.Queue.cpu.state_count'
とか
qstat -QfF json | jq -r '.Queue.gpu.state_count'
とか
qstat -QfF json | jq -r '.Queue.workq.state_count'
とかで得られる
あるいは「qstart」コマンドの段階で「qstat -QfF json <queue名>」とかにする