PBSに提出したジョブ情報の確認方法
概要1
この文書では PBS に提出したジョブの状態と詳細情報の確認方法をまとめる。
코드
qstat
現在提出されているジョブの一覧は qstat コマンドで確認できる。例えば以下のような出力が表示される。
(base) qstat
Job ID Name User Time Use S Queue
---------------- ---------------- ---------------- -------- - -----
12345.server test_job user1 00:00:00 Q batch
12346.server train_model user1 01:12:31 R batch
12347.server data_prep user2 00:45:10 R batch
12348.server sim_run_01 user2 12:34:56 R gpu_q
12349.server jupyter_nb user3 04:20:15 R interactive
12350.server vasp_opt user3 00:00:00 H batch
12351.server vasp_opt_2 user3 00:00:00 Q batch
ここで S 列はジョブの状態stateを示し、その種類は次の通りだ。
Q: 待機中(Queued)R: 実行中(Running)E: 終了中(Exiting)H: 保留(Held)
qstat -u {USER}
特定ユーザのジョブのみを見たいときはコマンド qstat -u $USER を使う。
(base) qstat -u user2
Job ID Name User Time Use S Queue
---------------- ---------------- ---------------- -------- - -----
12347.server data_prep user2 00:45:10 R batch
12348.server sim_run_01 user2 12:34:56 R gpu_q
qstat -f {JOB_ID}
該当ジョブの詳細情報を表示するには -f オプションを使う。
(base) qstat -f 12346.server
Job Id: 12346.server
Job_Name = train_model
Job_Owner = user1@server
job_state = R
queue = batch
server = server.domain
Checkpoint = u
ctime = Mon May 25 10:00:00 2026
Error_Path = server.domain:/home/user1/train_model.e12346
Output_Path = server.domain:/home/user1/train_model.o12346
... (생략) ...
Resource_List.ncpus = 8
Resource_List.ngpus = 2
Resource_List.walltime = 48:00:00
stime = Wed May 27 09:54:28 2026
... (생략) ...
必要な項目だけ見たいなら grep コマンドを組み合わせればいい。例えば GPU に関する情報だけ見たいなら次のようにコマンドを入力する。
(base) qstat -f 12346.server | grep ngpus
exec_vnode = (e007:ncpus=8:ngpus=2)
Resource_List.ngpus = 2
Resource_List.select = 1:ncpus=8:ngpus=2
comment = Job run at Wed May 27 at 09:54 on (e007:ncpus=8:ngpus=2)
