logo

PBSに提出したジョブ情報の確認方法 📂プログラミング

PBSに提出したジョブ情報の確認方法

概要1

この文書では PBS に提出したジョブの状態と詳細情報の確認方法をまとめる。

코드

qstat

現在提出されているジョブの一覧は qstat コマンドで確認できる。例えば以下のような出力が表示される。

(base) qstat
Job ID            Name             User              Time Use S Queue
----------------  ---------------- ----------------  -------- - -----
12345.server      test_job         user1             00:00:00 Q batch
12346.server      train_model      user1             01:12:31 R batch
12347.server      data_prep        user2             00:45:10 R batch
12348.server      sim_run_01       user2             12:34:56 R gpu_q
12349.server      jupyter_nb       user3             04:20:15 R interactive
12350.server      vasp_opt         user3             00:00:00 H batch
12351.server      vasp_opt_2       user3             00:00:00 Q batch

ここで S 列はジョブの状態stateを示し、その種類は次の通りだ。

  • Q: 待機中(Queued)
  • R: 実行中(Running)
  • E: 終了中(Exiting)
  • H: 保留(Held)

qstat -u {USER}

特定ユーザのジョブのみを見たいときはコマンド qstat -u $USER を使う。

(base) qstat -u user2
Job ID            Name             User              Time Use S Queue
----------------  ---------------- ----------------  -------- - -----
12347.server      data_prep        user2             00:45:10 R batch
12348.server      sim_run_01       user2             12:34:56 R gpu_q

qstat -f {JOB_ID}

該当ジョブの詳細情報を表示するには -f オプションを使う。

(base) qstat -f 12346.server
Job Id: 12346.server
    Job_Name = train_model
    Job_Owner = user1@server
    job_state = R
    queue = batch
    server = server.domain
    Checkpoint = u
    ctime = Mon May 25 10:00:00 2026
    Error_Path = server.domain:/home/user1/train_model.e12346
    Output_Path = server.domain:/home/user1/train_model.o12346
    ... (생략) ...
    Resource_List.ncpus = 8
    Resource_List.ngpus = 2
    Resource_List.walltime = 48:00:00
    stime = Wed May 27 09:54:28 2026
    ... (생략) ...

必要な項目だけ見たいなら grep コマンドを組み合わせればいい。例えば GPU に関する情報だけ見たいなら次のようにコマンドを入力する。

(base) qstat -f 12346.server | grep ngpus
    exec_vnode = (e007:ncpus=8:ngpus=2)
    Resource_List.ngpus = 2
    Resource_List.select = 1:ncpus=8:ngpus=2
    comment = Job run at Wed May 27 at 09:54 on (e007:ncpus=8:ngpus=2)