logo

PBS에서 제출한 작업 정보 보는 법 📂프로그래밍

PBS에서 제출한 작업 정보 보는 법

개요1

이 글에서는 PBS에 제출한 작업의 상태와 상세 정보를 확인하는 방법을 정리한다.

코드

qstat

현재 제출된 작업 목록은 qstat 명령어를 이용하여 확인할 수 있다. 예를 들어 아래와 같은 출력이 나타난다.

(base) qstat
Job ID            Name             User              Time Use S Queue
----------------  ---------------- ----------------  -------- - -----
12345.server      test_job         user1             00:00:00 Q batch
12346.server      train_model      user1             01:12:31 R batch
12347.server      data_prep        user2             00:45:10 R batch
12348.server      sim_run_01       user2             12:34:56 R gpu_q
12349.server      jupyter_nb       user3             04:20:15 R interactive
12350.server      vasp_opt         user3             00:00:00 H batch
12351.server      vasp_opt_2       user3             00:00:00 Q batch

여기서 S 열의 의미 작업의 상태state를 의미하며, 그 종류는 다음과 같다.

  • Q: 대기 중(Queued)
  • R: 실행 중(Running)
  • E: 종료 중(Exiting)
  • H: 보류(Held)

qstat -u {USER}

특정 유저의 작업만 보고 싶을 땐 명령어 qstat -u $USER를 사용한다.

(base) qstat -u user2
Job ID            Name             User              Time Use S Queue
----------------  ---------------- ----------------  -------- - -----
12347.server      data_prep        user2             00:45:10 R batch
12348.server      sim_run_01       user2             12:34:56 R gpu_q

qstat -f {JOB_ID}

해당 작업의 상세 정보를 출력할 때는 -f 옵션을 사용한다.

(base) qstat -f 12346.server
Job Id: 12346.server
    Job_Name = train_model
    Job_Owner = user1@server
    job_state = R
    queue = batch
    server = server.domain
    Checkpoint = u
    ctime = Mon May 25 10:00:00 2026
    Error_Path = server.domain:/home/user1/train_model.e12346
    Output_Path = server.domain:/home/user1/train_model.o12346
    ... (생략) ...
    Resource_List.ncpus = 8
    Resource_List.ngpus = 2
    Resource_List.walltime = 48:00:00
    stime = Wed May 27 09:54:28 2026
    ... (생략) ...

원하는 내용만 보고 싶다면 grep 명령어를 조합하면 된다. 가령 gpu에 대한 정보만 보고싶다면 다음과 같이 명령어를 입력하면 된다.

(base) qstat -f 12346.server | grep ngpus
    exec_vnode = (e007:ncpus=8:ngpus=2)
    Resource_List.ngpus = 2
    Resource_List.select = 1:ncpus=8:ngpus=2
    comment = Job run at Wed May 27 at 09:54 on (e007:ncpus=8:ngpus=2)