줄리아에서 데이터프레임 중복된 행 삭제하는 법

줄리아에서 데이터프레임 중복된 행 삭제하는 법

How to Drop Duplicated Rows of Dataframe in julia

개요

unique()를 사용하면 된다. 정확하게는 중복된 행을 삭제한다기보단 하나만 남기는 것이다.

코드

using DataFrames

WJSN = DataFrame(
    member = ["다영","다원","루다","소정","수빈","연정","주연","지연","진숙","현정"],
    birth = [99,97,97,95,96,99,98,95,99,94],
    height = [161,167,157,166,159,165,172,163,162,165],
    unit = ["쪼꼬미","메보즈","쪼꼬미","더블랙","쪼꼬미","메보즈","더블랙","더블랙","쪼꼬미","더블랙"]
)
sort!(WJSN, :birth)

unique(WJSN, :unit)

위의 예제 코드를 실행해보고 그 결과를 확인해보자.

julia> WJSN
10×4 DataFrame
 Row │ member  birth  height  unit   
     │ String  Int64  Int64   String 
─────┼───────────────────────────────
   1 │ 현정       94     165  더블랙
   2 │ 소정       95     166  더블랙
   3 │ 지연       95     163  더블랙
   4 │ 수빈       96     159  쪼꼬미
   5 │ 다원       97     167  메보즈
   6 │ 루다       97     157  쪼꼬미
   7 │ 주연       98     172  더블랙
   8 │ 다영       99     161  쪼꼬미
   9 │ 연정       99     165  메보즈
  10 │ 진숙       99     162  쪼꼬미

WJSN 데이터프레임은 위와 같다.

한 열에서 중복된 행 제거 unique()

julia> unique(WJSN, :unit)
3×4 DataFrame
 Row │ member  birth  height  unit   
     │ String  Int64  Int64   String 
─────┼───────────────────────────────
   1 │ 현정       94     165  더블랙
   2 │ 수빈       96     159  쪼꼬미
   3 │ 다원       97     167  메보즈

:unit 심볼별로 하나의 행만이 남은것을 확인할 수 있다.

환경

  • OS: Windows
  • julia: v1.6.3
댓글