줄리아에서 데이터프레임 중복된 행 삭제하는 법
개요
unique()
를 사용하면 된다. 정확하게는 중복된 행을 삭제한다기보단 하나만 남기는 것이다.
코드
using DataFrames
WJSN = DataFrame(
member = ["다영","다원","루다","소정","수빈","연정","주연","지연","진숙","현정"],
birth = [99,97,97,95,96,99,98,95,99,94],
height = [161,167,157,166,159,165,172,163,162,165],
unit = ["쪼꼬미","메보즈","쪼꼬미","더블랙","쪼꼬미","메보즈","더블랙","더블랙","쪼꼬미","더블랙"]
)
sort!(WJSN, :birth)
unique(WJSN, :unit)
위의 예제 코드를 실행해보고 그 결과를 확인해보자.
julia> WJSN
10×4 DataFrame
Row │ member birth height unit
│ String Int64 Int64 String
─────┼───────────────────────────────
1 │ 현정 94 165 더블랙
2 │ 소정 95 166 더블랙
3 │ 지연 95 163 더블랙
4 │ 수빈 96 159 쪼꼬미
5 │ 다원 97 167 메보즈
6 │ 루다 97 157 쪼꼬미
7 │ 주연 98 172 더블랙
8 │ 다영 99 161 쪼꼬미
9 │ 연정 99 165 메보즈
10 │ 진숙 99 162 쪼꼬미
WJSN
데이터프레임은 위와 같다.
한 열에서 중복된 행 제거 unique()
julia> unique(WJSN, :unit)
3×4 DataFrame
Row │ member birth height unit
│ String Int64 Int64 String
─────┼───────────────────────────────
1 │ 현정 94 165 더블랙
2 │ 수빈 96 159 쪼꼬미
3 │ 다원 97 167 메보즈
:unit
심볼별로 하나의 행만이 남은것을 확인할 수 있다.
환경
- OS: Windows
- julia: v1.6.3