logo

줄리아에서 데이터프레임의 결측치 제거하는 법 📂줄리아

줄리아에서 데이터프레임의 결측치 제거하는 법

개요 1

줄리아에서는 dropmissing() 함수를 통해 쉽게 결측치를 제거할 수 있다.

코드

julia> df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])
4×2 DataFrame
 Row │ x        y       
     │ String?  Int64?  
─────┼──────────────────
   1 │ i              1
   2 │ missing        2
   3 │ k              3
   4 │ j        missing 

위와 같이 결측치 missing이 있는 데이터프레임이 주어져 있다고 하자.

julia> dropmissing(df, :x)
3×2 DataFrame
 Row │ x       y       
     │ String  Int64?  
─────┼─────────────────
   1 │ i             1
   2 │ k             3
   3 │ j       missing 

julia> dropmissing(df, :y)
3×2 DataFrame
 Row │ x        y     
     │ String?  Int64 
─────┼────────────────
   1 │ i            1
   2 │ missing      2
   3 │ k            3

결측치를 제거하고 싶은 열의 심볼을 인수로 넣으면 된다.

julia> dropmissing(df)
2×2 DataFrame
 Row │ x       y     
     │ String  Int64
─────┼───────────────
   1 │ i           1
   2 │ k           3

데이터 프레임 전체에서 결측치를 모두 제거하고 싶으면 아무 열도 입력하지 않으면 된다.

전체 코드

using DataFrames

df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])

dropmissing(df, :x)
dropmissing(df, :y)
dropmissing(df)

환경

  • OS: Windows
  • julia: v1.7.3