줄리아에서 데이터프레임의 결측치 제거하는 법
개요 1
줄리아에서는 dropmissing()
함수를 통해 쉽게 결측치를 제거할 수 있다.
코드
julia> df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])
4×2 DataFrame
Row │ x y
│ String? Int64?
─────┼──────────────────
1 │ i 1
2 │ missing 2
3 │ k 3
4 │ j missing
위와 같이 결측치 missing
이 있는 데이터프레임이 주어져 있다고 하자.
julia> dropmissing(df, :x)
3×2 DataFrame
Row │ x y
│ String Int64?
─────┼─────────────────
1 │ i 1
2 │ k 3
3 │ j missing
julia> dropmissing(df, :y)
3×2 DataFrame
Row │ x y
│ String? Int64
─────┼────────────────
1 │ i 1
2 │ missing 2
3 │ k 3
결측치를 제거하고 싶은 열의 심볼을 인수로 넣으면 된다.
julia> dropmissing(df)
2×2 DataFrame
Row │ x y
│ String Int64
─────┼───────────────
1 │ i 1
2 │ k 3
데이터 프레임 전체에서 결측치를 모두 제거하고 싶으면 아무 열도 입력하지 않으면 된다.
전체 코드
using DataFrames
df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])
dropmissing(df, :x)
dropmissing(df, :y)
dropmissing(df)
환경
- OS: Windows
- julia: v1.7.3