ジュリアでデータフレームの欠損値を削除する方法
概要 1
Juliaでは、dropmissing()
関数を使って簡単に欠損値を削除できる。
コード
julia> df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])
4×2 DataFrame
Row │ x y
│ String? Int64?
─────┼──────────────────
1 │ i 1
2 │ missing 2
3 │ k 3
4 │ j missing
上記のように欠損値missing
があるデータフレームが与えられているとしよう。
julia> dropmissing(df, :x)
3×2 DataFrame
Row │ x y
│ String Int64?
─────┼─────────────────
1 │ i 1
2 │ k 3
3 │ j missing
julia> dropmissing(df, :y)
3×2 DataFrame
Row │ x y
│ String? Int64
─────┼────────────────
1 │ i 1
2 │ missing 2
3 │ k 3
欠損値を削除したい列のシンボルを引数に入れればいい。
julia> dropmissing(df)
2×2 DataFrame
Row │ x y
│ String Int64
─────┼───────────────
1 │ i 1
2 │ k 3
データフレーム全体から欠損値をすべて削除したい場合は、列を何も入力しなければいい。
全コード
using DataFrames
df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])
dropmissing(df, :x)
dropmissing(df, :y)
dropmissing(df)
環境
- OS: Windows
- julia: v1.7.3