logo

ジュリアでデータフレームの欠損値を削除する方法 📂ジュリア

ジュリアでデータフレームの欠損値を削除する方法

概要 1

Juliaでは、dropmissing()関数を使って簡単に欠損値を削除できる。

コード

julia> df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])
4×2 DataFrame
 Row │ x        y       
     │ String?  Int64?  
─────┼──────────────────
   1 │ i              1
   2 │ missing        2
   3 │ k              3
   4 │ j        missing 

上記のように欠損値missingがあるデータフレームが与えられているとしよう。

julia> dropmissing(df, :x)
3×2 DataFrame
 Row │ x       y       
     │ String  Int64?  
─────┼─────────────────
   1 │ i             1
   2 │ k             3
   3 │ j       missing 

julia> dropmissing(df, :y)
3×2 DataFrame
 Row │ x        y     
     │ String?  Int64 
─────┼────────────────
   1 │ i            1
   2 │ missing      2
   3 │ k            3

欠損値を削除したい列のシンボルを引数に入れればいい。

julia> dropmissing(df)
2×2 DataFrame
 Row │ x       y     
     │ String  Int64
─────┼───────────────
   1 │ i           1
   2 │ k           3

データフレーム全体から欠損値をすべて削除したい場合は、列を何も入力しなければいい。

全コード

using DataFrames

df = DataFrame(x = ["i", missing, "k", "j"], y = [1, 2, 3, missing])

dropmissing(df, :x)
dropmissing(df, :y)
dropmissing(df)

環境

  • OS: Windows
  • julia: v1.7.3