logo

ジュリアで機械学習データセットを使用する方法 📂機械学習

ジュリアで機械学習データセットを使用する方法

説明

MLDatasets.jl1 2パッケージを使用すると、以下のデータセットを使用できる。リンクがあるデータセットは、それぞれの文書で使用方法を説明している。

ビジョン

  • CIFAR10
  • CIFAR100
  • EMNIST
  • FashionMNIST
  • MNIST
  • Omniglot
  • SVHN2
  • convert2image

メッシュ

  • FAUST

その他

  • BostonHousing
  • Iris
  • Mutagenesis
  • Titanic

テキスト

  • PTBLM
  • SMSSpamCollection
  • UD_English

グラフ

  • CiteSeer
  • Cora
  • Graph
  • HeteroGraph
  • KarateClub
  • MovieLens
  • OGBDataset
  • OrganicMaterialsDB
  • PolBlogs
  • PubMed
  • Reddit
  • TUDataset

このデータをワンホットエンコーディングする方法や、訓練する方法については、以下を参照してください。

CIFAR10

julia> Train_X2, Train_Y2 = CIFAR10.traindata()

julia> size(Train_X2)
(32, 32, 3, 50000)

julia>typeof(Train_X2)
Base.ReinterpretArray{N0f8, 4, UInt8, Array{UInt8, 4}, false}

julia> size(Train_Y2)
(50000,)

julia>typeof(Train_Y2)
Vector{Int64} (alias for Array{Int64, 1})

julia> for i in 1:7
        save("CIFAR10_$i.png", colorview(RGB, CIFAR10.convert2image(CIFAR10.traintensor(i))))
        end

最初の7枚の写真を選んでみると、次のようになる。

環境

  • OS: Windows11
  • Version: Julia v1.8.2, MLDatasets v0.7.6