ジュリアで機械学習データセットを使用する方法
説明
MLDatasets.jl
1 2パッケージを使用すると、以下のデータセットを使用できる。リンクがあるデータセットは、それぞれの文書で使用方法を説明している。
ビジョン
- CIFAR10
- CIFAR100
- EMNIST
- FashionMNIST
- MNIST
- Omniglot
- SVHN2
- convert2image
メッシュ
- FAUST
その他
- BostonHousing
- Iris
- Mutagenesis
- Titanic
テキスト
- PTBLM
- SMSSpamCollection
- UD_English
グラフ
- CiteSeer
- Cora
- Graph
- HeteroGraph
- KarateClub
- MovieLens
- OGBDataset
- OrganicMaterialsDB
- PolBlogs
- PubMed
- TUDataset
このデータをワンホットエンコーディングする方法や、訓練する方法については、以下を参照してください。
例
CIFAR10
julia> Train_X2, Train_Y2 = CIFAR10.traindata()
julia> size(Train_X2)
(32, 32, 3, 50000)
julia>typeof(Train_X2)
Base.ReinterpretArray{N0f8, 4, UInt8, Array{UInt8, 4}, false}
julia> size(Train_Y2)
(50000,)
julia>typeof(Train_Y2)
Vector{Int64} (alias for Array{Int64, 1})
julia> for i in 1:7
save("CIFAR10_$i.png", colorview(RGB, CIFAR10.convert2image(CIFAR10.traintensor(i))))
end
最初の7枚の写真を選んでみると、次のようになる。
環境
- OS: Windows11
- Version: Julia v1.8.2, MLDatasets v0.7.6