Kaggleの紹介
紹介
Kagglekaggleは、世界で最も有名なオープンデータハブで、数え切れないほど多様なデータを公開しており、多くの競技会も開催している。全てのデータがKaggleにあるとは言えないが、Kaggleにないデータタイプはない。統計学や機械学習の自由課題をするなら、最初にチェックすべきサイトだ。
必要条件
会員登録は必要だが、Googleとの連携があるため実質制限はない。英語が障壁になり得るが、データサイエンティストがたくさんいる場所なので、使われている英語が難しいわけではない。
会員であれば、Kaggle自身のAPIを通じて、データを迅速かつ安定的にダウンロードする方法があるので、ある程度以上のビッグデータを扱うなら、試してみる価値がある: kaggle APIでデータを受け取る方法
リンク
- データセット: https://www.kaggle.com/datasets