Kaggle 소개
소개
캐글kaggle은 전 세계적으로 가장 유명한 오픈 데이터 허브로, 셀 수 없을만큼 다양한 데이터를 공개하고 작은 대회도 많이 열고 있다. 모든 데이터가 캐글에 있다고 할 순 없지만, 캐글에 없는 데이터 유형은 없다. 통계과목이나 머신러닝에서 자유주제 과제를 한다면 가장 먼저 체크해봐야할 사이트다.
요구사항
회원가입이 필요하지만 구글 연동이 되므로 사실상 제한이 없다. 영어가 진입장벽이 될 수도 있지만 데이터 사이언티스트만 잔뜩 모여있는 곳이다보니 그렇게까지 어려운 영어를 사용하지는 않는다.
회원이기만 하면 자체 API를 통해 빠르고 안정적으로 데이터를 다운로드하는 방법이 있으니 어느정도 이상의 빅데이터를 다룬다면 시도해보도록 하자: kaggle API로 데이터 받는 법