logo

R 에서 내장 데이터셋 불러오는 법 📂R

R 에서 내장 데이터셋 불러오는 법

개요

R 은 대표적인 통계 프로그래밍 언어로써 유용한 메소드 뿐만 아니라 예제로 쓰기 좋은 데이터셋도 제공한다. 만약 이런 데이터셋이 없다면 강의를 할 때마다 새로운 데이터를 다운로드하고 불러들어들이는 짓을 해야할 것이다.

가이드

데이터셋을 불러오는 방법은 아주 간단하다. 불러올 데이터셋의 이름을 우리가 사용할 변수에 할당하기만 하면 된다. 통계학을 공부하다보면 예제로써 닳고 닳도록 볼 아이리스(붓꽃) 데이터를 한번 살펴보자.

20171120\_124856.png 각 열은은 순서대로 꽃받침의 길이, 너비, 꽃잎의 길이, 너비, 종을 의미한다. 열마다 이름이 적혀있긴 하지만 이것만으로 데이터를 파악하기 힘들다면 ?iris를 입력해서 도움말을 읽어보자.

20171120\_125434.png 물론 데이터셋은 아이리스만 있는 건 아니다. 콘솔창에 library(help=datasets)를 입력하면 아래와 같이 불러올 수 있는 데이터셋의 목록과 간략한 설명을 볼 수 있다.

20171120\_124643.png

대략적인 분류

회귀분석

  • attitude
  • LifeCycleSavings
  • Loblolly
  • attenu
  • faithful
  • iris
  • quakes
  • wiss
  • trees

시계열

  • AirPassengers
  • BJsales
  • EuStockMarkets
  • WorldPhones
  • JohnsonJohnson
  • LakeHuron
  • Nile
  • UKDriverDeaths
  • UKgas
  • USAccDeaths
  • USPersonalExpenditure
  • WWWusage
  • airmiles
  • airquality
  • austres
  • co2
  • discoveries
  • freeny
  • lh
  • longley
  • lynx
  • nhtemp
  • nottem
  • presidents
  • sunspot.month
  • sunspot.year
  • sunspots
  • treering
  • uspop

다변량

  • Harman23.cor
  • Harman74.cor
  • USJudgeRatings

범주

  • HairEyeColor
  • Titanic
  • UCBAdmissions
  • ability.cov

실험

  • CO2
  • ChickWeight
  • DNase
  • Indometh
  • InsectSprays
  • Orange
  • OrchardSprays
  • PlantGrowth
  • Puromycin
  • Theoph
  • cars
  • chickwts
  • morley
  • mtcars
  • npk
  • pressure
  • warpbreaks

소표본

  • BOD
  • Formaldehyde
  • VADeaths
  • anscombe
  • euro
  • sleep
  • stackloss
  • women

기타

  • crimtab
  • esoph
  • eurodist
  • islands
  • occupationalStatus
  • precip
  • randu
  • rivers
  • rock
  • volcano