R 에서 내장 데이터셋 불러오는 법
개요
R 은 대표적인 통계 프로그래밍 언어로써 유용한 메소드 뿐만 아니라 예제로 쓰기 좋은 데이터셋도 제공한다. 만약 이런 데이터셋이 없다면 강의를 할 때마다 새로운 데이터를 다운로드하고 불러들어들이는 짓을 해야할 것이다.
가이드
데이터셋을 불러오는 방법은 아주 간단하다. 불러올 데이터셋의 이름을 우리가 사용할 변수에 할당하기만 하면 된다. 통계학을 공부하다보면 예제로써 닳고 닳도록 볼 아이리스(붓꽃) 데이터를 한번 살펴보자.
각 열은은 순서대로 꽃받침의 길이, 너비, 꽃잎의 길이, 너비, 종을 의미한다. 열마다 이름이 적혀있긴 하지만 이것만으로 데이터를 파악하기 힘들다면 ?iris를 입력해서 도움말을 읽어보자.
물론 데이터셋은 아이리스만 있는 건 아니다. 콘솔창에 library(help=datasets)를 입력하면 아래와 같이 불러올 수 있는 데이터셋의 목록과 간략한 설명을 볼 수 있다.
대략적인 분류
회귀분석
- attitude
- LifeCycleSavings
- Loblolly
- attenu
- faithful
- iris
- quakes
- wiss
- trees
시계열
- AirPassengers
- BJsales
- EuStockMarkets
- WorldPhones
- JohnsonJohnson
- LakeHuron
- Nile
- UKDriverDeaths
- UKgas
- USAccDeaths
- USPersonalExpenditure
- WWWusage
- airmiles
- airquality
- austres
- co2
- discoveries
- freeny
- lh
- longley
- lynx
- nhtemp
- nottem
- presidents
- sunspot.month
- sunspot.year
- sunspots
- treering
- uspop
다변량
- Harman23.cor
- Harman74.cor
- USJudgeRatings
범주
- HairEyeColor
- Titanic
- UCBAdmissions
- ability.cov
실험
- CO2
- ChickWeight
- DNase
- Indometh
- InsectSprays
- Orange
- OrchardSprays
- PlantGrowth
- Puromycin
- Theoph
- cars
- chickwts
- morley
- mtcars
- npk
- pressure
- warpbreaks
소표본
- BOD
- Formaldehyde
- VADeaths
- anscombe
- euro
- sleep
- stackloss
- women
기타
- crimtab
- esoph
- eurodist
- islands
- occupationalStatus
- precip
- randu
- rivers
- rock
- volcano