R 에서 내장 데이터셋 불러오는 법
개요
R 은 대표적인 통계 프로그래밍 언어로써 유용한 메소드 뿐만 아니라 예제로 쓰기 좋은 데이터셋도 제공한다. 만약 이런 데이터셋이 없다면 강의를 할 때마다 새로운 데이터를 다운로드하고 불러들어들이는 짓을 해야할 것이다.
가이드
데이터셋을 불러오는 방법은 아주 간단하다. 불러올 데이터셋의 이름을 우리가 사용할 변수에 할당하기만 하면 된다. 통계학을 공부하다보면 예제로써 닳고 닳도록 볼 아이리스(붓꽃) 데이터를 한번 살펴보자.
각 열은은 순서대로 꽃받침의 길이, 너비, 꽃잎의 길이, 너비, 종을 의미한다. 열마다 이름이 적혀있긴 하지만 이것만으로 데이터를 파악하기 힘들다면 ?iris를 입력해서 도움말을 읽어보자.
물론 데이터셋은 아이리스만 있는 건 아니다. 콘솔창에 library(help=datasets)를 입력하면 아래와 같이 불러올 수 있는 데이터셋의 목록과 간략한 설명을 볼 수 있다.

대략적인 분류
회귀분석
- attitude
 - LifeCycleSavings
 - Loblolly
 - attenu
 - faithful
 - iris
 - quakes
 - wiss
 - trees
 
시계열
- AirPassengers
 - BJsales
 - EuStockMarkets
 - WorldPhones
 - JohnsonJohnson
 - LakeHuron
 - Nile
 - UKDriverDeaths
 - UKgas
 - USAccDeaths
 - USPersonalExpenditure
 - WWWusage
 - airmiles
 - airquality
 - austres
 - co2
 - discoveries
 - freeny
 - lh
 - longley
 - lynx
 - nhtemp
 - nottem
 - presidents
 - sunspot.month
 - sunspot.year
 - sunspots
 - treering
 - uspop
 
다변량
- Harman23.cor
 - Harman74.cor
 - USJudgeRatings
 
범주
- HairEyeColor
 - Titanic
 - UCBAdmissions
 - ability.cov
 
실험
- CO2
 - ChickWeight
 - DNase
 - Indometh
 - InsectSprays
 - Orange
 - OrchardSprays
 - PlantGrowth
 - Puromycin
 - Theoph
 - cars
 - chickwts
 - morley
 - mtcars
 - npk
 - pressure
 - warpbreaks
 
소표본
- BOD
 - Formaldehyde
 - VADeaths
 - anscombe
 - euro
 - sleep
 - stackloss
 - women
 
기타
- crimtab
 - esoph
 - eurodist
 - islands
 - occupationalStatus
 - precip
 - randu
 - rivers
 - rock
 - volcano
 

저희들의 저서 「줄리아 프로그래밍」이 2024 세종도서 학술부문에 선정되었습니다!

