샤피로-윌크 테스트
가설검정
양적 데이터 $\left\{ x_{i} \right\}_{i = 1}^{n}$ 가 주어져 있다고 하자.
- $H_{0}$: 데이터 $\left\{ x_{i} \right\}_{i = 1}^{n}$ 는 정규분포를 따른다.
- $H_{1}$: 데이터 $\left\{ x_{i} \right\}_{i = 1}^{n}$ 는 정규분포를 따르지 않는다.
설명
샤피로-윌크 테스트는 데이터의 정규성을 검정하기 위해 사용하는 가설검정으로써, 보통은 정규성이 있음을 보이기 위해서 사용한다. 귀무가설이 채택되는 것이 ‘분석자의 의도’와 일치하는 드문 경우기 때문에 가설을 정확하게 알고 있어야한다.
코드
실습
R에서는 shapiro.test()
함수를 통해 쉽게 샤피로-윌크 테스트를 할 수 있다. 다음의 두가지 랜덤샘플을 만들어내서 실제로 샤피로-윌크 테스트를 해보자.
N
은 정규분포에서 나온 데이터고, geo
는 기하분포에서 나온 데이터다.
테스트 결과는 정확하게 예상대로 나타난다.
전체코드
아래는 예제 R 코드다.
set.seed(150421)
N<-rnorm(100)
win.graph(4,4); hist(N)
shapiro.test(N)
geo<-rgeom(100,0.5)
win.graph(4,4); hist(geo)
shapiro.test(geo)