σ1,σ2 를 알 때: 모표준편차σ1,σ2 를 그대로 써서 다음과 같다.
Z=n1σ12+n2σ22(X1−X2)−D0
σ1,σ2 를 모를 때: 표본표준편차s1,s2 를 써서 다음과 같다.
Z=n1s12+n2s22(X1−X2)−D0
설명
아마도 D0 로 가장 많이 쓰이는 것은 0 일텐데, 대개의 경우 ‘정확한 격차가 어느정도인지’보다는 ‘두 분포의 모평균이 같은지’와 같은 핵심적인 부분이 궁금할 것이기 때문이다. 검정통계량의 꼴에서 가장 복잡해보이는 것은 분모에 있는 n1σ12+n2σ22 인데, 수리통계학을 배우고나면 그 유도를 알 수 있게 돼서 공부가 재미있어진다. 신입생이라면 아쉽게도 외워야한다.
유도
중심극한정리: {Xk}k=1n 이 iid확률 변수들이고 확률분포 (μ,σ2)를 따른다고 하면 n→∞ 일 때
nσX−μ→DN(0,1)
두 모집단에서 얻은 대표본이라 가정했으므로 모집단의 분포가 무엇이든 중심극한정리에 따라 X1,X2 은 다음과 같이 정규분포를 따른다.
X1=X2=n11k=1∑n1X1∼N(μ1,n1σ12)n21k=1∑n2X2∼N(μ2,n2σ22)
Xi∼N(μi,σi2) 이면 주어진 벡터 (a1,⋯,an)∈Rn 에 대해
i=1∑naiXi∼N(i=1∑naiμi,i=1∑nai2σi2)
주어진 벡터 (a1,a2)=(1,−1)∈R2 에 대해
X1−X2=∼∼a1X1+a2X2N(i=1∑2aiμi,i=1∑2ai2σi2)N(μ1−μ2,12⋅n1σ2+(−1)2⋅n2σ2)
이므로 귀무가설 H0:μ1−μ2=D0 하에서
Z=n1σ12+n2σ22(X1−X2)−D0∼N(0,1)
는 표준정규분포N(0,1) 에 거의 근사한 분포를 따른다. 마찬가지로 대표본인 경우 s≈σ 이므로 모분산을 모를 때는 σ 대신 s 를 사용해도 무방하다. 확률변수Y 가 표준정규분포를 따른다고 할 때, 유의수준α 에 대해 P(Y≥zα)=α 를 만족시키는 zα 에 대해 H0 가 기각된다는 것은 다음과 동치다.
∣Z∣≥zα
이는 귀무가설에 따라 μ1−μ2=D0 이라고 믿기엔 X1−X2 이 D0 에서 너무 멀리 떨어져있다는 의미가 된다.
■
Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p363. ↩︎