logo

일원분산분석 📂통계적검정

일원분산분석

가설검정 1

실험 설계kk 개의 처리가 있을 때, 각 처리에서 njn_{j} 개씩 총 n=n1++nkn = n_{1} + \cdots + n_{k} 개의 표본을 얻었다고 하자. j=1,,kj = 1 , \cdots , k 번째 처리의 표본이 각자 독립적이고 랜덤하게 정규분포 N(μj,σj2)N \left( \mu_{j} , \sigma_{j}^{2} \right) 를 따르며, 각 정규분포의 모분산이 같아서 σ2=σ12==σk2\sigma^{2} = \sigma_{1}^{2} = \cdots = \sigma_{k}^{2} 라 가정하자. 집단 간의 모평균를 비교하는 분산분석일원분산분석one-way ANOVA에서 가설검정은 다음과 같다.

  • H0H_{0}: μ1==μk\mu_{1} = \cdots = \mu_{k}
  • H1H_{1}: 적어도 하나의 μj\mu_{j} 는 다른 모평균과 다르다.

검정통계량

완전랜덤화설계 하에서 아노바 테이블이 주어져 있다고 하자.

SourcedfSSMSF
Treatmentsk1k-1SSTMSTMST/MSE
Errornkn-kSSEMSE
Totaln1n-1TSS

검정통계량은 다음과 같다. F=MSTMSE=SST/(k1)SSE/(nk) F = {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST} / (k - 1) }{ \text{SSE} / (n - k) }} 이 검정통계량은 귀무가설이 참이라는 가정 하에 자유도가 (k1),(nk)(k-1), (n-k)F-분포 F(k1,nk)F \left( k - 1 , n - k \right) 를 따른다.

설명

처리별 평균을 xˉj:=ixij/nj\bar{x}_{j} := \sum_{i} x_{ij} / n_{j} 라 하고, 전체 평균을 xˉ:=ijxij/n\bar{x} := \sum_{ij} x_{ij} / n 이라 하자. SST=j=1knj(xˉjxˉ)2SSE=(n11)s12++(nk1)sk2MST=SSTk1MSE=SSEnkF=MSTMSE=SST/(k1)SSE/(nk) \begin{align*} \text{SST} =& \sum_{j=1}^{k} n_{j} \left( \bar{x}_{j} - \bar{x} \right)^{2} \\ \text{SSE} =& \left( n_{1} - 1 \right) s_{1}^{2} + \cdots + \left( n_{k} - 1 \right) s_{k}^{2} \\ \text{MST} =& {\frac{ \text{SST} }{ k - 1 }} \\ \text{MSE} =& {\frac{ \text{SSE} }{ n - k }} \\ F =& {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST}/ (k - 1) }{ \text{SSE} / (n - k) }} \end{align*} 검정통계량의 유도 그 자체는 분산분석에서의 F-검정을 참고하도록 하자.

예시

일원분산분석은 처리에 따른 모평균의 차이가 있는지 관심이 있을 때 사용한다. 한국의 K-POP 엔터사 스타쉽STARSHIP에서 데뷔한 세 걸그룹의 신장을 데이터로써 두고 완전랜덤화설계 하에서 분석해보자. 귀무가설은 네 그룹의 평균 신장이 같다는 것이고, 대립가설은 적어도 하나의 그룹의 평균 신장이 다르다는 것이다.

  • 씨스타(SISTAR): {보라: 164cm, 효린: 163cm, 소유: 168cm, 다솜: 167cm}
  • 우주소녀(WJSN): {설아: 165cm, 보나: 163cm, 엑시: 166cm, 수빈: 156cm, 루다: 158cm, 다원: 167cm, 은서: 170cm, 여름: 161cm, 다영: 161cm, 연정: 166cm}
  • 아이브(IVE): {유진: 173cm, 가을: 164cm, 레이: 169cm, 원영: 173cm, 리즈: 171cm, 이서: 165cm}
  • 2025년 데뷔한 키키(KiiiKiii)의 신장은 공개되지 않았다.
SISTARWJSNIVE
164165173
163163164
168166169
167156173
158171
167165
170
161
161
166

전체 평균신장은 165.5이고, 그룹별 평균신장은 SISTART 165.5cm, WJSN 163.3cm, IVE 169.2cm 이다.

물론 한눈에 보아도 IVE의 평균 신장이 가장 큰 것을 알 수 있지만, 이것이 통계적으로 유의한 차이인지 말하려면 아노바 테이블을 채워가며 F-검정을 해봐야 한다. 각 멤버 수의 합은 샘플 사이즈 n=4+10+6=20n = 4 + 10 + 6 = 20 이고, 그룹 수는 k=3k = 3 이다.

SourcedfSSMSF
Treatments22SSTSST/22MST/MSE
Error1717SSESSE/1717
Total1919TSS

SST=4(165.5165.5)2+10(163.3165.5)2+6(169.2165.5)2=129.1SSE=317+9168.1+576.8=261.9F=129.1/2261.9/17=64.515.4=4.19 \begin{align*} \text{SST} =& 4 \cdot (165.5 - 165.5)^{2} + 10 \cdot (163.3 - 165.5)^{2} + 6 \cdot (169.2 - 165.5)^{2} &= 129.1 \\ \text{SSE} =& 3 \cdot 17 + 9 \cdot 168.1 + 5 \cdot 76.8 &= 261.9 \\ F =& {\frac{ 129.1 / 2 }{ 261.9 / 17 }} = {\frac{ 64.5 }{ 15.4 }} &= 4.19 \end{align*}

만약 유의수준α=5%\alpha = 5 \% 라면 기각역의 하한은 F2,17(0.05)=3.59F_{2,17} (0.05) = 3.59 으로써 F=4.19>3.59=F2,17(0.05)F = 4.19 > 3.59 = F_{2,17} (0.05) 이므로 귀무가설을 기각할 수 있다. 다시 말해, 적어도 하나의 그룹은 평균 신장이 다른 그룹과 다르다.

검산

이상의 결과는 엑셀excel을 통해서도 재현할 수 있다.

alt text

같이보기

실험설계모수적 기법비모수적 기법
완전랜덤화설계일원분산분석크루스칼-월리스 HH 검정
랜덤화블럭설계이원분산분석프리드만 FrF_{r} 검정

  1. Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p455. ↩︎