일원분산분석
가설검정 1
실험 설계 상 $k$ 개의 처리가 있을 때, 각 처리에서 $n_{j}$ 개씩 총 $n = n_{1} + \cdots + n_{k}$ 개의 표본을 얻었다고 하자. $j = 1 , \cdots , k$ 번째 처리의 표본이 각자 독립적이고 랜덤하게 정규분포 $N \left( \mu_{j} , \sigma_{j}^{2} \right)$ 를 따르며, 각 정규분포의 모분산이 같아서 $\sigma^{2} = \sigma_{1}^{2} = \cdots = \sigma_{k}^{2}$ 라 가정하자. 집단 간의 모평균를 비교하는 분산분석인 일원분산분석one-way ANOVA에서 가설검정은 다음과 같다.
- $H_{0}$: $\mu_{1} = \cdots = \mu_{k}$
- $H_{1}$: 적어도 하나의 $\mu_{j}$ 는 다른 모평균과 다르다.
검정통계량
완전랜덤화설계 하에서 아노바 테이블이 주어져 있다고 하자.
Source | df | SS | MS | F |
---|---|---|---|---|
Treatments | $k-1$ | SST | MST | MST/MSE |
Error | $n-k$ | SSE | MSE | |
Total | $n-1$ | TSS |
검정통계량은 다음과 같다. $$ F = {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST} / (k - 1) }{ \text{SSE} / (n - k) }} $$ 이 검정통계량은 귀무가설이 참이라는 가정 하에 자유도가 $(k-1), (n-k)$ 인 F-분포 $F \left( k - 1 , n - k \right)$ 를 따른다.
설명
처리별 평균을 $\bar{x}_{j} := \sum_{i} x_{ij} / n_{j}$ 라 하고, 전체 평균을 $\bar{x} := \sum_{ij} x_{ij} / n$ 이라 하자. $$ \begin{align*} \text{SST} =& \sum_{j=1}^{k} n_{j} \left( \bar{x}_{j} - \bar{x} \right)^{2} \\ \text{SSE} =& \left( n_{1} - 1 \right) s_{1}^{2} + \cdots + \left( n_{k} - 1 \right) s_{k}^{2} \\ \text{MST} =& {\frac{ \text{SST} }{ k - 1 }} \\ \text{MSE} =& {\frac{ \text{SSE} }{ n - k }} \\ F =& {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST}/ (k - 1) }{ \text{SSE} / (n - k) }} \end{align*} $$ 검정통계량의 유도 그 자체는 분산분석에서의 F-검정을 참고하도록 하자.
예시
일원분산분석은 처리에 따른 모평균의 차이가 있는지 관심이 있을 때 사용한다. 한국의 K-POP 엔터사 스타쉽STARSHIP에서 데뷔한 세 걸그룹의 신장을 데이터로써 두고 완전랜덤화설계 하에서 분석해보자. 귀무가설은 네 그룹의 평균 신장이 같다는 것이고, 대립가설은 적어도 하나의 그룹의 평균 신장이 다르다는 것이다.
- 씨스타(SISTAR): {보라: 164cm, 효린: 163cm, 소유: 168cm, 다솜: 167cm}
- 우주소녀(WJSN): {설아: 165cm, 보나: 163cm, 엑시: 166cm, 수빈: 156cm, 루다: 158cm, 다원: 167cm, 은서: 170cm, 여름: 161cm, 다영: 161cm, 연정: 166cm}
- 아이브(IVE): {유진: 173cm, 가을: 164cm, 레이: 169cm, 원영: 173cm, 리즈: 171cm, 이서: 165cm}
- 2025년 데뷔한 키키(KiiiKiii)의 신장은 공개되지 않았다.
SISTAR | WJSN | IVE |
---|---|---|
164 | 165 | 173 |
163 | 163 | 164 |
168 | 166 | 169 |
167 | 156 | 173 |
158 | 171 | |
167 | 165 | |
170 | ||
161 | ||
161 | ||
166 |
전체 평균신장은 165.5이고, 그룹별 평균신장은 SISTART 165.5cm, WJSN 163.3cm, IVE 169.2cm 이다.
물론 한눈에 보아도 IVE의 평균 신장이 가장 큰 것을 알 수 있지만, 이것이 통계적으로 유의한 차이인지 말하려면 아노바 테이블을 채워가며 F-검정을 해봐야 한다. 각 멤버 수의 합은 샘플 사이즈 $n = 4 + 10 + 6 = 20$ 이고, 그룹 수는 $k = 3$ 이다.
Source | df | SS | MS | F |
---|---|---|---|---|
Treatments | $2$ | SST | SST/$2$ | MST/MSE |
Error | $17$ | SSE | SSE/$17$ | |
Total | $19$ | TSS |
$$ \begin{align*} \text{SST} =& 4 \cdot (165.5 - 165.5)^{2} + 10 \cdot (163.3 - 165.5)^{2} + 6 \cdot (169.2 - 165.5)^{2} &= 129.1 \\ \text{SSE} =& 3 \cdot 17 + 9 \cdot 168.1 + 5 \cdot 76.8 &= 261.9 \\ F =& {\frac{ 129.1 / 2 }{ 261.9 / 17 }} = {\frac{ 64.5 }{ 15.4 }} &= 4.19 \end{align*} $$
만약 유의수준이 $\alpha = 5 \%$ 라면 기각역의 하한은 $F_{2,17} (0.05) = 3.59$ 으로써 $F = 4.19 > 3.59 = F_{2,17} (0.05)$ 이므로 귀무가설을 기각할 수 있다. 다시 말해, 적어도 하나의 그룹은 평균 신장이 다른 그룹과 다르다.
검산
이상의 결과는 엑셀excel을 통해서도 재현할 수 있다.
같이보기
실험설계 | 모수적 기법 | 비모수적 기법 |
---|---|---|
완전랜덤화설계 | 일원분산분석 | 크루스칼-월리스 $H$ 검정 |
랜덤화블럭설계 | 이원분산분석 | 프리드만 $F_{r}$ 검정 |
Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p455. ↩︎