일원분산분석
📂통계적검정일원분산분석
가설검정
실험 설계 상 k 개의 처리가 있을 때, 각 처리에서 nj 개씩 총 n=n1+⋯+nk 개의 표본을 얻었다고 하자. j=1,⋯,k 번째 처리의 표본이 각자 독립적이고 랜덤하게 정규분포 N(μj,σj2) 를 따르며, 각 정규분포의 모분산이 같아서 σ2=σ12=⋯=σk2 라 가정하자. 집단 간의 모평균를 비교하는 분산분석인 일원분산분석one-way ANOVA에서 가설검정은 다음과 같다.
- H0: μ1=⋯=μk
- H1: 적어도 하나의 μj 는 다른 모평균과 다르다.
검정통계량
완전랜덤화설계 하에서 아노바 테이블이 주어져 있다고 하자.
Source | df | SS | MS | F |
---|
Treatments | k−1 | SST | MST | MST/MSE |
Error | n−k | SSE | MSE | |
Total | n−1 | TSS | | |
검정통계량은 다음과 같다.
F=MSEMST=SSE/(n−k)SST/(k−1)
이 검정통계량은 귀무가설이 참이라는 가정 하에 자유도가 (k−1),(n−k) 인 F-분포 F(k−1,n−k) 를 따른다.
설명
처리별 평균을 xˉj:=∑ixij/nj 라 하고, 전체 평균을 xˉ:=∑ijxij/n 이라 하자.
SST=SSE=MST=MSE=F=j=1∑knj(xˉj−xˉ)2(n1−1)s12+⋯+(nk−1)sk2k−1SSTn−kSSEMSEMST=SSE/(n−k)SST/(k−1)
검정통계량의 유도 그 자체는 분산분석에서의 F-검정을 참고하도록 하자.
예시
일원분산분석은 처리에 따른 모평균의 차이가 있는지 관심이 있을 때 사용한다. 한국의 K-POP 엔터사 스타쉽STARSHIP에서 데뷔한 세 걸그룹의 신장을 데이터로써 두고 완전랜덤화설계 하에서 분석해보자. 귀무가설은 네 그룹의 평균 신장이 같다는 것이고, 대립가설은 적어도 하나의 그룹의 평균 신장이 다르다는 것이다.
- 씨스타(SISTAR): {보라: 164cm, 효린: 163cm, 소유: 168cm, 다솜: 167cm}
- 우주소녀(WJSN): {설아: 165cm, 보나: 163cm, 엑시: 166cm, 수빈: 156cm, 루다: 158cm, 다원: 167cm, 은서: 170cm, 여름: 161cm, 다영: 161cm, 연정: 166cm}
- 아이브(IVE): {유진: 173cm, 가을: 164cm, 레이: 169cm, 원영: 173cm, 리즈: 171cm, 이서: 165cm}
- 2025년 데뷔한 키키(KiiiKiii)의 신장은 공개되지 않았다.
SISTAR | WJSN | IVE |
---|
164 | 165 | 173 |
163 | 163 | 164 |
168 | 166 | 169 |
167 | 156 | 173 |
| 158 | 171 |
| 167 | 165 |
| 170 | |
| 161 | |
| 161 | |
| 166 | |
전체 평균신장은 165.5이고, 그룹별 평균신장은 SISTART 165.5cm, WJSN 163.3cm, IVE 169.2cm 이다.
물론 한눈에 보아도 IVE의 평균 신장이 가장 큰 것을 알 수 있지만, 이것이 통계적으로 유의한 차이인지 말하려면 아노바 테이블을 채워가며 F-검정을 해봐야 한다. 각 멤버 수의 합은 샘플 사이즈 n=4+10+6=20 이고, 그룹 수는 k=3 이다.
Source | df | SS | MS | F |
---|
Treatments | 2 | SST | SST/2 | MST/MSE |
Error | 17 | SSE | SSE/17 | |
Total | 19 | TSS | | |
SST=SSE=F=4⋅(165.5−165.5)2+10⋅(163.3−165.5)2+6⋅(169.2−165.5)23⋅17+9⋅168.1+5⋅76.8261.9/17129.1/2=15.464.5=129.1=261.9=4.19
만약 유의수준이 α=5% 라면 기각역의 하한은 F2,17(0.05)=3.59 으로써 F=4.19>3.59=F2,17(0.05) 이므로 귀무가설을 기각할 수 있다. 다시 말해, 적어도 하나의 그룹은 평균 신장이 다른 그룹과 다르다.
검산
이상의 결과는 엑셀excel을 통해서도 재현할 수 있다.

같이보기