아노바 테이블
📂통계적검정아노바 테이블
정의
분산분석에서 요약된 결과를 보여주는 표를 아노바 테이블ANOVA table이라 한다. 실험설계에 따라서 아노바 테이블의 형태가 약간 다르다.
완전랜덤화설계
Source | df | SS | MS | F |
---|
Treatments | k−1 | SST | MST | MST/MSE |
Error | n−k | SSE | MSE | |
Total | n−1 | TSS | | |
랜덤화블럭설계
Source | df | SS | MS | F |
---|
Treatments | k−1 | SST | MST | MST/MSE |
Blocks | b−1 | SSB | MSB | |
Error | (k−1)(b−1) | SSE | MSE | |
Total | n−1 | TSS | | |
설명
아노바 테이블은 분산분석에서 F 통계량을 구하는 과정을 나타낸다. 학부생 입장에서 처음 배울 땐 단순 암기 혹은 계산 문제로 보이겠지만 어느정도 공부를 하고 난 뒤에 다시 보면 결국 카이제곱분포을 따르는 두 수치를 만들어서 F-분포를 따르는 값을 얻는 것에 불과하다. 중간 기말 시험은 쳐야하니 괜히 빈칸 채우기 문제로 만들어 내니까 어렵지, 실제로 중요한 것은 테이블의 오른쪽 위에 위치한 F 통계량이 전부다.
계산 방법
구체적으로 아노바 테이블의 수치들을 계산해보자. 완전랜덤화실험에서 k 개의 처리가 있고 j 번째 처리에서 nj 개의 표본 x1j,⋯,xnjj 을 얻었다고 하자. 전체 표본의 수 n=n1+⋯+nk 에 대해 표본평균을 xˉ=∑ijxij/n 이라 할 때, 총제곱합total sum of squares TSS 는 다음과 같다.
TSS=j=1∑ki=1∑nj(xij−xˉ)2
총계grand total G=∑ijxij 에 대해 평균에 대한 보정correction for the mean CM 은 다음과 같다.
CM=n1j=1∑ki=1∑nj(xij)2=n2G
처리에 대한 제곱합sum of squares for treatments SST 는 다음과 같이 처리 j=1,⋯,k 마다의 표본평균 xˉj 으로 얻는 다음과 같다.
SST=j=1∑knj(xˉj−xˉ)2
오차에 대한 제곱합sum of squares for error SSE 는 다음과 같이 처리 j=1,⋯,k 마다의 표본분산 sj2 으로 얻는 합동분산으로 구해진다.
SSE=(n1−1)s12+⋯+(nk−1)sk2=TSS−SST
평균 제곱mean squares MS 는 다음과 같이 각 제곱합 SS 를 자유도 df 로 나눈 값 MS=SS/df 다.
MST=MSE=k−1SSTn−kSSE
마지막으로 F 통계량은 다음과 같이 MST 와 MSE 의 비로 산출된다.
F=MSEMST=SSE/(n−k)SST/(k−1)
랜덤화블럭설계 하에서는 블럭의 수 b 가 추가되어 블럭에 대한 제곱합sum of squares for blocks SSB 과 평균제곱 MSB 가 추가되고, MSE 의 자유도가 (b−1)(k−1) 로 바뀌는 점이 다르다.
SSB=MSB=MSE=F=i=1∑b(xi−xˉ)2b−1SSB(b−1)(k−1)SSEMSEMST=SSE/(b−1)(k−1)SST/(k−1)=SSE/(b−1)SST