logo

아노바 테이블 📂통계적검정

아노바 테이블

정의 1

분산분석에서 요약된 결과를 보여주는 표를 아노바 테이블ANOVA table이라 한다. 실험설계에 따라서 아노바 테이블의 형태가 약간 다르다.

완전랜덤화설계

SourcedfSSMSF
Treatmentsk1k-1SSTMSTMST/MSE
Errornkn-kSSEMSE
Totaln1n-1TSS

랜덤화블럭설계

SourcedfSSMSF
Treatmentsk1k-1SSTMSTMST/MSE
Blocksb1b-1SSBMSB
Error(k1)(b1)(k-1)(b-1)SSEMSE
Totaln1n-1TSS

설명

아노바 테이블은 분산분석에서 FF 통계량을 구하는 과정을 나타낸다. 학부생 입장에서 처음 배울 땐 단순 암기 혹은 계산 문제로 보이겠지만 어느정도 공부를 하고 난 뒤에 다시 보면 결국 카이제곱분포을 따르는 두 수치를 만들어서 F-분포를 따르는 값을 얻는 것에 불과하다. 중간 기말 시험은 쳐야하니 괜히 빈칸 채우기 문제로 만들어 내니까 어렵지, 실제로 중요한 것은 테이블의 오른쪽 위에 위치한 F 통계량이 전부다.

계산 방법

구체적으로 아노바 테이블의 수치들을 계산해보자. 완전랜덤화실험에서 kk 개의 처리가 있고 jj 번째 처리에서 njn_{j} 개의 표본 x1j,,xnjjx_{1 j} , \cdots , x_{n_{j} j} 을 얻었다고 하자. 전체 표본의 수 n=n1++nkn = n_{1} + \cdots + n_{k} 에 대해 표본평균xˉ=ijxij/n\bar{x} = \sum_{ij} x_{ij} / n 이라 할 때, 총제곱합total sum of squares TSS\text{TSS} 는 다음과 같다. TSS=j=1ki=1nj(xijxˉ)2 \text{TSS} = \sum_{j=1}^{k} \sum_{i=1}^{n_{j}} \left( x_{ij} - \bar{x} \right)^{2} 총계grand total G=ijxijG = \sum_{ij} x_{ij} 에 대해 평균에 대한 보정correction for the mean CM\text{CM} 은 다음과 같다. CM=1nj=1ki=1nj(xij)2=Gn2 \text{CM} = {\frac{ 1 }{ n }} \sum_{j=1}^{k} \sum_{i=1}^{n_{j}} \left( x_{ij} \right)^{2} = {\frac{ G }{ n^{2} }} 처리에 대한 제곱합sum of squares for treatments SST\text{SST} 는 다음과 같이 처리 j=1,,kj = 1 , \cdots , k 마다의 표본평균 xˉj\bar{x}_{j} 으로 얻는 다음과 같다. SST=j=1knj(xˉjxˉ)2 \text{SST} = \sum_{j=1}^{k} n_{j} \left( \bar{x}_{j} - \bar{x} \right)^{2} 오차에 대한 제곱합sum of squares for error SSE\text{SSE} 는 다음과 같이 처리 j=1,,kj = 1 , \cdots , k 마다의 표본분산 sj2s_{j}^{2} 으로 얻는 합동분산으로 구해진다. SSE=(n11)s12++(nk1)sk2=TSSSST \text{SSE} = \left( n_{1} - 1 \right) s_{1}^{2} + \cdots + \left( n_{k} - 1 \right) s_{k}^{2} = \text{TSS} - \text{SST} 평균 제곱mean squares MSMS 는 다음과 같이 각 제곱합 SSSS자유도 df\text{df} 로 나눈 값 MS=SS/dfMS = SS / \text{df} 다. MST=SSTk1MSE=SSEnk \begin{align*} \text{MST} =& {\frac{ \text{SST} }{ k - 1 }} \\ \text{MSE} =& {\frac{ \text{SSE} }{ n - k }} \end{align*} 마지막으로 FF 통계량은 다음과 같이 MSTMSTMSEMSE 의 비로 산출된다. F=MSTMSE=SST/(k1)SSE/(nk) F = {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST} / (k - 1) }{ \text{SSE} / (n - k) }}

랜덤화블럭설계 하에서는 블럭의 수 bb 가 추가되어 블럭에 대한 제곱합sum of squares for blocks SSB\text{SSB} 과 평균제곱 MSB\text{MSB} 가 추가되고, MSEMSE 의 자유도가 (b1)(k1)(b-1)(k-1) 로 바뀌는 점이 다르다. SSB=i=1b(xixˉ)2MSB=SSBb1MSE=SSE(b1)(k1)F=MSTMSE=SST/(k1)SSE/(b1)(k1)=SSTSSE/(b1) \begin{align*} \text{SSB} =& \sum_{i=1}^{b} \left( x_{i} - \bar{x} \right)^{2} \\ \text{MSB} =& {\frac{ \text{SSB} }{ b - 1 }} \\ \text{MSE} =& {\frac{ \text{SSE} }{ (b-1)(k-1) }} \\ F =& {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST}/ (k - 1) }{ \text{SSE} / (b-1)(k-1) }} = {\frac{ \text{SST}}{ \text{SSE} / (b-1) }} \end{align*}


  1. Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p452. ↩︎