logo

아노바 테이블 📂통계적검정

아노바 테이블

정의 1

분산분석에서 요약된 결과를 보여주는 표를 아노바 테이블ANOVA table이라 한다. 실험설계에 따라서 아노바 테이블의 형태가 약간 다르다.

완전랜덤화설계

SourcedfSSMSF
Treatments$k-1$SSTMSTMST/MSE
Error$n-k$SSEMSE
Total$n-1$TSS

랜덤화블럭설계

SourcedfSSMSF
Treatments$k-1$SSTMSTMST/MSE
Blocks$b-1$SSBMSB
Error$(k-1)(b-1)$SSEMSE
Total$n-1$TSS

설명

아노바 테이블은 분산분석에서 $F$ 통계량을 구하는 과정을 나타낸다. 학부생 입장에서 처음 배울 땐 단순 암기 혹은 계산 문제로 보이겠지만 어느정도 공부를 하고 난 뒤에 다시 보면 결국 카이제곱분포을 따르는 두 수치를 만들어서 F-분포를 따르는 값을 얻는 것에 불과하다. 중간 기말 시험은 쳐야하니 괜히 빈칸 채우기 문제로 만들어 내니까 어렵지, 실제로 중요한 것은 테이블의 오른쪽 위에 위치한 F 통계량이 전부다.

계산 방법

구체적으로 아노바 테이블의 수치들을 계산해보자. 완전랜덤화실험에서 $k$ 개의 처리가 있고 $j$ 번째 처리에서 $n_{j}$ 개의 표본 $x_{1 j} , \cdots , x_{n_{j} j}$ 을 얻었다고 하자. 전체 표본의 수 $n = n_{1} + \cdots + n_{k}$ 에 대해 표본평균을 $\bar{x} = \sum_{ij} x_{ij} / n$ 이라 할 때, 총제곱합total sum of squares $\text{TSS}$ 는 다음과 같다. $$ \text{TSS} = \sum_{j=1}^{k} \sum_{i=1}^{n_{j}} \left( x_{ij} - \bar{x} \right)^{2} $$ 총계grand total $G = \sum_{ij} x_{ij}$ 에 대해 평균에 대한 보정correction for the mean $\text{CM}$ 은 다음과 같다. $$ \text{CM} = {\frac{ 1 }{ n }} \sum_{j=1}^{k} \sum_{i=1}^{n_{j}} \left( x_{ij} \right)^{2} = {\frac{ G }{ n^{2} }} $$ 처리에 대한 제곱합sum of squares for treatments $\text{SST}$ 는 다음과 같이 처리 $j = 1 , \cdots , k$ 마다의 표본평균 $\bar{x}_{j}$ 으로 얻는 다음과 같다. $$ \text{SST} = \sum_{j=1}^{k} n_{j} \left( \bar{x}_{j} - \bar{x} \right)^{2} $$ 오차에 대한 제곱합sum of squares for error $\text{SSE}$ 는 다음과 같이 처리 $j = 1 , \cdots , k$ 마다의 표본분산 $s_{j}^{2}$ 으로 얻는 합동분산으로 구해진다. $$ \text{SSE} = \left( n_{1} - 1 \right) s_{1}^{2} + \cdots + \left( n_{k} - 1 \right) s_{k}^{2} = \text{TSS} - \text{SST} $$ 평균 제곱mean squares $MS$ 는 다음과 같이 각 제곱합 $SS$ 를 자유도 $\text{df}$ 로 나눈 값 $MS = SS / \text{df}$ 다. $$ \begin{align*} \text{MST} =& {\frac{ \text{SST} }{ k - 1 }} \\ \text{MSE} =& {\frac{ \text{SSE} }{ n - k }} \end{align*} $$ 마지막으로 $F$ 통계량은 다음과 같이 $MST$ 와 $MSE$ 의 비로 산출된다. $$ F = {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST} / (k - 1) }{ \text{SSE} / (n - k) }} $$

랜덤화블럭설계 하에서는 블럭의 수 $b$ 가 추가되어 블럭에 대한 제곱합sum of squares for blocks $\text{SSB}$ 과 평균제곱 $\text{MSB}$ 가 추가되고, $MSE$ 의 자유도가 $(b-1)(k-1)$ 로 바뀌는 점이 다르다. $$ \begin{align*} \text{SSB} =& \sum_{i=1}^{b} \left( x_{i} - \bar{x} \right)^{2} \\ \text{MSB} =& {\frac{ \text{SSB} }{ b - 1 }} \\ \text{MSE} =& {\frac{ \text{SSE} }{ (b-1)(k-1) }} \\ F =& {\frac{ \text{MST} }{ \text{MSE} }} = {\frac{ \text{SST}/ (k - 1) }{ \text{SSE} / (b-1)(k-1) }} = {\frac{ \text{SST}}{ \text{SSE} / (b-1) }} \end{align*} $$


  1. Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p452. ↩︎