統計学における分散分析またはANOVAとは何ですか?
定義 1 2
二つ以上の集団の母平均を比較するために分散を分析することを分散分析analysis of varianceといい、省略してアノバANOVAとも呼ばれる。
説明
直感的には母平均を比較するためにはその標本平均を比較すべきように思えるが、統計的観点から単純な数値の比較は大きな意味を持たない。
Aの平均 | Bの平均 |
---|---|
0.0142 | 0.0271 |
たとえば上のように と 二つの集団から得た標本のヒストグラムを見よう。計算では 集団の標本平均が 、 集団の標本平均が で、 集団がわずかに大きい。しかし、単純に値を比較することは小学生でもできることであり、真の意味で二つの集団の母平均に差があるのかと問われれば、にわかにはそうだと答えにくい。
今回はほとんど同じ標本平均を持つが、データの分散が小さくそれぞれの母平均の近くに集まっているデータを比べてみよう。標本平均の差は先ほどの状況とほとんど同じだが、分散が変わると確かに母平均の差があると言えるようになった。
ここまでが分散分析の「平均を比較するために分散を分析する」という基本コンセプトである。実際の分散分析は大きく一元分散分析と二元分散分析に分かれ、 個の母集団があるとき、次のように 個の母平均がすべて同じであるかを帰無仮説とする。
- :
- : 少なくとも一つの は他の母平均と異なる。