一元配置分散分析
📂統計的検定一元配置分散分析
仮説検定
実験設計 上 k 個の処理がある場合、それぞれの処理から nj 個ずつ合計で n=n1+⋯+nk 個の標本を得たとする。j=1,⋯,k 番目の処理の標本がそれぞれ独立でランダムに 正規分布 N(μj,σj2) に従い、それぞれの正規分布の 母分散が等しいと仮定して σ2=σ12=⋯=σk2 とする。集団間の 母平均を比較する 分散分析 である 一元配置分散分析one-way ANOVAにおいて、仮説検定 は次の通りである。
- H0: μ1=⋯=μk
- H1: 少なくとも一つの μj は他の母平均と異なる。
検定統計量
完全無作為化設計 下で アノバテーブル が与えられているとする。
Source | df | SS | MS | F |
---|
Treatments | k−1 | SST | MST | MST/MSE |
Error | n−k | SSE | MSE | |
Total | n−1 | TSS | | |
検定統計量 は次の通りである。
F=MSEMST=SSE/(n−k)SST/(k−1)
この検定統計量は、帰無仮説が真であるという仮定のもとで、自由度が (k−1),(n−k) である F-分布 F(k−1,n−k) に従う。
説明
処理別の平均を xˉj:=∑ixij/nj とし、全体の平均を xˉ:=∑ijxij/n とする。
SST=SSE=MST=MSE=F=j=1∑knj(xˉj−xˉ)2(n1−1)s12+⋯+(nk−1)sk2k−1SSTn−kSSEMSEMST=SSE/(n−k)SST/(k−1)
検定統計量の導出そのものは 分散分析におけるF-検定 を参照すること。
例示
一元配置分散分析は、処理による母平均の差異に関心があるときに使用される。韓国のK-POPエンターテイメント会社STARSHIPからデビューした3つのガールグループの身長データを基にして、完全無作為化設計 下で分析してみよう。帰無仮説は三つのグループの平均身長が等しいことであり、対立仮説は少なくとも一つのグループの平均身長が異なることである。
- シスタ(SISTAR): {ボラ: 164cm, ヒョリン: 163cm, ソユ: 168cm, ダソム: 167cm}
- ウジュソニョ(WJSN): {ソラ: 165cm, ボナ: 163cm, エクシ: 166cm, スビン: 156cm, ルダ: 158cm, ダウォン: 167cm, ウンソ: 170cm, ヨラム: 161cm, ダヨン: 161cm, ヨンジョン: 166cm}
- アイヴ(IVE): {ユジン: 173cm, ガウル: 164cm, レイ: 169cm, ウォニョン: 173cm, リズ: 171cm, イソ: 165cm}
- 2025年にデビューしたキキ(KiiiKiii)の身長は未公開である。
SISTAR | WJSN | IVE |
---|
164 | 165 | 173 |
163 | 163 | 164 |
168 | 166 | 169 |
167 | 156 | 173 |
| 158 | 171 |
| 167 | 165 |
| 170 | |
| 161 | |
| 161 | |
| 166 | |
全体の平均身長は165.5であり、グループ別の平均身長はSISTAR 165.5cm、WJSN 163.3cm、IVE 169.2cmである。
もちろん一見してもIVEの平均身長が最も高いことがわかるが、これが統計的に有意な差であるかを述べるには、アノバテーブルを埋めながらF-検定を行う必要がある。各メンバー数の総和はサンプルサイズ n=4+10+6=20 であり、グループ数は k=3 である。
Source | df | SS | MS | F |
---|
Treatments | 2 | SST | SST/2 | MST/MSE |
Error | 17 | SSE | SSE/17 | |
Total | 19 | TSS | | |
SST=SSE=F=4⋅(165.5−165.5)2+10⋅(163.3−165.5)2+6⋅(169.2−165.5)23⋅17+9⋅168.1+5⋅76.8261.9/17129.1/2=15.464.5=129.1=261.9=4.19
もし 有意水準 が α=5% であるなら、棄却域の下限は F2,17(0.05)=3.59 であり F=4.19>3.59=F2,17(0.05) なので、帰無仮説は棄却される。つまり、少なくとも一つのグループの平均身長が他のグループと異なる。
検算
以上の結果はExcelexcelを通じて再現することが可能である。

参考