集団の同質性検定
仮説検定 1
多項実験でカテゴリが$C$個のカテゴリカルデータを$R$個の母集団から得たと仮定しよう。$i = 1 , \cdots , R$番目の母集団で要素が$j = 1 , \cdots , C$番目のカテゴリに属する確率を$p_{ij}$とする。このとき、$i$番目の母集団の比率ベクトルを$\mathbf{p}_{i} = \left( p_{i1} , \cdots , p_{iC} \right)$と表す。ピアソンのカイ二乗検定統計量を使用した以下の仮説検定を独立性の検定test of independenceと呼ぶ。
- $H_{0}$: すべての母集団の要素の比率が同一である: $$\mathbf{p}_{1} = \cdots = \mathbf{p}_{R}$$
- $H_{1}$: 要素の比率が同一でない母集団が少なくとも一つ存在する。
検定統計量
検定統計量にはピアソンのカイ二乗検定統計量を使用する。 $$ \mathcal{X}^{2} = \sum_{i=1}^{R} \sum_{j=1}^{C} {{ \left( O_{ij} - E_{ij} \right)^{2} } \over { E_{ij} }} $$ ここで、$i$番目の母集団に属しながら$j$番目のカテゴリに属するデータの度数$O_{ij}$を観測度数、$i$番目の母集団に属するサンプルの数$r_{i}$と$j$番目のカテゴリに属するサンプルの数$c_{j}$の積$r_{i} c_{j}$とサンプルサイズ$n$の比$E := r_{i} c_{j} / n$を期待度数と呼ぶ。この検定統計量はカイ二乗分布に従い、その自由度は母集団の数$R$とカテゴリの数$C$から$1$ずつ引いた値の積である$(R-1)(C-1)$である。
説明
自由度
$$ \begin{align*} p_{i} = \sum_{j1=1}^{C} p_{ij} = {\frac{ r_{i} }{ n }} \implies & \sum_{i=1}^{R} p_{i} = 1 \\ p_{j} = \sum_{i=1}^{R} p_{ij} = {\frac{ c_{j} }{ n }} \implies & \sum_{j=1}^{C} p_{j} = 1 \end{align*} $$ それぞれの周辺確率を考えると上記のような制約条件がつくため、各母集団から$R-1$個、カテゴリから$C - 1$個の確率が分かれば残り一つが決定されるのと同じである。よって自由度はその積である$(R - 1) (C - 1)$になるべきである。
X\Y | y1 | y2 |
---|---|---|
x1 | 0000 | 0000 |
x2 | 0000 | 0000 |
x3 | 0000 | 0000 |
例えば上記のような分割表は母集団が$R = 3$個、カテゴリが$C = 2$個のカテゴリを持つデータを示し、その自由度は$(3-1)(2-1) = 2$となる。
同質性 2
実際、同質性の検定のプロセスは独立性の検定と全く同じであり、実際のところ独立性の検定の延長と見ることができるが、帰無仮説と対立仮説及びその解釈が異なるだけである。独立性の検定では二つのカテゴリが存在し、これらの関係により行の合計$r_{i}$と列の合計$c_{j}$がランダムに決定されるが、同質性の検定では各母集団のサンプルサイズ$r_{i}$は定められており、比率のベクトル$\mathbf{p}_{i}$によって$O_{ij}$がランダムに決定されると考える。この比率のベクトル$\mathbf{p}_{i}$が$i$に関係なく一貫性を持つということは母集団による特別な違いがないということであり、結果的には母集団の選択とカテゴリの比率が独立であることに通ずる。
簡単な例として大学の科目で男性と女性という二つの性別によって成績に違いがあるかを調べるには、以下のように分割表を作成して同質性の検定を行うことができる。
性別 | A | B | C | D | F | 計 |
---|---|---|---|---|---|---|
男性 | 29 | 52 | 26 | 17 | 6 | 130 |
女性 | 6 | 75 | 98 | 62 | 9 | 250 |
- $H_{0}$: 性別に関係なく成績の比率が同一である。
- $H_{1}$: 性別に関係なく成績の比率が同一でない。
見ての通り、成績というカテゴリの階級はAからFまで五つもあり、これを単に13:25の比率で当てはめて違いを解釈するのは困難である。有意水準$\alpha = 0.05$で男性と女性の成績比率が統計的に同一であるかを確認するには、$R = 2$で$R = 5$であるので、自由度$(2-1)(5-1) = 4$のカイ二乗分布から得た$\chi_{1 - \alpha}^{2} (4) \approx 9.49$と検定統計量$\mathcal{X}^{2}$を比較すればよい。実際の計算結果は$\mathcal{X}^{2} \approx 54.889$であり、$\chi_{1 - \alpha}^{2} (4)$を大きく上回るので、有意水準$5\%$で性別による成績の違いがあると結論付けられる。
注意すべきは、このような統計的解釈があくまで「同一でない」というところでとどまるべきであるということだ。もちろん、目があれば誰でもこの架空の例で男性の成績が優れていることを理解できるが、通りすがりに「男たちがよくできるね」と言うことができるかもしれない。しかし、そのような判断は同質性の検定ではなく、「おそらくAが一番良くてFが一番悪いだろう」という直感から来るものである。たとえそのような情報が与えられたとしても、同質性の検定の帰無仮説と対立仮説では優劣について言及していないし、これは実際に数学的なバックグラウンドがそうであるからである。