logo

独立した二つのカイ二乗分布からF分布を導出する 📂確率分布論

独立した二つのカイ二乗分布からF分布を導出する

定理

二つの確率変数$U,V$が独立であり、$U \sim \chi^{2} ( r_{1})$、$V \sim \chi^{2} ( r_{2})$とするならば $$ {{ U / r_{1} } \over { V / r_{2} }} \sim F \left( r_{1} , r_{2} \right) $$

説明

二つのデータがカイ二乗分布に従い、独立である場合、その比率を分布理論で説明することができるかもしれない。統計学全般では、標準化された残差の二乗がカイ二乗分布に従うと仮定されるため、F検定を好んで使用する。証明自体が重要なわけではないが、多くの分析でなぜF検定を使用するのかについての洞察を与えるため、数理統計学を学ぶ統計学生にとっては非常に重要な事実である。

導出1

戦略: カイ二乗分布のジョイント密度関数を直接演繹する。

カイ二乗分布の定義: 自由度$r > 0$に対して次のような確率密度関数を持つ連続確率分布$\chi^{2} (r)$はカイ二乗分布と呼ばれる。 $$ f(x) = {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} \qquad , x \in (0, \infty) $$

F分布の定義: 自由度$r_{1}, r_{2} > 0$に対して次のような確率密度関数を持つ連続確率分布$F \left( r_{1} , r_{2} \right)$はF分布と呼ばれる。 $$ f(x) = {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} \qquad , x \in (0, \infty) $$


$U,V$が独立なのでジョインット密度関数は$u,v \in (0,\infty)$に対して次のようになる。 $$ h(u,v) = {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} u^{r_{1}/2 - 1} v^{r_{2}/2 - 1} e^{-(u+v)/2} $$ 今、$\displaystyle W:= {{ U/r_{1} } \over { V / r_{2} }}$と$Z := V$とするならば$u = (r_{1}/r_{2})zw$であり、$v = z$なので $$ \left| J \right| = \begin{vmatrix} (r_{1}/r_{2})z & (r_{1}/r_{2})w \\ 0 & 1 \end{vmatrix} = (r_{1}/r_{2})z \ne 0 $$ 従って、$W,Z$のジョイント密度関数は$w,z \in (0,\infty)$に対して $$ g(w,z) = {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ r_{1} z w } \over { r_{2} }} \right)^{{{ r_{1} - 2 } \over { 2 }}} z^{{{ r_{2} - 2 } \over { 2 }}} \exp \left[ - {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right) \right] {{ r_{1} z } \over { r_{2} }} $$ $W$のマージナル密度関数$g_{1}$は$\displaystyle y:= {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right)$として $$ \begin{align*} g_{1} (w) =& \int_{-\infty}^{\infty} g(w,z) dz \\ =& \int_{-\infty}^{\infty} {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ r_{1} z w } \over { r_{2} }} \right)^{{{ r_{1} - 2 } \over { 2 }}} z^{{{ r_{2} - 2 } \over { 2 }}} \exp \left[ - {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right) \right] {{ r_{1} z } \over { r_{2} }} dz \\ =& \int_{-\infty}^{\infty} {{ (r_{1} / r_{2})^{r_{1} / 2} w^{r_{1}/2 - 1} } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ 2y } \over { {{ r_{1} } \over { r_{2} }} w + 1 }} \right)^{{{ r_{1} + r_{2} } \over { 2 }} - 1} e^{-y} \left( {{ 2 } \over { {{ r_{1} } \over { r_{2} }} w + 1 }} \right) dy \\ =& {{ \Gamma \left( {{ r_{1} + r_{2} } \over { 2 }} \right) \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) }} {{ w^{r_{1}/2 - 1} } \over { \left( 1 + {{ r_{1} } \over { r_{2} }} w \right)^{(r_{1} + r_{2}) / 2} }} \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} w^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} w \right)^{-(r_{1} + r_{2}) / 2} \end{align*} $$ 従って $$ W \sim F (r_{1} , r_{2}) $$


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 193-194. ↩︎