logo

独立した二つのカイ二乗分布からF分布を導出する 📂確率分布論

独立した二つのカイ二乗分布からF分布を導出する

定理

二つの確率変数U,VU,V独立であり、Uχ2(r1)U \sim \chi^{2} ( r_{1})Vχ2(r2)V \sim \chi^{2} ( r_{2})とするならば U/r1V/r2F(r1,r2) {{ U / r_{1} } \over { V / r_{2} }} \sim F \left( r_{1} , r_{2} \right)

説明

二つのデータがカイ二乗分布に従い、独立である場合、その比率を分布理論で説明することができるかもしれない。統計学全般では、標準化された残差の二乗がカイ二乗分布に従うと仮定されるため、F検定を好んで使用する。証明自体が重要なわけではないが、多くの分析でなぜF検定を使用するのかについての洞察を与えるため、数理統計学を学ぶ統計学生にとっては非常に重要な事実である。

導出1

戦略: カイ二乗分布のジョイント密度関数を直接演繹する。

カイ二乗分布の定義: 自由度r>0r > 0に対して次のような確率密度関数を持つ連続確率分布χ2(r)\chi^{2} (r)はカイ二乗分布と呼ばれる。 f(x)=1Γ(r/2)2r/2xr/21ex/2,x(0,) f(x) = {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} \qquad , x \in (0, \infty)

F分布の定義: 自由度r1,r2>0r_{1}, r_{2} > 0に対して次のような確率密度関数を持つ連続確率分布F(r1,r2)F \left( r_{1} , r_{2} \right)はF分布と呼ばれる。 f(x)=1B(r1/2,r2/2)(r1r2)r1/2xr1/21(1+r1r2x)(r1+r2)/2,x(0,) f(x) = {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} \qquad , x \in (0, \infty)


U,VU,Vが独立なのでジョインット密度関数はu,v(0,)u,v \in (0,\infty)に対して次のようになる。 h(u,v)=1Γ(r12)Γ(r22)2(r1+r2)/2ur1/21vr2/21e(u+v)/2 h(u,v) = {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} u^{r_{1}/2 - 1} v^{r_{2}/2 - 1} e^{-(u+v)/2} 今、W:=U/r1V/r2\displaystyle W:= {{ U/r_{1} } \over { V / r_{2} }}Z:=VZ := Vとするならばu=(r1/r2)zwu = (r_{1}/r_{2})zwであり、v=zv = zなので J=(r1/r2)z(r1/r2)w01=(r1/r2)z0 \left| J \right| = \begin{vmatrix} (r_{1}/r_{2})z & (r_{1}/r_{2})w \\ 0 & 1 \end{vmatrix} = (r_{1}/r_{2})z \ne 0 従って、W,ZW,Zのジョイント密度関数はw,z(0,)w,z \in (0,\infty)に対して g(w,z)=1Γ(r12)Γ(r22)2(r1+r2)/2(r1zwr2)r122zr222exp[z2(r1wr2+1)]r1zr2 g(w,z) = {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ r_{1} z w } \over { r_{2} }} \right)^{{{ r_{1} - 2 } \over { 2 }}} z^{{{ r_{2} - 2 } \over { 2 }}} \exp \left[ - {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right) \right] {{ r_{1} z } \over { r_{2} }} WWマージナル密度関数g1g_{1}y:=z2(r1wr2+1)\displaystyle y:= {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right)として g1(w)=g(w,z)dz=1Γ(r12)Γ(r22)2(r1+r2)/2(r1zwr2)r122zr222exp[z2(r1wr2+1)]r1zr2dz=(r1/r2)r1/2wr1/21Γ(r12)Γ(r22)2(r1+r2)/2(2yr1r2w+1)r1+r221ey(2r1r2w+1)dy=Γ(r1+r22)(r1r2)r1/2Γ(r12)Γ(r22)wr1/21(1+r1r2w)(r1+r2)/2=1B(r1/2,r2/2)(r1r2)r1/2wr1/21(1+r1r2w)(r1+r2)/2 \begin{align*} g_{1} (w) =& \int_{-\infty}^{\infty} g(w,z) dz \\ =& \int_{-\infty}^{\infty} {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ r_{1} z w } \over { r_{2} }} \right)^{{{ r_{1} - 2 } \over { 2 }}} z^{{{ r_{2} - 2 } \over { 2 }}} \exp \left[ - {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right) \right] {{ r_{1} z } \over { r_{2} }} dz \\ =& \int_{-\infty}^{\infty} {{ (r_{1} / r_{2})^{r_{1} / 2} w^{r_{1}/2 - 1} } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ 2y } \over { {{ r_{1} } \over { r_{2} }} w + 1 }} \right)^{{{ r_{1} + r_{2} } \over { 2 }} - 1} e^{-y} \left( {{ 2 } \over { {{ r_{1} } \over { r_{2} }} w + 1 }} \right) dy \\ =& {{ \Gamma \left( {{ r_{1} + r_{2} } \over { 2 }} \right) \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) }} {{ w^{r_{1}/2 - 1} } \over { \left( 1 + {{ r_{1} } \over { r_{2} }} w \right)^{(r_{1} + r_{2}) / 2} }} \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} w^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} w \right)^{-(r_{1} + r_{2}) / 2} \end{align*} 従って WF(r1,r2) W \sim F (r_{1} , r_{2})


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 193-194. ↩︎