logo

F分布 📂確率分布論

F分布

定義 1

自由度 r1,r2>0r_{1}, r_{2} > 0 に対して以下の確率密度関数を持つ連続確率分布 F(r1,r2)F \left( r_{1} , r_{2} \right)F分布という。 f(x)=1B(r1/2,r2/2)(r1r2)r1/2xr1/21(1+r1r2x)(r1+r2)/2,x(0,) f(x) = {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} \qquad , x \in (0, \infty)


  • B(r1/2,r2/2)B(r_{1} / 2, r_{2}/2)ベータ関数を意味する。

基本性質

モーメント生成関数

平均と分散

  • [2]: XF(r1,r2)X \sim F ( r_{1} , r_{2}) の場合 E(X)=r2r22,r2>2Var(X)=2r22(r1+r22)r1(r22)2(r24),r2>4 \begin{align*} E(X) =& {{ r_{2} } \over { r_{2} - 2 }} & \qquad , r_{2} > 2 \\ \Var(X) =& {{ 2 r_{2}^{2} (r_{1} + r_{2} - 2) } \over { r_{1} (r_{2} -2)^{2} (r_{2} - 4) }} & \qquad , r_{2} > 4 \end{align*}

定理

二つの確率変数 U,VU,V独立で、Uχ2(r1)U \sim \chi^{2} ( r_{1})Vχ2(r2)V \sim \chi^{2} ( r_{2}) だとする。

kk次のモーメント

  • [a]: d2>2kd_{2} > 2k の場合 F:=U/r1V/r2\displaystyle F := {{ U / r_{1} } \over { V / r_{2} }}kk次のモーメントが存在し、 EFk=(r2r1)kEUkEVk E F^{k} = \left( {{ r_{2} } \over { r_{1} }} \right)^{k} E U^{k} E V^{-k}

カイ二乗分布から導出

  • [b]: U/r1V/r2F(r1,r2){{ U / r_{1} } \over { V / r_{2} }} \sim F \left( r_{1} , r_{2} \right)

ベータ分布から導出

  • [c]: 自由度 r1,r2r_{1} , r_{2}F分布に従う確率変数 XF(r1,r2)X \sim F \left( r_{1}, r_{2} \right) に対して次のように定義されたYY は、ベータ分布 Best(r12,r22)\text{Best} \left( {{ r_{1} } \over { 2 }} , {{ r_{2} } \over { 2 }} \right) に従う。 Y:=(r1/r2)X1+(r1/r2)XBeta(r12,r22) Y := {{ \left( r_{1} / r_{2} \right) X } \over { 1 + \left( r_{1} / r_{2} \right) X }} \sim \text{Beta} \left( {{ r_{1} } \over { 2 }} , {{ r_{2} } \over { 2 }} \right)

t分布から導出

  • [d]: 自由度 ν>0\nu > 0t分布に従う確率変数 Xt(ν)X \sim t(\nu) に対して次のように定義されたYY は、F分布 F(1,ν)F (1,\nu) に従う。 Y:=X2F(1,ν) Y := X^{2} \sim F (1,\nu)

相互性reciprocality

  • [e]: XF(r1,r2)X \sim F \left( r_{1}, r_{2} \right) の場合、その逆数の分布は次のようになる。 1XF(r2,r1) {{ 1 } \over { X }} \sim F \left( r_{2}, r_{1} \right)

説明

t分布がスチューデントstudent t分布と呼ばれるように、F分布も統計学者ジョージ・スネデコーの名前を取ってスネデコーsnedecor F分布と呼ばれることがある。2

F分布の確率密度関数は一見複雑に見えるが、実際には式を操作する必要はほとんどなく、カイ二乗分布との関係をよく理解することが最優先だ。カイ二乗分布が適合度検定に使用されたように、F分布は二つの母集団の分散を比較する際に使用できる。定理[b]で直接確認できるように、F分布はカイ二乗分布に従うデータの比として表されるため、この統計量が11から遠く離れている場合は、二つの分布の分散が異なると推測できるのだ。

証明

1

確率変数のモーメント生成関数が存在するとは、すべてのkNk \in \mathbb{N} に対してkk次のモーメントが存在することを意味する。しかし、定理[a]でのF分布のkk次のモーメントはk<d2/2k < d_{2} / 2 のときに存在するため、モーメント生成関数は存在しえない。

[2]

定理[a]に記載されたモーメント公式を使用する。

[a]

t=r1r2xt = {{ r_{1} } \over { r_{2} }} x と置換するとdt=r1r2dxdt = {{ r_{1} } \over { r_{2} }} dx となるので、 EFk=0xk1B(r1/2,r2/2)(r1r2)r1/2xr1/21(1+r1r2x)(r1+r2)/2dx=1B(r1/2,r2/2)(r1r2)r1/20xk+r1/21(1+r1r2x)(r1+r2)/2dx=1B(r1/2,r2/2)(r1r2)r1/20(r2r1t)k+r1/21(1+t)(r1+r2)/2r2r1dt=1B(r1/2,r2/2)(r1r2)r1/2(r2r1)k+r1/20tk+r1/2(1+t)r1/2r2/2dt=1B(r1/2,r2/2)(r2r1)k0tk+r1/2(1+t)(r1/2+k)(r2/2k)dt \begin{align*} E F^{k} =& \int_{0}^{\infty} x^{k} {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} dx \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} \int_{0}^{\infty} x^{k + r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} dx \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} \int_{0}^{\infty} \left( {{ r_{2} } \over { r_{1} }} t \right)^{k + r_{1} / 2 - 1} \left( 1 + t \right)^{-(r_{1} + r_{2}) / 2} {{ r_{2} } \over { r_{1} }} dt \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} \left( {{ r_{2} } \over { r_{1} }} \right)^{k + r_{1} / 2}\int_{0}^{\infty} t^{k + r_{1} / 2 } \left( 1 + t \right)^{-r_{1}/2 - r_{2}/ 2} dt \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{2} } \over { r_{1} }} \right)^{k }\int_{0}^{\infty} t^{k + r_{1} / 2 } \left( 1 + t \right)^{-(r_{1}/2+k) - (r_{2}/ 2-k)} dt \end{align*}

ベータ関数の定積分形式の表示: B(p,q)=0tp1(1+t)p+qdt B(p,q)=\int_{0}^{\infty}\frac{ t^{p-1} }{ (1+t)^{p+q}}dt

ベータ関数とガンマ関数の関係: B(p,q)=Γ(p)Γ(q)Γ(p+q) B(p,q) = {{\Gamma (p) \Gamma (q)} \over {\Gamma (p+q) }}

EFk=1B(r1/2,r2/2)(r2r1)kB(r12+k,r22k)=(r2r1)kΓ(r1/2+r2/2)Γ(r1/2)Γ(r2/2)Γ(r1/2+k)Γ(r2/2k)Γ(r1/2+k+r2/2k)=(r2r1)k1Γ(r1/2)Γ(r2/2)Γ(r1/2+k)Γ(r2/2k)1=(r2r1)kΓ(r1/2+k)2kΓ(r1/2)2kΓ(r2/2k)Γ(r2/2) \begin{align*} EF^{k} =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{2} } \over { r_{1} }} \right)^{k } B \left( {{ r_{1} } \over { 2 }} + k, {{ r_{2} } \over { 2 }} - k \right) \\ =& \left( {{ r_{2} } \over { r_{1} }} \right)^{k } {{ \Gamma (r_{1}/2 + r_{2}/2) } \over { \Gamma (r_{1}/2 ) \Gamma ( r_{2}/2) }} {{ \Gamma (r_{1}/2 + k) \Gamma ( r_{2}/2 - k) } \over { \Gamma (r_{1}/2 +k + r_{2}/2 - k) }} \\ =& \left( {{ r_{2} } \over { r_{1} }} \right)^{k } {{ 1 } \over { \Gamma (r_{1}/2 ) \Gamma ( r_{2}/2) }} {{ \Gamma (r_{1}/2 + k) \Gamma ( r_{2}/2 - k) } \over { 1 }} \\ =& \left( {{ r_{2} } \over { r_{1} }} \right)^{k } {{ \Gamma (r_{1}/2 + k) 2^{k}} \over { \Gamma (r_{1}/2 ) }} {{ 2^{-k} \Gamma ( r_{2}/2 - k) } \over { \Gamma ( r_{2}/2) }} \end{align*}

カイ二乗分布のモーメント: Xχ2(r)X \sim \chi^{2} (r) とする。k>r/2k > - r/ 2 の場合、kk次のモーメントが存在する EXk=2kΓ(r/2+k)Γ(r/2) E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }}

EFk=(r2r1)kEUkEVk E F^{k} = \left( {{ r_{2} } \over { r_{1} }} \right)^{k } E U^{k} E V^{-k}

[b]

ジョイント密度関数から直接導く。

[c]

変数変換で直接導く。

[d]

カイ二乗分布の比として遠回りする。

[e]

分子と分母が逆転しているので、定理[b]に従って自明だ。実用的な統計学者の視点からは、定理[b]に従ってF分布を定義し、それに基づいて確率密度関数を導出する方が自然だ。

参照

一般化: 非中心F分布


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p194. ↩︎

  2. Casella. (2001). Statistical Inference(2nd Edition): p222. ↩︎