F分布
定義 1
自由度 $r_{1}, r_{2} > 0$ に対して以下の確率密度関数を持つ連続確率分布 $F \left( r_{1} , r_{2} \right)$ をF分布という。 $$ f(x) = {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} \qquad , x \in (0, \infty) $$
- $B(r_{1} / 2, r_{2}/2)$ はベータ関数を意味する。
基本性質
モーメント生成関数
平均と分散
- [2]: $X \sim F ( r_{1} , r_{2})$ の場合 $$ \begin{align*} E(X) =& {{ r_{2} } \over { r_{2} - 2 }} & \qquad , r_{2} > 2 \\ \operatorname{Var}(X) =& {{ 2 r_{2}^{2} (r_{1} + r_{2} - 2) } \over { r_{1} (r_{2} -2)^{2} (r_{2} - 4) }} & \qquad , r_{2} > 4 \end{align*} $$
定理
二つの確率変数 $U,V$ が独立で、$U \sim \chi^{2} ( r_{1})$、$V \sim \chi^{2} ( r_{2})$ だとする。
$k$次のモーメント
- [a]: $d_{2} > 2k$ の場合 $\displaystyle F := {{ U / r_{1} } \over { V / r_{2} }}$ は$k$次のモーメントが存在し、 $$ E F^{k} = \left( {{ r_{2} } \over { r_{1} }} \right)^{k} E U^{k} E V^{-k} $$
カイ二乗分布から導出
- [b]: $${{ U / r_{1} } \over { V / r_{2} }} \sim F \left( r_{1} , r_{2} \right)$$
ベータ分布から導出
- [c]: 自由度 $r_{1} , r_{2}$ のF分布に従う確率変数 $X \sim F \left( r_{1}, r_{2} \right)$ に対して次のように定義された$Y$ は、ベータ分布 $\text{Best} \left( {{ r_{1} } \over { 2 }} , {{ r_{2} } \over { 2 }} \right)$ に従う。 $$ Y := {{ \left( r_{1} / r_{2} \right) X } \over { 1 + \left( r_{1} / r_{2} \right) X }} \sim \text{Beta} \left( {{ r_{1} } \over { 2 }} , {{ r_{2} } \over { 2 }} \right) $$
t分布から導出
- [d]: 自由度 $\nu > 0$ のt分布に従う確率変数 $X \sim t(\nu)$ に対して次のように定義された$Y$ は、F分布 $F (1,\nu)$ に従う。 $$ Y := X^{2} \sim F (1,\nu) $$
相互性reciprocality
- [e]: $X \sim F \left( r_{1}, r_{2} \right)$ の場合、その逆数の分布は次のようになる。 $$ {{ 1 } \over { X }} \sim F \left( r_{2}, r_{1} \right) $$
- $\chi^{2} \left( r \right)$ は自由度 $r$ のカイ二乗分布だ。
説明
t分布がスチューデントstudent t分布と呼ばれるように、F分布も統計学者ジョージ・スネデコーの名前を取ってスネデコーsnedecor F分布と呼ばれることがある。2
F分布の確率密度関数は一見複雑に見えるが、実際には式を操作する必要はほとんどなく、カイ二乗分布との関係をよく理解することが最優先だ。カイ二乗分布が適合度検定に使用されたように、F分布は二つの母集団の分散を比較する際に使用できる。定理[b]で直接確認できるように、F分布はカイ二乗分布に従うデータの比として表されるため、この統計量が$1$から遠く離れている場合は、二つの分布の分散が異なると推測できるのだ。
証明
1
確率変数のモーメント生成関数が存在するとは、すべての$k \in \mathbb{N}$ に対して$k$次のモーメントが存在することを意味する。しかし、定理[a]でのF分布の$k$次のモーメントは$k < d_{2} / 2$ のときに存在するため、モーメント生成関数は存在しえない。
■
[2]
■
[a]
$t = {{ r_{1} } \over { r_{2} }} x$ と置換すると$dt = {{ r_{1} } \over { r_{2} }} dx$ となるので、 $$ \begin{align*} E F^{k} =& \int_{0}^{\infty} x^{k} {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} dx \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} \int_{0}^{\infty} x^{k + r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} dx \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} \int_{0}^{\infty} \left( {{ r_{2} } \over { r_{1} }} t \right)^{k + r_{1} / 2 - 1} \left( 1 + t \right)^{-(r_{1} + r_{2}) / 2} {{ r_{2} } \over { r_{1} }} dt \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} \left( {{ r_{2} } \over { r_{1} }} \right)^{k + r_{1} / 2}\int_{0}^{\infty} t^{k + r_{1} / 2 } \left( 1 + t \right)^{-r_{1}/2 - r_{2}/ 2} dt \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{2} } \over { r_{1} }} \right)^{k }\int_{0}^{\infty} t^{k + r_{1} / 2 } \left( 1 + t \right)^{-(r_{1}/2+k) - (r_{2}/ 2-k)} dt \end{align*} $$
ベータ関数の定積分形式の表示: $$ B(p,q)=\int_{0}^{\infty}\frac{ t^{p-1} }{ (1+t)^{p+q}}dt $$
ベータ関数とガンマ関数の関係: $$ B(p,q) = {{\Gamma (p) \Gamma (q)} \over {\Gamma (p+q) }} $$
$$ \begin{align*} EF^{k} =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{2} } \over { r_{1} }} \right)^{k } B \left( {{ r_{1} } \over { 2 }} + k, {{ r_{2} } \over { 2 }} - k \right) \\ =& \left( {{ r_{2} } \over { r_{1} }} \right)^{k } {{ \Gamma (r_{1}/2 + r_{2}/2) } \over { \Gamma (r_{1}/2 ) \Gamma ( r_{2}/2) }} {{ \Gamma (r_{1}/2 + k) \Gamma ( r_{2}/2 - k) } \over { \Gamma (r_{1}/2 +k + r_{2}/2 - k) }} \\ =& \left( {{ r_{2} } \over { r_{1} }} \right)^{k } {{ 1 } \over { \Gamma (r_{1}/2 ) \Gamma ( r_{2}/2) }} {{ \Gamma (r_{1}/2 + k) \Gamma ( r_{2}/2 - k) } \over { 1 }} \\ =& \left( {{ r_{2} } \over { r_{1} }} \right)^{k } {{ \Gamma (r_{1}/2 + k) 2^{k}} \over { \Gamma (r_{1}/2 ) }} {{ 2^{-k} \Gamma ( r_{2}/2 - k) } \over { \Gamma ( r_{2}/2) }} \end{align*} $$
カイ二乗分布のモーメント: $X \sim \chi^{2} (r)$ とする。$k > - r/ 2$ の場合、$k$次のモーメントが存在する $$ E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }} $$
$$ E F^{k} = \left( {{ r_{2} } \over { r_{1} }} \right)^{k } E U^{k} E V^{-k} $$
■
[b]
■
[c]
■
[d]
■
[e]
分子と分母が逆転しているので、定理[b]に従って自明だ。実用的な統計学者の視点からは、定理[b]に従ってF分布を定義し、それに基づいて確率密度関数を導出する方が自然だ。
■