カイ二乗分布
定義 1
自由度 $r > 0$に対して、以下のような確率密度関数を持つ連続確率分布 $\chi^{2} (r)$をカイ二乗分布chi-square distributionと言う。 $$ f(x) = {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} \qquad , x \in (0, \infty) $$
- $\Gamma$はガンマ関数を示す。
基本性質
モーメント生成関数
- [1]: $$m(t) = (1-2t)^{-r/2} \qquad , t < {{ 1 } \over { 2 }}$$
平均と分散
- [2] 平均と分散が$X \sim \chi^{2} (r)$である場合、 $$ \begin{align*} E(X) =& r \\ \operatorname{Var} (X) =& 2r \end{align*} $$
十分統計量
- [3]: カイ二乗分布に従うランダムサンプル $\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \chi^{2} (r)$が与えられたとする。$r$に対する十分統計量 $T$は次の通り。 $$ T = \left( \prod_{i} X_{i} \right) $$
定理
$k$次モーメント
- [a]: $X \sim \chi^{2} (r)$とする。$k > - r/ 2$の場合、$k$次モーメントが存在し、 $$ E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }} $$
ガンマ分布との関係
- [b]: $$\Gamma \left( { r \over 2 } , 2 \right) \iff \chi ^2 (r)$$
F分布の導出
- [c]: 2つの確率変数$U,V$が独立であり、$U \sim \chi^{2} ( r_{1})$、$V \sim \chi^{2} ( r_{2})$である場合、 $$ {{ U / r_{1} } \over { V / r_{2} }} \sim F \left( r_{1} , r_{2} \right) $$
標準正規分布の二乗との関係
- [d]: $X \sim N(\mu,\sigma ^2)$の場合、 $$ V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1) $$
説明
カイ二乗分布は、統計学全般で広く使用される分布で、特に適合度検定や分散分析などで最初に遭遇することが多い。
定理[d]は特に重要で、この定理の逆命題によって、標準化された残差residualsの二乗がカイ二乗分布$\chi^{2} (1)$に従わない場合、残差の正規性に問題があることを検出することができる。
証明
戦略 [1], [a]: 置換積分を通じて定積分記号の中にある物を外へ出し、ガンマ関数に変えるトリックを使用する。
ガンマ関数の定義: $$ \Gamma (x) := \int_{0}^{\infty} y^{x-1} e^{y} dy $$
[1]
$y=x(1/2-t)$のように置換すると、${{ 1 } \over { 1/2 - t }}dy = dx$であるため、 $$ \begin{align*} m(t) =& \int_{0}^{\infty} e^{tx} {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} dx \\ =& {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} \int_{0}^{\infty} x^{r/2-1} e^{x(1/2-t)} dx \\ =& {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} \int_{0}^{\infty} \left( {{ y } \over { 1/2 -t }} \right)^{r/2-1} e^{y} {{ 1 } \over { 1/2 - t }} dy \\ =& (1/2-t)^{-r/2}{{ 1 } \over { \Gamma (r/2) 2^{r/2} }} \int_{0}^{\infty} y^{r/2-1} e^{y} dy \\ =& (1-2t)^{-r/2}{{ 1 } \over { \Gamma (r/2) }} \int_{0}^{\infty} y^{r/2-1} e^{y} dy \end{align*} $$ ガンマ関数の定義により、 $$ m(t) = (1-2t)^{-r/2} \qquad , t < {{ 1 } \over { 2 }} $$
■
[2]
■
[a]
$y = x/2$のように置換すると、$2 dy = dx$であるため、 $$ \begin{align*} EX^{k} =& \int_{0}^{\infty} x^{k} {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} dx \\ =& {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} \int_{0}^{\infty} x^{r/2+k-1} e^{-x/2} dx \\ =& {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} \int_{0}^{\infty} 2^{r/2+k-1} y^{r/2+k-1} e^{-y} 2dy \\ =& {{ 2^{k} } \over { \Gamma (r/2) }} \int_{0}^{\infty} y^{(r/2+k)-1} e^{-y} 2dy \end{align*} $$ ガンマ関数の定義により、 $$ E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }} $$
■
[b]
■
[c]
■
[d]
■
参照
一般化: 非中心カイ二乗分布
Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p161. ↩︎