標準正規分布の二乗は、自由度1のカイ二乗分布に従うことを証明
定理
$X \sim N(\mu,\sigma ^2)$ならば $$ V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1) $$
- $N \left( \mu , \sigma^{2} \right)$は平均が$\mu$で分散が$\sigma^{2}$の正規分布だ。
- $\chi^{2} \left( 1 \right)$は自由度$1$のカイ二乗分布だ。
説明
一般的に、これを一般化したスチューデントの定理がよく使われる。
統計学を勉強する者なら、標準正規分布の二乗がカイ二乗分布に従うというのを当然として知っていなければならない。何かのデータが正規分布に従うと仮定できる時、標準化されたデータの分散が過度に高かったり低かったりするなら、何か問題があるとすぐに推測できる。当然、多くの統計的検定に応用され、それについての理論的な直感があるかないかは、天と地の差だ。
一方で逆に考えると、カイ二乗分布の定義を先に思い浮かべてその性質を探るよりも、最初から標準正規分布に従うデータの二乗、たぶん残差の二乗がどんな分布に従うかを研究していてカイ二乗分布を発見する方がもっと常識的だ。
証明 1
$\displaystyle W := {(X-\mu) \over \sigma }$とすると$W \sim N(0,1)$になる。
標準正規分布の定義: 次のような確率密度関数を持つ正規分布$N \left( 0,1^{2} \right)$を標準正規分布という。 $$ f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right] $$
$V$の累積分布関数を$F$とすると $$ \begin{align*} F(v) =& P(V \le v) \\ =& P \left( W^2 \le v \right) \\ =& P \left( \sqrt{v} \le W \le \sqrt{v} \right) \\ =& \int_{-\sqrt{v}}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw \\ =& 2 \int_{0}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw \end{align*} $$ $w := \sqrt{x}$と置き換えると $$ F(v) = 2\int_{0}^{v} { 1 \over \sqrt{ 2 \pi } } e^{-{{x} \over 2}} {1 \over {2 \sqrt{x} } } dx $$ 積分学の基本定理により、$v$の確率密度関数$f$は $$ f(v) = F ' (v) = { 1 \over {\sqrt{ 2 \pi } } } e^{-{{v} \over 2}}{ 1 \over {v^{1 \over 2}} } $$
オイラーの反射公式: $$ {\Gamma (1-x) \Gamma ( x )} = { {\pi} \over {\sin \pi x } } $$
反射公式により$\displaystyle \sqrt{\pi} = \Gamma \left( {{ 1 } \over { 2 }} \right)$なので $$ f(v) = { 1 \over { \Gamma ({1 \over 2}) 2^{1 \over 2} } } v^{ - {1 \over 2} } e^{-{{v} \over 2}} $$
ガンマ分布の定義: $k, \theta > 0$に対して次のような確率密度関数を持つ連続確率分布$\Gamma ( k , \theta )$をガンマ分布という。 $$ f(x) = {{ 1 } \over { \Gamma ( k ) \theta^{k} }} x^{k - 1} e^{ - x / \theta} \qquad , x > 0 $$
結論として、$V$はガンマ分布$\displaystyle \Gamma \left( {{ 1 } \over { 2 }} , 2 \right)$の確率密度関数を持つ。
ガンマ分布とカイ二乗分布の関係: $$ \Gamma \left( { r \over 2 } , 2 \right) \iff \chi ^2 (r) $$
したがって、$\displaystyle \Gamma \left( {1 \over 2}, 2 \right) \sim \chi^2 (1)$であり $$ \left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1) $$
■
Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 175-176. ↩︎