logo

スチューデントのt分布の極限分布としての標準正規分布の導出 📂確率分布論

スチューデントのt分布の極限分布としての標準正規分布の導出

定理

$T_n \sim t(n)$ ならば $$ T_n \ \overset{D}{\to} N(0,1) $$


  • $N \left( \mu , \sigma^{2} \right)$ は平均が $\mu$ で分散が $\sigma^{2}$ の正規分布だ。
  • $t(r)$ は自由度 $r$ のt-分布だ。
  • $\overset{D}{\to}$ はそれぞれ分布収束を意味する。

もともと学生のt-分布は、サンプルサイズが小さい時に統計的分析をするために生まれた。サンプルサイズが大きくなると、標準正規分布と似てくるが、統計学的な用語では分布収束すると言う。だから、特別な過程がなくても、ただサンプルが多ければ標準正規分布が導かれる。

導出

t-分布の定義: 自由度 $\nu > 0$ に対する次のような確率密度関数をもつ連続確率分布 $t \left( \nu \right)$ をt-分布と言う。 $$ f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R} $$

標準正規分布の定義: 次のような確率密度関数をもつ正規分布 $N \left( 0,1^{2} \right)$ を標準正規分布と言う。 $$ f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right] $$

$$ F_n(t) = \int_{-\infty}^{t} {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } dy $$ $T_n$ の累積分布関数は上記の通りである。$F_{n}$ の連続性により $$ \lim_{n \to \infty} F_n (t) = \lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy = \int_{-\infty}^{t} \lim_{n \to \infty} f_n (y) dy $$ $\Gamma (1/2) = \sqrt{\pi} $ なので $\displaystyle |f_n (y)| \le 2 f_1 (y) = { {1} \over {\pi} } { {2} \over {1 + y^2 } }$ であり、アークタンジェント関数の微分法によると $$ \displaystyle\lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy< \int_{-\infty}^{t} 2 f_1 (y) dy = { {2} \over {\pi} } \tan ^{-1} t < \infty $$ 今、$\displaystyle \lim_{n \to \infty} f_n (y)$ が具体的にどこに収束するかを示せばいい。まず、$f_n$ を次のように分けてみよう。 $$ \begin{align*} f_{n} (y) =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over { \sqrt{2 \pi} (1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over {(1 + y^{2} / n)^{1/2} } } \cdot { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} \end{align*} $$

スターリング近似: $$ \lim_{n \to \infty} {{n!} \over {e^{n \ln n - n} \sqrt{ 2 \pi n} }} = 1 $$

最初の因子の極限から求めよう。

1 スターリング近似により、十分に大きな $n \in \mathbb{N}$ に対して $$ \Gamma (n) \approx e^{n \ln n - n } \sqrt{ 2 \pi n} = \left( {{ n } \over { e }} \right)^{n} \sqrt { 2 \pi n } $$ とすると、十分に大きな $n$ に対して $$ \begin{align*} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} \approx& \sqrt{ {{ 2 } \over { n }} } {{ \left( {{ n+1 } \over { 2e }} \right)^{{{ n+1 } \over { 2 }}} \sqrt{ 2 \pi (n+1)} } \over { \cdot \left( {{ n } \over { 2e }} \right)^{{{ n } \over { 2 }}} \sqrt{ 2 \pi n} }} \\ \approx& \sqrt{ {{ 2 } \over { n }} } \sqrt{ {{ n+1 } \over { 2e }} } \left( {{ n+1 } \over { n }} \right)^{n/2} \sqrt{ {{ n+1 } \over { n }} } \\ \approx& \sqrt{ {{ 1 } \over { e }}} \left( 1 + {{ 1 } \over { n }} \right)^{n/2} \end{align*} $$ なので $$ \lim_{n \to \infty} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} = 1 $$ で、二番目の因子は $$ \lim_{n \to \infty} { {1} \over {(1 + y^{2} / n)^{1/2} } } =1 $$ で、三番目の因子は $$ \lim_{n \to \infty} { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} = { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} $$ だ。すなわち、 $$ F_n(t) = \int_{-\infty}^{t} { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} dy $$ したがって、$T_n$ は標準正規分布に従う確率変数に分布収束する。