logo

スチューデントのt分布の極限分布としての標準正規分布の導出 📂確率分布論

スチューデントのt分布の極限分布としての標準正規分布の導出

定理

Tnt(n)T_n \sim t(n) ならば Tn DN(0,1) T_n \ \overset{D}{\to} N(0,1)


  • N(μ,σ2)N \left( \mu , \sigma^{2} \right) は平均が μ\mu で分散が σ2\sigma^{2}正規分布だ。
  • t(r)t(r) は自由度 rrt-分布だ。
  • D\overset{D}{\to} はそれぞれ分布収束を意味する。

もともと学生のt-分布は、サンプルサイズが小さい時に統計的分析をするために生まれた。サンプルサイズが大きくなると、標準正規分布と似てくるが、統計学的な用語では分布収束すると言う。だから、特別な過程がなくても、ただサンプルが多ければ標準正規分布が導かれる。

導出

t-分布の定義: 自由度 ν>0\nu > 0 に対する次のような確率密度関数をもつ連続確率分布 t(ν)t \left( \nu \right) をt-分布と言う。 f(x)=Γ(ν+12)νπΓ(ν2)(1+x2ν)ν+12,xR f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R}

標準正規分布の定義: 次のような確率密度関数をもつ正規分布 N(0,12)N \left( 0,1^{2} \right)標準正規分布と言う。 f(z)=12πexp[z22] f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right]

Fn(t)=tΓ((n+1)/2)πnΓ(n/2)1(1+y2/n)(n+1)/2dy F_n(t) = \int_{-\infty}^{t} {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } dy TnT_n の累積分布関数は上記の通りである。FnF_{n} の連続性により limnFn(t)=limntfn(y)dy=tlimnfn(y)dy \lim_{n \to \infty} F_n (t) = \lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy = \int_{-\infty}^{t} \lim_{n \to \infty} f_n (y) dy Γ(1/2)=π\Gamma (1/2) = \sqrt{\pi} なので fn(y)2f1(y)=1π21+y2\displaystyle |f_n (y)| \le 2 f_1 (y) = { {1} \over {\pi} } { {2} \over {1 + y^2 } } であり、アークタンジェント関数の微分法によると limntfn(y)dy<t2f1(y)dy=2πtan1t< \displaystyle\lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy< \int_{-\infty}^{t} 2 f_1 (y) dy = { {2} \over {\pi} } \tan ^{-1} t < \infty 今、limnfn(y)\displaystyle \lim_{n \to \infty} f_n (y) が具体的にどこに収束するかを示せばいい。まず、fnf_n を次のように分けてみよう。 fn(y)=Γ((n+1)/2)πnΓ(n/2)1(1+y2/n)(n+1)/2=Γ((n+1)/2)n/2Γ(n/2)12π(1+y2/n)(n+1)/2=Γ((n+1)/2)n/2Γ(n/2)1(1+y2/n)1/212π(1+y2n)n/2 \begin{align*} f_{n} (y) =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over { \sqrt{2 \pi} (1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over {(1 + y^{2} / n)^{1/2} } } \cdot { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} \end{align*}

スターリング近似: limnn!enlnnn2πn=1 \lim_{n \to \infty} {{n!} \over {e^{n \ln n - n} \sqrt{ 2 \pi n} }} = 1

最初の因子の極限から求めよう。

1 スターリング近似により、十分に大きな nNn \in \mathbb{N} に対して Γ(n)enlnnn2πn=(ne)n2πn \Gamma (n) \approx e^{n \ln n - n } \sqrt{ 2 \pi n} = \left( {{ n } \over { e }} \right)^{n} \sqrt { 2 \pi n } とすると、十分に大きな nn に対して Γ((n+1)/2)n/2Γ(n/2)2n(n+12e)n+122π(n+1)(n2e)n22πn2nn+12e(n+1n)n/2n+1n1e(1+1n)n/2 \begin{align*} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} \approx& \sqrt{ {{ 2 } \over { n }} } {{ \left( {{ n+1 } \over { 2e }} \right)^{{{ n+1 } \over { 2 }}} \sqrt{ 2 \pi (n+1)} } \over { \cdot \left( {{ n } \over { 2e }} \right)^{{{ n } \over { 2 }}} \sqrt{ 2 \pi n} }} \\ \approx& \sqrt{ {{ 2 } \over { n }} } \sqrt{ {{ n+1 } \over { 2e }} } \left( {{ n+1 } \over { n }} \right)^{n/2} \sqrt{ {{ n+1 } \over { n }} } \\ \approx& \sqrt{ {{ 1 } \over { e }}} \left( 1 + {{ 1 } \over { n }} \right)^{n/2} \end{align*} なので limnΓ((n+1)/2)n/2Γ(n/2)=1 \lim_{n \to \infty} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} = 1 で、二番目の因子は limn1(1+y2/n)1/2=1 \lim_{n \to \infty} { {1} \over {(1 + y^{2} / n)^{1/2} } } =1 で、三番目の因子は limn12π(1+y2n)n/2=12πey2/2 \lim_{n \to \infty} { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} = { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} だ。すなわち、 Fn(t)=t12πey2/2dy F_n(t) = \int_{-\infty}^{t} { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} dy したがって、TnT_n は標準正規分布に従う確率変数に分布収束する。