스튜던트 t-분포의 극한분포로써 표준정규분포 유도 📂분포이론

스튜던트 t-분포의 극한분포로써 표준정규분포 유도

Standard Normal Distribution as Limiting Distribution of t-Distribution

정리

$T_n \sim t(n)$ 이면 $$ T_n \ \overset{D}{\to} N(0,1) $$


  • $N \left( \mu , \sigma^{2} \right)$ 는 평균이 $\mu$ 고 분산이 $\sigma^{2}$ 인 정규 분포다.
  • $t(r)$ 은 자유도 $r$ 인 t-분포다.
  • $\overset{D}{\to}$ 는 각각 분포 수렴을 의미한다.

애초에 스튜던트 t-분포는 표본이 작을 때 통계적 분석을 하기 위해 태어났다. 표본의 크기가 커지면 표준정규분포와 비슷해지는데, 통계학적인 용어로는 분포수렴한다고 말한다. 따라서 별다른 과정이 없더라도 그냥 단순히 표본만 많으면 표준정규분포가 유도된다.

유도

t-분포의 정의: 자유도 $\nu > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $t \left( \nu \right)$ 를 t-분포라고 한다. $$ f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R} $$

표준정규분포의 정의: 다음과 같은 확률 밀도를 함수를 가지는 정규분포 $N \left( 0,1^{2} \right)$ 를 표준정규분포라고 한다. $$ f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right] $$

$$ F_n(t) = \int_{-\infty}^{t} {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } dy $$ $T_n$ 의 누적분포함수는 위와 같이 주어진다. $F_{n}$ 의 연속성에 따라 $$ \lim_{n \to \infty} F_n (t) = \lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy = \int_{-\infty}^{t} \lim_{n \to \infty} f_n (y) dy $$ $\Gamma(1/2) = \sqrt{\pi} $ 이므로 $\displaystyle |f_n (y)| \le 2 f_1 (y) = { {1} \over {\pi} } { {2} \over {1 + y^2 } }$ 이고 아크탄젠트 함수의 미분법에 따라 $$ \displaystyle\lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy< \int_{-\infty}^{t} 2 f_1 (y) dy = { {2} \over {\pi} } \tan ^{-1} t < \infty $$ 이제 $\displaystyle \lim_{n \to \infty} f_n (y)$ 이 구체적으로 어디로 수렴하는지 보이면 된다. 우선 $f_n$ 을 다음과 같이 찢자. $$ \begin{align*} f_{n} (y) =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over { \sqrt{2 \pi} (1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over {(1 + y^{2} / n)^{1/2} } } \cdot { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} \end{align*} $$

스털링 근사: $$ \lim_{n \to \infty} {{n!} \over {e^{n \ln n - n} \sqrt{ 2 \pi n} }} = 1 $$

첫번째 인수의 극한부터 구해보자.

1 스털링 근사에 의해 충분히 큰 $n \in \mathbb{N}$ 에 대해 $$ \Gamma (n) \approx e^{n \ln n - n } \sqrt{ 2 \pi n} = \left( {{ n } \over { e }} \right)^{n} \sqrt { 2 \pi n } $$ 라고 두면 충분히 큰 $n$ 에 대해 $$ \begin{align*} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} \approx& \sqrt{ {{ 2 } \over { n }} } {{ \left( {{ n+1 } \over { 2e }} \right)^{{{ n+1 } \over { 2 }}} \sqrt{ 2 \pi (n+1)} } \over { \cdot \left( {{ n } \over { 2e }} \right)^{{{ n } \over { 2 }}} \sqrt{ 2 \pi n} }} \\ \approx& \sqrt{ {{ 2 } \over { n }} } \sqrt{ {{ n+1 } \over { 2e }} } \left( {{ n+1 } \over { n }} \right)^{n/2} \sqrt{ {{ n+1 } \over { n }} } \\ \approx& \sqrt{ {{ 1 } \over { e }}} \left( 1 + {{ 1 } \over { n }} \right)^{n/2} \end{align*} $$ 이므로 $$ \lim_{n \to \infty} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} = 1 $$ 이고, 두번째 인수는 $$ \lim_{n \to \infty} { {1} \over {(1 + y^{2} / n)^{1/2} } } =1 $$ 이고, 세번째 인수는 $$ \lim_{n \to \infty} { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} = { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} $$ 다. 즉, $$ F_n(t) = \int_{-\infty}^{t} { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} dy $$ 따라서 $T_n$ 은 표준정규분포를 따르는 확률변수로 분포수렴한다.


  1. https://math.stackexchange.com/a/3240565/459895 ↩︎

댓글