logo

스튜던트 t-분포의 극한분포로써 표준정규분포 유도 📂확률분포론

스튜던트 t-분포의 극한분포로써 표준정규분포 유도

정리

Tnt(n)T_n \sim t(n) 이면 Tn DN(0,1) T_n \ \overset{D}{\to} N(0,1)


  • N(μ,σ2)N \left( \mu , \sigma^{2} \right) 는 평균이 μ\mu 고 분산이 σ2\sigma^{2}정규 분포다.
  • t(r)t(r) 은 자유도 rrt-분포다.
  • D\overset{D}{\to} 는 각각 분포 수렴을 의미한다.

애초에 스튜던트 t-분포는 표본이 작을 때 통계적 분석을 하기 위해 태어났다. 표본의 크기가 커지면 표준정규분포와 비슷해지는데, 통계학적인 용어로는 분포수렴한다고 말한다. 따라서 별다른 과정이 없더라도 그냥 단순히 표본만 많으면 표준정규분포가 유도된다.

유도

t-분포의 정의: 자유도 ν>0\nu > 0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 t(ν)t \left( \nu \right) 를 t-분포라고 한다. f(x)=Γ(ν+12)νπΓ(ν2)(1+x2ν)ν+12,xR f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R}

표준정규분포의 정의: 다음과 같은 확률 밀도를 함수를 가지는 정규분포 N(0,12)N \left( 0,1^{2} \right)표준정규분포라고 한다. f(z)=12πexp[z22] f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right]

Fn(t)=tΓ((n+1)/2)πnΓ(n/2)1(1+y2/n)(n+1)/2dy F_n(t) = \int_{-\infty}^{t} {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } dy TnT_n 의 누적분포함수는 위와 같이 주어진다. FnF_{n} 의 연속성에 따라 limnFn(t)=limntfn(y)dy=tlimnfn(y)dy \lim_{n \to \infty} F_n (t) = \lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy = \int_{-\infty}^{t} \lim_{n \to \infty} f_n (y) dy Γ(1/2)=π\Gamma (1/2) = \sqrt{\pi} 이므로 fn(y)2f1(y)=1π21+y2\displaystyle |f_n (y)| \le 2 f_1 (y) = { {1} \over {\pi} } { {2} \over {1 + y^2 } } 이고 아크탄젠트 함수의 미분법에 따라 limntfn(y)dy<t2f1(y)dy=2πtan1t< \displaystyle\lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy< \int_{-\infty}^{t} 2 f_1 (y) dy = { {2} \over {\pi} } \tan ^{-1} t < \infty 이제 limnfn(y)\displaystyle \lim_{n \to \infty} f_n (y) 이 구체적으로 어디로 수렴하는지 보이면 된다. 우선 fnf_n 을 다음과 같이 찢자. fn(y)=Γ((n+1)/2)πnΓ(n/2)1(1+y2/n)(n+1)/2=Γ((n+1)/2)n/2Γ(n/2)12π(1+y2/n)(n+1)/2=Γ((n+1)/2)n/2Γ(n/2)1(1+y2/n)1/212π(1+y2n)n/2 \begin{align*} f_{n} (y) =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over { \sqrt{2 \pi} (1 + y^{2} / n)^{(n+1)/2} } } \\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over {(1 + y^{2} / n)^{1/2} } } \cdot { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} \end{align*}

스털링 근사: limnn!enlnnn2πn=1 \lim_{n \to \infty} {{n!} \over {e^{n \ln n - n} \sqrt{ 2 \pi n} }} = 1

첫번째 인수의 극한부터 구해보자.

1 스털링 근사에 의해 충분히 큰 nNn \in \mathbb{N} 에 대해 Γ(n)enlnnn2πn=(ne)n2πn \Gamma (n) \approx e^{n \ln n - n } \sqrt{ 2 \pi n} = \left( {{ n } \over { e }} \right)^{n} \sqrt { 2 \pi n } 라고 두면 충분히 큰 nn 에 대해 Γ((n+1)/2)n/2Γ(n/2)2n(n+12e)n+122π(n+1)(n2e)n22πn2nn+12e(n+1n)n/2n+1n1e(1+1n)n/2 \begin{align*} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} \approx& \sqrt{ {{ 2 } \over { n }} } {{ \left( {{ n+1 } \over { 2e }} \right)^{{{ n+1 } \over { 2 }}} \sqrt{ 2 \pi (n+1)} } \over { \cdot \left( {{ n } \over { 2e }} \right)^{{{ n } \over { 2 }}} \sqrt{ 2 \pi n} }} \\ \approx& \sqrt{ {{ 2 } \over { n }} } \sqrt{ {{ n+1 } \over { 2e }} } \left( {{ n+1 } \over { n }} \right)^{n/2} \sqrt{ {{ n+1 } \over { n }} } \\ \approx& \sqrt{ {{ 1 } \over { e }}} \left( 1 + {{ 1 } \over { n }} \right)^{n/2} \end{align*} 이므로 limnΓ((n+1)/2)n/2Γ(n/2)=1 \lim_{n \to \infty} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} = 1 이고, 두번째 인수는 limn1(1+y2/n)1/2=1 \lim_{n \to \infty} { {1} \over {(1 + y^{2} / n)^{1/2} } } =1 이고, 세번째 인수는 limn12π(1+y2n)n/2=12πey2/2 \lim_{n \to \infty} { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} = { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} 다. 즉, Fn(t)=t12πey2/2dy F_n(t) = \int_{-\infty}^{t} { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} dy 따라서 TnT_n 은 표준정규분포를 따르는 확률변수로 분포수렴한다.