스튜던트 t-분포의 극한분포로써 표준정규분포 유도
📂확률분포론 스튜던트 t-분포의 극한분포로써 표준정규분포 유도 정리 T n ∼ t ( n ) T_n \sim t(n) T n ∼ t ( n ) 이면
T n → D N ( 0 , 1 )
T_n \ \overset{D}{\to} N(0,1)
T n → D N ( 0 , 1 )
N ( μ , σ 2 ) N \left( \mu , \sigma^{2} \right) N ( μ , σ 2 ) 는 평균이 μ \mu μ 고 분산이 σ 2 \sigma^{2} σ 2 인 정규 분포 다.t ( r ) t(r) t ( r ) 은 자유도 r r r 인 t-분포 다.→ D \overset{D}{\to} → D 는 각각 분포 수렴 을 의미한다.애초에 스튜던트 t-분포 는 표본이 작을 때 통계적 분석을 하기 위해 태어났다. 표본의 크기가 커지면 표준정규분포와 비슷해지는데, 통계학적인 용어로는 분포수렴한다고 말한다. 따라서 별다른 과정이 없더라도 그냥 단순히 표본만 많으면 표준정규분포가 유도된다.
유도 t-분포의 정의 : 자유도 ν > 0 \nu > 0 ν > 0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 t ( ν ) t \left( \nu \right) t ( ν ) 를 t-분포라고 한다.
f ( x ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + x 2 ν ) − ν + 1 2 , x ∈ R
f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R}
f ( x ) = ν π Γ ( 2 ν ) Γ ( 2 ν + 1 ) ( 1 + ν x 2 ) − 2 ν + 1 , x ∈ R
표준정규분포의 정의 : 다음과 같은 확률 밀도를 함수를 가지는 정규분포 N ( 0 , 1 2 ) N \left( 0,1^{2} \right) N ( 0 , 1 2 ) 를 표준정규분포 라고 한다.
f ( z ) = 1 2 π exp [ − z 2 2 ]
f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right]
f ( z ) = 2 π 1 exp [ − 2 z 2 ]
F n ( t ) = ∫ − ∞ t Γ ( ( n + 1 ) / 2 ) π n Γ ( n / 2 ) 1 ( 1 + y 2 / n ) ( n + 1 ) / 2 d y
F_n(t) = \int_{-\infty}^{t} {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } dy
F n ( t ) = ∫ − ∞ t πn Γ ( n /2 ) Γ (( n + 1 ) /2 ) ( 1 + y 2 / n ) ( n + 1 ) /2 1 d y
T n T_n T n 의 누적분포함수는 위와 같이 주어진다. F n F_{n} F n 의 연속성에 따라
lim n → ∞ F n ( t ) = lim n → ∞ ∫ − ∞ t f n ( y ) d y = ∫ − ∞ t lim n → ∞ f n ( y ) d y
\lim_{n \to \infty} F_n (t) = \lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy = \int_{-\infty}^{t} \lim_{n \to \infty} f_n (y) dy
n → ∞ lim F n ( t ) = n → ∞ lim ∫ − ∞ t f n ( y ) d y = ∫ − ∞ t n → ∞ lim f n ( y ) d y
Γ ( 1 / 2 ) = π \Gamma (1/2) = \sqrt{\pi} Γ ( 1/2 ) = π 이므로 ∣ f n ( y ) ∣ ≤ 2 f 1 ( y ) = 1 π 2 1 + y 2 \displaystyle |f_n (y)| \le 2 f_1 (y) = { {1} \over {\pi} } { {2} \over {1 + y^2 } } ∣ f n ( y ) ∣ ≤ 2 f 1 ( y ) = π 1 1 + y 2 2 이고 아크탄젠트 함수의 미분법 에 따라
lim n → ∞ ∫ − ∞ t f n ( y ) d y < ∫ − ∞ t 2 f 1 ( y ) d y = 2 π tan − 1 t < ∞
\displaystyle\lim_{n \to \infty} \int_{-\infty}^{t} f_n (y) dy< \int_{-\infty}^{t} 2 f_1 (y) dy = { {2} \over {\pi} } \tan ^{-1} t < \infty
n → ∞ lim ∫ − ∞ t f n ( y ) d y < ∫ − ∞ t 2 f 1 ( y ) d y = π 2 tan − 1 t < ∞
이제 lim n → ∞ f n ( y ) \displaystyle \lim_{n \to \infty} f_n (y) n → ∞ lim f n ( y ) 이 구체적으로 어디로 수렴하는지 보이면 된다. 우선 f n f_n f n 을 다음과 같이 찢자.
f n ( y ) = Γ ( ( n + 1 ) / 2 ) π n Γ ( n / 2 ) 1 ( 1 + y 2 / n ) ( n + 1 ) / 2 = Γ ( ( n + 1 ) / 2 ) n / 2 Γ ( n / 2 ) ⋅ 1 2 π ( 1 + y 2 / n ) ( n + 1 ) / 2 = Γ ( ( n + 1 ) / 2 ) n / 2 Γ ( n / 2 ) ⋅ 1 ( 1 + y 2 / n ) 1 / 2 ⋅ 1 2 π ( 1 + y 2 n ) − n / 2
\begin{align*}
f_{n} (y) =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } }
\\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over { \sqrt{2 \pi} (1 + y^{2} / n)^{(n+1)/2} } }
\\ =& {{\Gamma ( (n+1)/2 ) } \over { \sqrt{ n/2} \Gamma (n/2) }} \cdot { {1} \over {(1 + y^{2} / n)^{1/2} } } \cdot { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2}
\end{align*}
f n ( y ) = = = πn Γ ( n /2 ) Γ (( n + 1 ) /2 ) ( 1 + y 2 / n ) ( n + 1 ) /2 1 n /2 Γ ( n /2 ) Γ (( n + 1 ) /2 ) ⋅ 2 π ( 1 + y 2 / n ) ( n + 1 ) /2 1 n /2 Γ ( n /2 ) Γ (( n + 1 ) /2 ) ⋅ ( 1 + y 2 / n ) 1/2 1 ⋅ 2 π 1 ( 1 + n y 2 ) − n /2
스털링 근사 :
lim n → ∞ n ! e n ln n − n 2 π n = 1
\lim_{n \to \infty} {{n!} \over {e^{n \ln n - n} \sqrt{ 2 \pi n} }} = 1
n → ∞ lim e n l n n − n 2 πn n ! = 1
첫번째 인수의 극한부터 구해보자.
스털링 근사에 의해 충분히 큰 n ∈ N n \in \mathbb{N} n ∈ N 에 대해
Γ ( n ) ≈ e n ln n − n 2 π n = ( n e ) n 2 π n
\Gamma (n) \approx e^{n \ln n - n } \sqrt{ 2 \pi n} = \left( {{ n } \over { e }} \right)^{n} \sqrt { 2 \pi n }
Γ ( n ) ≈ e n l n n − n 2 πn = ( e n ) n 2 πn
라고 두면 충분히 큰 n n n 에 대해
Γ ( ( n + 1 ) / 2 ) n / 2 Γ ( n / 2 ) ≈ 2 n ( n + 1 2 e ) n + 1 2 2 π ( n + 1 ) ⋅ ( n 2 e ) n 2 2 π n ≈ 2 n n + 1 2 e ( n + 1 n ) n / 2 n + 1 n ≈ 1 e ( 1 + 1 n ) n / 2
\begin{align*}
{{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} \approx& \sqrt{ {{ 2 } \over { n }} } {{ \left( {{ n+1 } \over { 2e }} \right)^{{{ n+1 } \over { 2 }}} \sqrt{ 2 \pi (n+1)} } \over { \cdot \left( {{ n } \over { 2e }} \right)^{{{ n } \over { 2 }}} \sqrt{ 2 \pi n} }}
\\ \approx& \sqrt{ {{ 2 } \over { n }} } \sqrt{ {{ n+1 } \over { 2e }} } \left( {{ n+1 } \over { n }} \right)^{n/2} \sqrt{ {{ n+1 } \over { n }} }
\\ \approx& \sqrt{ {{ 1 } \over { e }}} \left( 1 + {{ 1 } \over { n }} \right)^{n/2}
\end{align*}
n /2 Γ ( n /2 ) Γ (( n + 1 ) /2 ) ≈ ≈ ≈ n 2 ⋅ ( 2 e n ) 2 n 2 πn ( 2 e n + 1 ) 2 n + 1 2 π ( n + 1 ) n 2 2 e n + 1 ( n n + 1 ) n /2 n n + 1 e 1 ( 1 + n 1 ) n /2
이므로
lim n → ∞ Γ ( ( n + 1 ) / 2 ) n / 2 Γ ( n / 2 ) = 1
\lim_{n \to \infty} {{ {\Gamma ( (n+1)/2 ) } } \over { { \sqrt{ n / 2 } \Gamma (n/2) } }} = 1
n → ∞ lim n /2 Γ ( n /2 ) Γ (( n + 1 ) /2 ) = 1
이고, 두번째 인수는
lim n → ∞ 1 ( 1 + y 2 / n ) 1 / 2 = 1
\lim_{n \to \infty} { {1} \over {(1 + y^{2} / n)^{1/2} } } =1
n → ∞ lim ( 1 + y 2 / n ) 1/2 1 = 1
이고, 세번째 인수는
lim n → ∞ 1 2 π ( 1 + y 2 n ) − n / 2 = 1 2 π e − y 2 / 2
\lim_{n \to \infty} { {1} \over {\sqrt{2 \pi }} } \left( 1 + { {y^{2}} \over {n} } \right) ^{-n/2} = { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2}
n → ∞ lim 2 π 1 ( 1 + n y 2 ) − n /2 = 2 π 1 e − y 2 /2
다. 즉,
F n ( t ) = ∫ − ∞ t 1 2 π e − y 2 / 2 d y
F_n(t) = \int_{-\infty}^{t} { {1} \over {\sqrt{2 \pi }} } e ^{- y^{2} / 2} dy
F n ( t ) = ∫ − ∞ t 2 π 1 e − y 2 /2 d y
따라서 T n T_n T n 은 표준정규분포를 따르는 확률변수로 분포수렴한다.
■