독립인 정규 분포와 카이제곱 분포에서 스튜던트 t-분포 유도

독립인 정규 분포와 카이제곱 분포에서 스튜던트 t-분포 유도

Derivation of t-Distribution from independent chi-squared and normal Distribution

정리

확률 변수 $W,V$ 가 독립이고 $W \sim N(0,1)$, $V \sim \chi^{2} (r)$ 이라 하면 $$ T = { {W} \over {\sqrt{V/r} } } \sim t(r) $$


  • $N \left( \mu , \sigma^{2} \right)$ 는 평균이 $\mu$ 고 분산이 $\sigma^{2}$ 인 정규 분포다.
  • $\chi^{2} \left( r \right)$ 은 자유도 $r$ 인 카이제곱 분포다.
  • $t(r)$ 은 자유도 $r$ 인 t-분포다.

설명

어떤 분포에서 다른 분포를 유도하는 것은 공부만 열심히 하면 직관적인 추측이 가능하다. 하지만 둘 이상의 분포에서 다른 분포를 유도해낸다는것은 만만치 않은 일이다. 어떻게 활용되는지는 둘째치고라도 일단 가능하다는 것 자체가 경이롭다.

유도1

전략: 조인트 확률밀도함수로 직접 연역한다.

정규 분포의 정의: $\mu \in \mathbb{R}$ 과 $\sigma > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $N \left( \mu,\sigma^{2} \right)$ 를 정규 분포라고 한다. $$ f(x) = {{ 1 } \over { \sqrt{2 \pi} \sigma }} \exp \left[ - {{ 1 } \over { 2 }} \left( {{ x - \mu } \over { \sigma }} \right)^{2} \right] \qquad, x \in \mathbb{R} $$

카이제곱 분포의 정의: 자유도 $r > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $\chi^{2} (r)$ 를 카이제곱 분포라고 한다. $$ f(x) = {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} \qquad , x \in (0, \infty) $$


$W,V$ 의 확률밀도함수 $f_{1} , f_{2}$ 는 각각 $$ f_1 (w) := { {1} \over {\sqrt{2 \pi }} } e ^{- w^{2} / 2} \\ \displaystyle f_2 (v) ={ 1 \over { \Gamma ({r \over 2}) 2^{r \over 2} } } v^{ {r \over 2} - 1 } e^{-{{v} \over 2}} $$ 와 같이 주어지므로 $W$ 와 $V$ 의 조인트 확률밀도함수 $h$ 는 $w \in \mathbb{R}$, $v \in (0,\infty)$ 에 대해 다음과 같다. $$ \displaystyle h(w,v) = { {1} \over {\sqrt{2 \pi }} } e ^{- w^{2} / 2} { 1 \over { \Gamma ({r \over 2}) 2^{r \over 2} } } v^{ {r \over 2} - 1 } e^{-{{v} \over 2}} $$ 이제 $\displaystyle T := { {W} \over {\sqrt{V/r} } }$ 그리고 $U := V$ 라고 하면 $w = t\sqrt{u} / \sqrt{r}$ 이고 $v = u$ 이므로 $$ \left| J \right| = \begin{vmatrix} {{\sqrt{u}} \over {\sqrt{r}}} & 0 \\ {{t} \over {2 \sqrt{ur}}} & 1 \end{vmatrix} = \sqrt{{{ u } \over { r }}} $$ 따라서 $T, U$ 의 조인트 확률 밀도 함수는 $$ \begin{align*} g(t,u) =& h({ {w} \over {\sqrt{v/r} } },u) |J| \\ =& { {1} \over {\sqrt{2 \pi } \Gamma (r/2) 2^{r/2} } } u^{r/2 -1} \exp \left\{ -{{u} \over {2} } \left( 1 + { {t^2} \over {r} } \right) \right\} { {\sqrt{u} } \over {\sqrt{r} } } \end{align*} $$ $T$ 의 마지널 확률 밀도 함수는 $$ \begin{align*} g(t) =& \int_{-\infty}^{\infty} g(t,u) du \\ =& \int_{0}^{\infty} { {1} \over {\sqrt{2 \pi r} \Gamma (r/2) 2^{r/2} } } u^{(r+1)/2 -1} \exp \left\{ -{{u} \over {2} } \left( 1 + { {t^2} \over {r} } \right) \right\} du \end{align*} $$ $\displaystyle z := {{u} \over {2}} \left( 1 + {{t^2} \over {r}} \right)$로 치환하면 $$ \begin{align*} g(t) =& \int_{0}^{\infty} { {1} \over {\sqrt{2 \pi r} \Gamma (r/2) 2^{r/2} } } \left( { {2z} \over {1 + t^2 / r} }\right)^{(r+1)/2-1} e^{-z} \left( { {2} \over {1+ t^2 / r} } \right) dz \\ =& { {1} \over {\sqrt{\pi r} \Gamma (r/2) } } \int_{0}^{\infty} {{ 1 } \over { \sqrt{2} 2^{r/2} }}z^{(r+1)/2-1} \left( { {2} \over {1 + t^2 / r} }\right)^{(r+1)/2-1} e^{-z} \left( { {2} \over {1+ t^2 / r} } \right) dz \\ =& { {1} \over {\sqrt{\pi r} \Gamma (r/2) } } \int_{0}^{\infty} {{ 1 } \over { 2^{(r+1)/2} }}z^{(r+1)/2-1} \left( { {2} \over {1 + t^2 / r} }\right)^{(r+1)/2} e^{-z} dz \\ =& { {1} \over {\sqrt{\pi r} \Gamma (r/2) } } \int_{0}^{\infty}z^{(r+1)/2-1} \left( { {1} \over {1 + t^2 / r} }\right)^{(r+1)/2} e^{-z} {{ \Gamma \left( (r+1)/2 \right) } \over { \Gamma \left( (r+1)/2 \right) }} dz \\ =& { {\Gamma \left( (r+1)/2 \right)} \over {\sqrt{\pi r} \Gamma (r/2) } } \left( { {1} \over {1 + t^2 / r} }\right)^{(r+1)/2} \int_{0}^{\infty} {{ 1 } \over { \Gamma \left( (r+1)/2 \right) }} z^{(r+1)/2-1} e^{-z} dz \\ =& { {\Gamma \left( (r+1)/2 \right)} \over {\sqrt{\pi r} \Gamma (r/2) } } \left( { {1} \over {1 + t^2 / r} }\right)^{(r+1)/2} \cdot 1 \end{align*} $$ 피적분함수가 감마분포 $\Gamma \left( {{ r + 1 } \over { 2 }} , 1 \right) $ 의 확률밀도함수가 되어서 복잡한 계산을 피할 수 있다. 정리해내면 $$ g(t) = {{\Gamma ( (r+1)/2 ) } \over { \sqrt{\pi r} \Gamma (r/2) }} { {1} \over {(1 + t^{2} / r)^{(r+1)/2} } } $$ 이는 자유도가 $r$ 인 t-분포의 확률밀도함수이므로 $$ T = { {W} \over {\sqrt{V/r} } } \sim t(r) $$


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 191-192. ↩︎

댓글