표준정규분포의 제곱은 자유도가 1인 카이제곱분포를 따름을 증명
정리
$X \sim N(\mu,\sigma ^2)$면 $$ V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1) $$
- $N \left( \mu , \sigma^{2} \right)$ 는 평균이 $\mu$ 고 분산이 $\sigma^{2}$ 인 정규 분포다.
- $\chi^{2} \left( 1 \right)$ 은 자유도 $1$ 인 카이제곱 분포다.
설명
정리로는 이를 일반화시킨 스튜던트의 정리가 많이 쓰인다.
통계학을 공부하는 사람이라면 표준정규분포의 제곱이 카이제곱분포를 따른다는 것은 팩트로써 항상 당연하게 알고 있어야한다. 어떤 데이터가 정규 분포를 따른다고 가정할 수 있을 때, 표준화된 데이터의 분산이 지나치게 크거나 작다면 뭔가 문제가 있음을 바로 짐작할 수 있다. 당연히 많은 통계적 검정에 응용되며, 그에 대한 이론적인 직관이 있고 없고는 하늘과 땅 차이다.
한편 반대로 생각해보면 카이제곱 분포의 정의를 먼저 떠올리고 그 성질을 탐구하는 것보다는 애초에 표준정규 분포를 따르는 데이터의 제곱, 아마도 잔차의 제곱이 어떤 분포를 따르는지 연구하다가 카이제곱 분포를 발견하는 편이 더 상식적이다.
증명 1
$\displaystyle W := {(X-\mu) \over \sigma }$ 라고 하면 $W \sim N(0,1)$ 이다.
표준정규분포의 정의: 다음과 같은 확률 밀도를 함수를 가지는 정규분포 $N \left( 0,1^{2} \right)$ 를 표준정규분포라고 한다. $$ f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right] $$
$V$ 의 누적분포함수를 $F$ 라고 하면 $$ \begin{align*} F(v) =& P(V \le v) \\ =& P \left( W^2 \le v \right) \\ =& P \left( \sqrt{v} \le W \le \sqrt{v} \right) \\ =& \int_{-\sqrt{v}}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw \\ =& 2 \int_{0}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw \end{align*} $$ $w := \sqrt{x}$ 와 같이 치환하면 $$ F(v) = 2\int_{0}^{v} { 1 \over \sqrt{ 2 \pi } } e^{-{{x} \over 2}} {1 \over {2 \sqrt{x} } } dx $$ 미적분학의 기본정리에 의해 $v$ 의 확률밀도함수 $f$ 는 $$ f(v) = F ' (v) = { 1 \over {\sqrt{ 2 \pi } } } e^{-{{v} \over 2}}{ 1 \over {v^{1 \over 2}} } $$
오일러의 반사 공식: $$ {\Gamma (1-x) \Gamma ( x )} = { {\pi} \over {\sin \pi x } } $$
반사공식에 의해 $\displaystyle \sqrt{\pi} = \Gamma \left( {{ 1 } \over { 2 }} \right)$ 이므로 $$ f(v) = { 1 \over { \Gamma ({1 \over 2}) 2^{1 \over 2} } } v^{ - {1 \over 2} } e^{-{{v} \over 2}} $$
감마분포의 정의: $k, \theta > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $\Gamma ( k , \theta )$ 를 감마 분포라고 한다. $$ f(x) = {{ 1 } \over { \Gamma ( k ) \theta^{k} }} x^{k - 1} e^{ - x / \theta} \qquad , x > 0 $$
정리하면 $V$ 는 감마분포 $\displaystyle \Gamma \left( {{ 1 } \over { 2 }} , 2 \right)$ 의 확률밀도함수를 가진다.
감마분포와 카이제곱분포의 관계: $$ \Gamma \left( { r \over 2 } , 2 \right) \iff \chi ^2 (r) $$
따라서 $\displaystyle \Gamma \left( {1 \over 2}, 2 \right) \sim \chi^2 (1)$ 이고 $$ \left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1) $$
■
Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 175-176. ↩︎