카이제곱 분포

카이제곱 분포

Chi square Distribution

정의 1

자유도 $r > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $\chi^{2} (r)$ 를 카이제곱 분포chi-square Distribution라고 한다. $$ f(x) = {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} \qquad , x \in (0, \infty) $$


기초 성질

적률 생성 함수

  • [1]: $$m(t) = (1-2t)^{-r/2} \qquad , t < {{ 1 } \over { 2 }}$$

평균과 분산

  • [2] 평균과 분산: $X \sim \chi^{2} (r)$ 이면 $$ \begin{align*} E(X) =& r \\ \text{Var} (X) =& 2r \end{align*} $$

충분통계량

  • [3]: 카이제곱분포를 따르는 랜덤샘플 $\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \chi^{2} (r)$ 이 주어져 있다고 하자. $r$ 에 대한 충분통계량 $T$ 는 다음과 같다. $$ T = \left( \prod_{i} X_{i} \right) $$

정리

$k$차 적률

  • [a]: $X \sim \chi^{2} (r)$ 이라고 하자. $k > - r/ 2$ 이면 $k$차 적률이 존재하고 $$ E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }} $$

감마 분포와의 관계

  • [b]: $$\Gamma \left( { r \over 2 } , 2 \right) \iff \chi ^2 (r)$$

F-분포 유도

  • [c]: 두 확률 변수 $U,V$ 가 독립이고 $U \sim \chi^{2} ( r_{1})$, $V \sim \chi^{2} ( r_{2})$ 이라 하면 $$ {{ U / r_{1} } \over { V / r_{2} }} \sim F \left( r_{1} , r_{2} \right) $$

표준정규분포의 제곱과의 관계

  • [d]: $X \sim N(\mu,\sigma ^2)$ 면 $$ V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1) $$

설명

카이제곱 분포는 통계학 전반에서 폭넓게 사용되는 분포로써, 보통 적합도 검정이나 분산분석 등에서 가장 먼저 접할 수 있다.

정리 [d]는 특히 중요한데, 이 정리의 대우명제에 따르면 표준화된 잔차Residuals의 제곱이 카이제곱분포 $\chi^{2} (1)$ 을 따르지 않을 때 잔차의 정규성에 문제가 있음을 탐지할 수도 있다.

증명

전략 [1], [a]: 치환 적분을 통해 정적분 기호 안에 있는 것들을 밖으로 빼고 감마함수로 바꾸는 트릭을 사용한다.

감마함수의 정의: $$ \Gamma (x) := \int_{0}^{\infty} y^{x-1} e^{y} dy $$

[1]

$y=x(1/2-t)$ 와 같이 치환하면 ${{ 1 } \over { 1/2 - t }}dy = dx$ 이므로 $$ \begin{align*} m(t) =& \int_{0}^{\infty} e^{tx} {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} dx \\ =& {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} \int_{0}^{\infty} x^{r/2-1} e^{x(1/2-t)} dx \\ =& {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} \int_{0}^{\infty} \left( {{ y } \over { 1/2 -t }} \right)^{r/2-1} e^{y} {{ 1 } \over { 1/2 - t }} dy \\ =& (1/2-t)^{-r/2}{{ 1 } \over { \Gamma(r/2) 2^{r/2} }} \int_{0}^{\infty} y^{r/2-1} e^{y} dy \\ =& (1-2t)^{-r/2}{{ 1 } \over { \Gamma(r/2) }} \int_{0}^{\infty} y^{r/2-1} e^{y} dy \end{align*} $$ 감마함수의 정의에 따라 $$ m(t) = (1-2t)^{-r/2} \qquad , t < {{ 1 } \over { 2 }} $$

[2]

적률 공식 [a]에 대입한다.

[a]

$y = x/2$ 와 같이 치환하면 $2 dy = dx$ 이므로 $$ \begin{align*} EX^{k} =& \int_{0}^{\infty} x^{k} {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} dx \\ =& {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} \int_{0}^{\infty} x^{r/2+k-1} e^{-x/2} dx \\ =& {{ 1 } \over { \Gamma(r/2) 2^{r/2} }} \int_{0}^{\infty} 2^{r/2+k-1} y^{r/2+k-1} e^{-y} 2dy \\ =& {{ 2^{k} } \over { \Gamma(r/2) }} \int_{0}^{\infty} y^{(r/2+k)-1} e^{-y} 2dy \end{align*} $$ 감마함수의 정의에 따라 $$ E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }} $$

[b]

적률생성함수로 보인다.

[c]

조인트 밀도 함수로 직접 연역한다.

[d]

확률 밀도 함수로 직접 연역한다.


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p161. ↩︎

댓글