logo

표준정규분포의 제곱은 자유도가 1인 카이제곱분포를 따름을 증명 📂확률분포론

표준정규분포의 제곱은 자유도가 1인 카이제곱분포를 따름을 증명

정리

XN(μ,σ2)X \sim N(\mu,\sigma ^2)V=(Xμσ)2χ2(1) V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1)


  • N(μ,σ2)N \left( \mu , \sigma^{2} \right) 는 평균이 μ\mu 고 분산이 σ2\sigma^{2}정규 분포다.
  • χ2(1)\chi^{2} \left( 1 \right) 은 자유도 11카이제곱 분포다.

설명

정리로는 이를 일반화시킨 스튜던트의 정리가 많이 쓰인다.

통계학을 공부하는 사람이라면 표준정규분포의 제곱이 카이제곱분포를 따른다는 것은 팩트로써 항상 당연하게 알고 있어야한다. 어떤 데이터가 정규 분포를 따른다고 가정할 수 있을 때, 표준화된 데이터의 분산이 지나치게 크거나 작다면 뭔가 문제가 있음을 바로 짐작할 수 있다. 당연히 많은 통계적 검정에 응용되며, 그에 대한 이론적인 직관이 있고 없고는 하늘과 땅 차이다.

한편 반대로 생각해보면 카이제곱 분포의 정의를 먼저 떠올리고 그 성질을 탐구하는 것보다는 애초에 표준정규 분포를 따르는 데이터의 제곱, 아마도 잔차의 제곱이 어떤 분포를 따르는지 연구하다가 카이제곱 분포를 발견하는 편이 더 상식적이다.

증명 1

W:=(Xμ)σ\displaystyle W := {(X-\mu) \over \sigma } 라고 하면 WN(0,1)W \sim N(0,1) 이다.

표준정규분포의 정의: 다음과 같은 확률 밀도를 함수를 가지는 정규분포 N(0,12)N \left( 0,1^{2} \right) 를 표준정규분포라고 한다. f(z)=12πexp[z22] f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right]

VV 의 누적분포함수를 FF 라고 하면 F(v)=P(Vv)=P(W2v)=P(vWv)=vv12πew22dw=20v12πew22dw \begin{align*} F(v) =& P(V \le v) \\ =& P \left( W^2 \le v \right) \\ =& P \left( \sqrt{v} \le W \le \sqrt{v} \right) \\ =& \int_{-\sqrt{v}}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw \\ =& 2 \int_{0}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw \end{align*} w:=xw := \sqrt{x} 와 같이 치환하면 F(v)=20v12πex212xdx F(v) = 2\int_{0}^{v} { 1 \over \sqrt{ 2 \pi } } e^{-{{x} \over 2}} {1 \over {2 \sqrt{x} } } dx 미적분학의 기본정리에 의해 vv 의 확률밀도함수 fff(v)=F(v)=12πev21v12 f(v) = F ' (v) = { 1 \over {\sqrt{ 2 \pi } } } e^{-{{v} \over 2}}{ 1 \over {v^{1 \over 2}} }

오일러의 반사 공식: Γ(1x)Γ(x)=πsinπx {\Gamma (1-x) \Gamma ( x )} = { {\pi} \over {\sin \pi x } }

반사공식에 의해 π=Γ(12)\displaystyle \sqrt{\pi} = \Gamma \left( {{ 1 } \over { 2 }} \right) 이므로 f(v)=1Γ(12)212v12ev2 f(v) = { 1 \over { \Gamma ({1 \over 2}) 2^{1 \over 2} } } v^{ - {1 \over 2} } e^{-{{v} \over 2}}

감마분포의 정의: k,θ>0k, \theta > 0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 Γ(k,θ)\Gamma ( k , \theta ) 를 감마 분포라고 한다. f(x)=1Γ(k)θkxk1ex/θ,x>0 f(x) = {{ 1 } \over { \Gamma ( k ) \theta^{k} }} x^{k - 1} e^{ - x / \theta} \qquad , x > 0

정리하면 VV 는 감마분포 Γ(12,2)\displaystyle \Gamma \left( {{ 1 } \over { 2 }} , 2 \right) 의 확률밀도함수를 가진다.

감마분포와 카이제곱분포의 관계: Γ(r2,2)    χ2(r) \Gamma \left( { r \over 2 } , 2 \right) \iff \chi ^2 (r)

따라서 Γ(12,2)χ2(1)\displaystyle \Gamma \left( {1 \over 2}, 2 \right) \sim \chi^2 (1) 이고 (Xμσ)2χ2(1) \left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1)


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 175-176. ↩︎