표준정규분포의 제곱은 자유도가 1인 카이제곱분포를 따름을 증명
📂확률분포론 표준정규분포의 제곱은 자유도가 1인 카이제곱분포를 따름을 증명 정리 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma ^2) X ∼ N ( μ , σ 2 ) 면
V = ( X − μ σ ) 2 ∼ χ 2 ( 1 )
V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1)
V = ( σ X − μ ) 2 ∼ χ 2 ( 1 )
N ( μ , σ 2 ) N \left( \mu , \sigma^{2} \right) N ( μ , σ 2 ) 는 평균이 μ \mu μ 고 분산이 σ 2 \sigma^{2} σ 2 인 정규 분포 다.χ 2 ( 1 ) \chi^{2} \left( 1 \right) χ 2 ( 1 ) 은 자유도 1 1 1 인 카이제곱 분포 다.설명 정리로는 이를 일반화시킨 스튜던트의 정리 가 많이 쓰인다.
통계학을 공부하는 사람이라면 표준정규분포의 제곱이 카이제곱분포를 따른다는 것은 팩트로써 항상 당연하게 알고 있어야한다. 어떤 데이터가 정규 분포를 따른다고 가정할 수 있을 때, 표준화된 데이터의 분산이 지나치게 크거나 작다면 뭔가 문제가 있음을 바로 짐작할 수 있다. 당연히 많은 통계적 검정에 응용되며, 그에 대한 이론적인 직관이 있고 없고는 하늘과 땅 차이다.
한편 반대로 생각해보면 카이제곱 분포의 정의를 먼저 떠올리고 그 성질을 탐구하는 것보다는 애초에 표준정규 분포를 따르는 데이터의 제곱, 아마도 잔차의 제곱이 어떤 분포를 따르는지 연구하다가 카이제곱 분포를 발견하는 편이 더 상식적이다.
증명 W : = ( X − μ ) σ \displaystyle W := {(X-\mu) \over \sigma } W := σ ( X − μ ) 라고 하면 W ∼ N ( 0 , 1 ) W \sim N(0,1) W ∼ N ( 0 , 1 ) 이다.
표준정규분포의 정의 : 다음과 같은 확률 밀도를 함수를 가지는 정규분포 N ( 0 , 1 2 ) N \left( 0,1^{2} \right) N ( 0 , 1 2 ) 를 표준정규분포라고 한다.
f ( z ) = 1 2 π exp [ − z 2 2 ]
f(z) = {{ 1 } \over { \sqrt{2 \pi} }} \exp \left[ - {{ z^{2} } \over { 2 }} \right]
f ( z ) = 2 π 1 exp [ − 2 z 2 ]
V V V 의 누적분포함수를 F F F 라고 하면
F ( v ) = P ( V ≤ v ) = P ( W 2 ≤ v ) = P ( v ≤ W ≤ v ) = ∫ − v v 1 2 π e − w 2 2 d w = 2 ∫ 0 v 1 2 π e − w 2 2 d w
\begin{align*}
F(v) =& P(V \le v)
\\ =& P \left( W^2 \le v \right)
\\ =& P \left( \sqrt{v} \le W \le \sqrt{v} \right)
\\ =& \int_{-\sqrt{v}}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw
\\ =& 2 \int_{0}^{\sqrt{v}} { 1 \over \sqrt{ 2 \pi } } e^{-{{w^2} \over 2}} dw
\end{align*}
F ( v ) = = = = = P ( V ≤ v ) P ( W 2 ≤ v ) P ( v ≤ W ≤ v ) ∫ − v v 2 π 1 e − 2 w 2 d w 2 ∫ 0 v 2 π 1 e − 2 w 2 d w
w : = x w := \sqrt{x} w := x 와 같이 치환하면
F ( v ) = 2 ∫ 0 v 1 2 π e − x 2 1 2 x d x
F(v) = 2\int_{0}^{v} { 1 \over \sqrt{ 2 \pi } } e^{-{{x} \over 2}} {1 \over {2 \sqrt{x} } } dx
F ( v ) = 2 ∫ 0 v 2 π 1 e − 2 x 2 x 1 d x
미적분학의 기본정리 에 의해 v v v 의 확률밀도함수 f f f 는
f ( v ) = F ′ ( v ) = 1 2 π e − v 2 1 v 1 2
f(v) = F ' (v) = { 1 \over {\sqrt{ 2 \pi } } } e^{-{{v} \over 2}}{ 1 \over {v^{1 \over 2}} }
f ( v ) = F ′ ( v ) = 2 π 1 e − 2 v v 2 1 1
오일러의 반사 공식 :
Γ ( 1 − x ) Γ ( x ) = π sin π x
{\Gamma (1-x) \Gamma ( x )} = { {\pi} \over {\sin \pi x } }
Γ ( 1 − x ) Γ ( x ) = sin π x π
반사공식에 의해 π = Γ ( 1 2 ) \displaystyle \sqrt{\pi} = \Gamma \left( {{ 1 } \over { 2 }} \right) π = Γ ( 2 1 ) 이므로
f ( v ) = 1 Γ ( 1 2 ) 2 1 2 v − 1 2 e − v 2
f(v) = { 1 \over { \Gamma ({1 \over 2}) 2^{1 \over 2} } } v^{ - {1 \over 2} } e^{-{{v} \over 2}}
f ( v ) = Γ ( 2 1 ) 2 2 1 1 v − 2 1 e − 2 v
감마분포의 정의 : k , θ > 0 k, \theta > 0 k , θ > 0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 Γ ( k , θ ) \Gamma ( k , \theta ) Γ ( k , θ ) 를 감마 분포라고 한다.
f ( x ) = 1 Γ ( k ) θ k x k − 1 e − x / θ , x > 0
f(x) = {{ 1 } \over { \Gamma ( k ) \theta^{k} }} x^{k - 1} e^{ - x / \theta} \qquad , x > 0
f ( x ) = Γ ( k ) θ k 1 x k − 1 e − x / θ , x > 0
정리하면 V V V 는 감마분포 Γ ( 1 2 , 2 ) \displaystyle \Gamma \left( {{ 1 } \over { 2 }} , 2 \right) Γ ( 2 1 , 2 ) 의 확률밀도함수를 가진다.
감마분포와 카이제곱분포의 관계 :
Γ ( r 2 , 2 ) ⟺ χ 2 ( r )
\Gamma \left( { r \over 2 } , 2 \right) \iff \chi ^2 (r)
Γ ( 2 r , 2 ) ⟺ χ 2 ( r )
따라서 Γ ( 1 2 , 2 ) ∼ χ 2 ( 1 ) \displaystyle \Gamma \left( {1 \over 2}, 2 \right) \sim \chi^2 (1) Γ ( 2 1 , 2 ) ∼ χ 2 ( 1 ) 이고
( X − μ σ ) 2 ∼ χ 2 ( 1 )
\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1)
( σ X − μ ) 2 ∼ χ 2 ( 1 )
■