logo

독립인 두 카이제곱 분포에서 F-분포 유도 📂확률분포론

독립인 두 카이제곱 분포에서 F-분포 유도

정리

확률 변수 U,VU,V독립이고 Uχ2(r1)U \sim \chi^{2} ( r_{1}), Vχ2(r2)V \sim \chi^{2} ( r_{2}) 이라 하면 U/r1V/r2F(r1,r2) {{ U / r_{1} } \over { V / r_{2} }} \sim F \left( r_{1} , r_{2} \right)

설명

두 데이터가 카이제곱 분포를 따르고 독립이라면, 그 비를 확률분포론으로 설명할 수 있을지도 모른다.통계학 전반에서는 표준화된 잔차의 제곱이 카이제곱 분포를 따르는 것으로 가정하기 때문에 이 점에 따라 F-검정등을 즐겨쓴다. 증명 자체가 중요한 것은 아니지만, 많은 분석에서 왜 F-검정을 사용하는지에 대한 인사이트를 주기 때문에 수리통계학을 공부하는 통계학도에게는 매우 중요한 팩트라고 할 수 있다.

유도1

전략: 카이제곱 분포끼리의 조인트 밀도 함수로 직접 연역한다.

카이제곱 분포의 정의: 자유도 r>0r > 0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 χ2(r)\chi^{2} (r) 를 카이제곱 분포라고 한다. f(x)=1Γ(r/2)2r/2xr/21ex/2,x(0,) f(x) = {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} \qquad , x \in (0, \infty)

F-분포의 정의: 자유도 r1,r2>0r_{1}, r_{2} > 0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 F(r1,r2)F \left( r_{1} , r_{2} \right) 를 F-분포라고 한다. f(x)=1B(r1/2,r2/2)(r1r2)r1/2xr1/21(1+r1r2x)(r1+r2)/2,x(0,) f(x) = {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} \qquad , x \in (0, \infty)


U,VU,V 는 독립이므로 조인트 밀도함수는 u,v(0,)u,v \in (0,\infty) 에 대해 다음과 같다. h(u,v)=1Γ(r12)Γ(r22)2(r1+r2)/2ur1/21vr2/21e(u+v)/2 h(u,v) = {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} u^{r_{1}/2 - 1} v^{r_{2}/2 - 1} e^{-(u+v)/2} 이제 W:=U/r1V/r2\displaystyle W:= {{ U/r_{1} } \over { V / r_{2} }} 그리고 Z:=VZ := V 라고 하면 u=(r1/r2)zwu = (r_{1}/r_{2})zw 이고 v=zv = z 이므로 J=(r1/r2)z(r1/r2)w01=(r1/r2)z0 \left| J \right| = \begin{vmatrix} (r_{1}/r_{2})z & (r_{1}/r_{2})w \\ 0 & 1 \end{vmatrix} = (r_{1}/r_{2})z \ne 0 따라서 W,ZW,Z 의 조인트 밀도 함수는 w,z(0,)w,z \in (0,\infty) 에 대해 g(w,z)=1Γ(r12)Γ(r22)2(r1+r2)/2(r1zwr2)r122zr222exp[z2(r1wr2+1)]r1zr2 g(w,z) = {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ r_{1} z w } \over { r_{2} }} \right)^{{{ r_{1} - 2 } \over { 2 }}} z^{{{ r_{2} - 2 } \over { 2 }}} \exp \left[ - {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right) \right] {{ r_{1} z } \over { r_{2} }} WW마지널 밀도 함수 g1g_{1}y:=z2(r1wr2+1)\displaystyle y:= {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right) 로 두어서 g1(w)=g(w,z)dz=1Γ(r12)Γ(r22)2(r1+r2)/2(r1zwr2)r122zr222exp[z2(r1wr2+1)]r1zr2dz=(r1/r2)r1/2wr1/21Γ(r12)Γ(r22)2(r1+r2)/2(2yr1r2w+1)r1+r221ey(2r1r2w+1)dy=Γ(r1+r22)(r1r2)r1/2Γ(r12)Γ(r22)wr1/21(1+r1r2w)(r1+r2)/2=1B(r1/2,r2/2)(r1r2)r1/2wr1/21(1+r1r2w)(r1+r2)/2 \begin{align*} g_{1} (w) =& \int_{-\infty}^{\infty} g(w,z) dz \\ =& \int_{-\infty}^{\infty} {{ 1 } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ r_{1} z w } \over { r_{2} }} \right)^{{{ r_{1} - 2 } \over { 2 }}} z^{{{ r_{2} - 2 } \over { 2 }}} \exp \left[ - {{ z } \over { 2 }} \left( {{ r_{1} w } \over { r_{2} }} + 1 \right) \right] {{ r_{1} z } \over { r_{2} }} dz \\ =& \int_{-\infty}^{\infty} {{ (r_{1} / r_{2})^{r_{1} / 2} w^{r_{1}/2 - 1} } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) 2^{(r_{1} + r_{2})/2} }} \left( {{ 2y } \over { {{ r_{1} } \over { r_{2} }} w + 1 }} \right)^{{{ r_{1} + r_{2} } \over { 2 }} - 1} e^{-y} \left( {{ 2 } \over { {{ r_{1} } \over { r_{2} }} w + 1 }} \right) dy \\ =& {{ \Gamma \left( {{ r_{1} + r_{2} } \over { 2 }} \right) \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} } \over { \Gamma \left( {{ r_{1} } \over { 2 }} \right) \Gamma \left( {{ r_{2} } \over { 2 }} \right) }} {{ w^{r_{1}/2 - 1} } \over { \left( 1 + {{ r_{1} } \over { r_{2} }} w \right)^{(r_{1} + r_{2}) / 2} }} \\ =& {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} w^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} w \right)^{-(r_{1} + r_{2}) / 2} \end{align*} 따라서 WF(r1,r2) W \sim F (r_{1} , r_{2})


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 193-194. ↩︎