두 확률 변수U,V 가 독립이고 U∼χ2(r1), V∼χ2(r2) 이라 하면
V/r2U/r1∼F(r1,r2)
설명
두 데이터가 카이제곱 분포를 따르고 독립이라면, 그 비를 확률분포론으로 설명할 수 있을지도 모른다.통계학 전반에서는 표준화된 잔차의 제곱이 카이제곱 분포를 따르는 것으로 가정하기 때문에 이 점에 따라 F-검정등을 즐겨쓴다. 증명 자체가 중요한 것은 아니지만, 많은 분석에서 왜 F-검정을 사용하는지에 대한 인사이트를 주기 때문에 수리통계학을 공부하는 통계학도에게는 매우 중요한 팩트라고 할 수 있다.
카이제곱 분포의 정의: 자유도 r>0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 χ2(r) 를 카이제곱 분포라고 한다.
f(x)=Γ(r/2)2r/21xr/2−1e−x/2,x∈(0,∞)
F-분포의 정의: 자유도 r1,r2>0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 F(r1,r2) 를 F-분포라고 한다.
f(x)=B(r1/2,r2/2)1(r2r1)r1/2xr1/2−1(1+r2r1x)−(r1+r2)/2,x∈(0,∞)
U,V 는 독립이므로 조인트 밀도함수는 u,v∈(0,∞) 에 대해 다음과 같다.
h(u,v)=Γ(2r1)Γ(2r2)2(r1+r2)/21ur1/2−1vr2/2−1e−(u+v)/2
이제 W:=V/r2U/r1 그리고 Z:=V 라고 하면 u=(r1/r2)zw 이고 v=z 이므로
∣J∣=(r1/r2)z0(r1/r2)w1=(r1/r2)z=0
따라서 W,Z 의 조인트 밀도 함수는 w,z∈(0,∞) 에 대해
g(w,z)=Γ(2r1)Γ(2r2)2(r1+r2)/21(r2r1zw)2r1−2z2r2−2exp[−2z(r2r1w+1)]r2r1zW 의 마지널 밀도 함수 g1 은 y:=2z(r2r1w+1) 로 두어서
g1(w)=====∫−∞∞g(w,z)dz∫−∞∞Γ(2r1)Γ(2r2)2(r1+r2)/21(r2r1zw)2r1−2z2r2−2exp[−2z(r2r1w+1)]r2r1zdz∫−∞∞Γ(2r1)Γ(2r2)2(r1+r2)/2(r1/r2)r1/2wr1/2−1(r2r1w+12y)2r1+r2−1e−y(r2r1w+12)dyΓ(2r1)Γ(2r2)Γ(2r1+r2)(r2r1)r1/2(1+r2r1w)(r1+r2)/2wr1/2−1B(r1/2,r2/2)1(r2r1)r1/2wr1/2−1(1+r2r1w)−(r1+r2)/2
따라서
W∼F(r1,r2)
■
Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 193-194. ↩︎