logo

로케이션-스케일 패밀리의 보조통계량 📂수리통계학

로케이션-스케일 패밀리의 보조통계량

정리 1

X1,,XnX_{1} , \cdots , X_{n}로케이션 패밀리면서 스케일 패밀리에서 나온 랜덤샘플이라 하자. 두 통계량 T1(X1,,Xn)T_{1} \left( X_{1} , \cdots, X_{n} \right)T2(X1,,Xn)T_{2} \left( X_{1} , \cdots , X_{n} \right) 가 모든 x1,,xnx_{1} , \cdots , x_{n} 와 모든 상수 bRb \in \mathbb{R}a>0a > 0 에 대해 Ti(ax1+b,,axn+b)=aTi(x1,,xn) T_{i} \left( a x_{1} + b , \cdots , a x_{n} + b \right) = a T_{i} \left( x_{1} , \cdots , x_{n} \right) 을 만족시킨다면, 그 비 T1/T2T_{1}/T_{2}보조통계량이다.

증명

XkX_{k} 는 로케이션-스케일 패밀리에서 나왔으므로 어떤 로케이션 파라미터 θR\theta \in \mathbb{R} 과 스케일 파라미터 σ>0\sigma > 0 에 대해 다음과 같이 나타낼 수 있다. Xk=θ+σZk X_{k} = \theta + \sigma Z_{k}

여기서 ZkZ_{k}f(z;θ=0,σ=1)f (z ; \theta = 0, \sigma = 1) 에서 뽑히는 샘플을 의미한다. 가정에 따르면 T1T_{1}T2T_{2} 의 비는

T1(X1,,Xn)T2(X1,,Xn)=σT1(Z1,,Zn)σT2(Z1,,Zn)=T1(Z1,,Zn)T2(Z1,,Zn) {{T_{1} \left( X_{1} , \cdots , X_{n} \right) } \over {T_{2} \left( X_{1} , \cdots , X_{n} \right) }} = { \sigma {T_{1} \left( Z_{1} , \cdots , Z_{n} \right) } \over {\sigma T_{2} \left( Z_{1} , \cdots , Z_{n} \right) }} = { {T_{1} \left( Z_{1} , \cdots , Z_{n} \right) } \over { T_{2} \left( Z_{1} , \cdots , Z_{n} \right)}}

이므로, θ\thetaσ\sigma 에 종속되지 않는 보조통계량이다.

설명

예시

예로써 샘플의 범위 RR 과 표본표준편차 SS 의 비는 보조통계량이다. 우선 범위range

R(σZ1+θ,,σZn+θ)=R(X1,,Xn)=X(n)X(1)=σZ(n)+θσZ(1)θ=σ(Z(n)σZ(1))=σR(Z1,,Zn) \begin{align*} & R \left( \sigma Z_{1} + \theta , \cdots , \sigma Z_{n} + \theta \right) \\ =& R \left( X_{1} , \cdots , X_{n} \right) \\ =& X_{(n)} - X_{(1)} \\ =& \sigma Z_{(n)} + \theta - \sigma Z_{(1)} - \theta \\ =& \sigma \left( Z_{(n)} - \sigma Z_{(1)} \right) \\ =& \sigma R \left( Z_{1} , \cdots , Z_{n} \right) \end{align*}

이고, 표본표준편차 SS

S(σZ1+θ,,σZn+θ)=S(X1,,Xn)=1n1i=1n(XiXˉ)2=1n1i=1n(σZi+θσZˉθ)2=1n1i=1nσ2(ZiZˉ)2=σ1n1i=1n(ZiZˉ)2=σS(Z1,,Zn) \begin{align*} & S \left( \sigma Z_{1} + \theta , \cdots , \sigma Z_{n} + \theta \right) \\ =& S \left( X_{1} , \cdots , X_{n} \right) \\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( X_{i} - \bar{X} \right)^{2} } \\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( \sigma Z_{i} + \theta - \sigma \bar{Z} - \theta \right)^{2} } \\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \sigma^{2} \left( Z_{i} - \bar{Z} \right)^{2} } \\ =& \sigma \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( Z_{i} - \bar{Z} \right)^{2} } \\ =& \sigma S \left( Z_{1} , \cdots , Z_{n} \right) \end{align*}

이다. 이들의 비 R/SR/S 는 애초에 θ\theta 가 없어져서 θ\theta 에 대한 보조통계량이며, 비의 분자 분모에서 σ\sigma 가 약분되므로 σ\sigma 에 대한 보조통계량도 된다. 이는 언뜻 생각해보아도 둘 모두가 데이터의 산포도를 나타낸다는 점에서 직관적으로 말이 된다.


  1. Casella. (2001). Statistical Inference(2nd Edition): p306. ↩︎