로케이션-스케일 패밀리의 보조통계량

로케이션-스케일 패밀리의 보조통계량

Ancillary statistiic of Location-Scale Family

정리 1

$X_{1} , \cdots , X_{n}$ 가 로케이션 패밀리면서 스케일 패밀리에서 나온 랜덤샘플이라 하자. 두 통계량 $T_{1} \left( X_{1} , \cdots, X_{n} \right)$ 과 $T_{2} \left( X_{1} , \cdots , X_{n} \right)$ 가 모든 $x_{1} , \cdots , x_{n}$ 와 모든 상수 $b \in \mathbb{R}$ 과 $a > 0$ 에 대해 $$ T_{i} \left( a x_{1} + b , \cdots , a x_{n} + b \right) = a T_{i} \left( x_{1} , \cdots , x_{n} \right) $$ 을 만족시킨다면, 그 비 $T_{1}/T_{2}$ 는 보조통계량이다.

증명

$X_{k}$ 는 로케이션-스케일 패밀리에서 나왔으므로 어떤 로케이션 파라메터 $\theta \in \mathbb{R}$ 과 스케일 파라메터 $\sigma > 0$ 에 대해 다음과 같이 나타낼 수 있다. $$ X_{k} = \theta + \sigma Z_{k} $$

여기서 $Z_{k}$ 는 $f (z ; \theta = 0, \sigma = 1)$ 에서 뽑히는 샘플을 의미한다. 가정에 따르면 $T_{1}$ 과 $T_{2}$ 의 비는

$$ {{T_{1} \left( X_{1} , \cdots , X_{n} \right) } \over {T_{2} \left( X_{1} , \cdots , X_{n} \right) }} = { \sigma {T_{1} \left( Z_{1} , \cdots , Z_{n} \right) } \over {\sigma T_{2} \left( Z_{1} , \cdots , Z_{n} \right) }} = { {T_{1} \left( Z_{1} , \cdots , Z_{n} \right) } \over { T_{2} \left( Z_{1} , \cdots , Z_{n} \right)}} $$

이므로, $\theta$ 와 $\sigma$ 에 종속되지 않는 보조통계량이다.

설명

예시

예로써 샘플의 범위 $R$ 과 표본표준편차 $S$ 의 비는 보조통계량이다. 우선 범위Range

$$ \begin{align*} & R \left( \sigma Z_{1} + \theta , \cdots , \sigma Z_{n} + \theta \right) \\ =& R \left( X_{1} , \cdots , X_{n} \right) \\ =& X_{(n)} - X_{(1)} \\ =& \sigma Z_{(n)} + \theta - \sigma Z_{(1)} - \theta \\ =& \sigma \left( Z_{(n)} - \sigma Z_{(1)} \right) \\ =& \sigma R \left( Z_{1} , \cdots , Z_{n} \right) \end{align*} $$

이고, 표본표준편차 $S$ 는

$$ \begin{align*} & S \left( \sigma Z_{1} + \theta , \cdots , \sigma Z_{n} + \theta \right) \\ =& S \left( X_{1} , \cdots , X_{n} \right) \\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( X_{i} - \bar{X} \right)^{2} } \\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( \sigma Z_{i} + \theta - \sigma \bar{Z} - \theta \right)^{2} } \\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \sigma^{2} \left( Z_{i} - \bar{Z} \right)^{2} } \\ =& \sigma \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( Z_{i} - \bar{Z} \right)^{2} } \\ =& \sigma S \left( Z_{1} , \cdots , Z_{n} \right) \end{align*} $$

이다. 이들의 비 $R/S$ 는 애초에 $\theta$ 가 없어져서 $\theta$ 에 대한 보조통계량이며, 비의 분자 분모에서 $\sigma$ 가 약분되므로 $\sigma$ 에 대한 보조통계량도 된다. 이는 언뜻 생각해보아도 둘 모두가 데이터의 산포도를 나타낸다는 점에서 직관적으로 말이 된다.


  1. Casella. (2001). statistiical Inference(2nd Edition): p306. ↩︎

댓글