로케이션-스케일 패밀리의 보조통계량
📂수리통계학 로케이션-스케일 패밀리의 보조통계량 정리 X 1 , ⋯ , X n X_{1} , \cdots , X_{n} X 1 , ⋯ , X n 가 로케이션 패밀리 면서 스케일 패밀리 에서 나온 랜덤샘플 이라 하자. 두 통계량 T 1 ( X 1 , ⋯ , X n ) T_{1} \left( X_{1} , \cdots, X_{n} \right) T 1 ( X 1 , ⋯ , X n ) 과 T 2 ( X 1 , ⋯ , X n ) T_{2} \left( X_{1} , \cdots , X_{n} \right) T 2 ( X 1 , ⋯ , X n ) 가 모든 x 1 , ⋯ , x n x_{1} , \cdots , x_{n} x 1 , ⋯ , x n 와 모든 상수 b ∈ R b \in \mathbb{R} b ∈ R 과 a > 0 a > 0 a > 0 에 대해
T i ( a x 1 + b , ⋯ , a x n + b ) = a T i ( x 1 , ⋯ , x n )
T_{i} \left( a x_{1} + b , \cdots , a x_{n} + b \right) = a T_{i} \left( x_{1} , \cdots , x_{n} \right)
T i ( a x 1 + b , ⋯ , a x n + b ) = a T i ( x 1 , ⋯ , x n )
을 만족시킨다면, 그 비 T 1 / T 2 T_{1}/T_{2} T 1 / T 2 는 보조통계량 이다.
증명 X k X_{k} X k 는 로케이션-스케일 패밀리에서 나왔으므로 어떤 로케이션 파라미터 θ ∈ R \theta \in \mathbb{R} θ ∈ R 과 스케일 파라미터 σ > 0 \sigma > 0 σ > 0 에 대해 다음과 같이 나타낼 수 있다.
X k = θ + σ Z k
X_{k} = \theta + \sigma Z_{k}
X k = θ + σ Z k
여기서 Z k Z_{k} Z k 는 f ( z ; θ = 0 , σ = 1 ) f (z ; \theta = 0, \sigma = 1) f ( z ; θ = 0 , σ = 1 ) 에서 뽑히는 샘플을 의미한다. 가정에 따르면 T 1 T_{1} T 1 과 T 2 T_{2} T 2 의 비는
T 1 ( X 1 , ⋯ , X n ) T 2 ( X 1 , ⋯ , X n ) = σ T 1 ( Z 1 , ⋯ , Z n ) σ T 2 ( Z 1 , ⋯ , Z n ) = T 1 ( Z 1 , ⋯ , Z n ) T 2 ( Z 1 , ⋯ , Z n )
{{T_{1} \left( X_{1} , \cdots , X_{n} \right) } \over {T_{2} \left( X_{1} , \cdots , X_{n} \right) }} = { \sigma {T_{1} \left( Z_{1} , \cdots , Z_{n} \right) } \over {\sigma T_{2} \left( Z_{1} , \cdots , Z_{n} \right) }} = { {T_{1} \left( Z_{1} , \cdots , Z_{n} \right) } \over { T_{2} \left( Z_{1} , \cdots , Z_{n} \right)}}
T 2 ( X 1 , ⋯ , X n ) T 1 ( X 1 , ⋯ , X n ) = σ T 2 ( Z 1 , ⋯ , Z n ) σ T 1 ( Z 1 , ⋯ , Z n ) = T 2 ( Z 1 , ⋯ , Z n ) T 1 ( Z 1 , ⋯ , Z n )
이므로, θ \theta θ 와 σ \sigma σ 에 종속되지 않는 보조통계량이다.
■
설명 예시 예로써 샘플의 범위 R R R 과 표본표준편차 S S S 의 비는 보조통계량이다. 우선 범위range 는
R ( σ Z 1 + θ , ⋯ , σ Z n + θ ) = R ( X 1 , ⋯ , X n ) = X ( n ) − X ( 1 ) = σ Z ( n ) + θ − σ Z ( 1 ) − θ = σ ( Z ( n ) − σ Z ( 1 ) ) = σ R ( Z 1 , ⋯ , Z n )
\begin{align*}
& R \left( \sigma Z_{1} + \theta , \cdots , \sigma Z_{n} + \theta \right)
\\ =& R \left( X_{1} , \cdots , X_{n} \right)
\\ =& X_{(n)} - X_{(1)}
\\ =& \sigma Z_{(n)} + \theta - \sigma Z_{(1)} - \theta
\\ =& \sigma \left( Z_{(n)} - \sigma Z_{(1)} \right)
\\ =& \sigma R \left( Z_{1} , \cdots , Z_{n} \right)
\end{align*}
= = = = = R ( σ Z 1 + θ , ⋯ , σ Z n + θ ) R ( X 1 , ⋯ , X n ) X ( n ) − X ( 1 ) σ Z ( n ) + θ − σ Z ( 1 ) − θ σ ( Z ( n ) − σ Z ( 1 ) ) σ R ( Z 1 , ⋯ , Z n )
이고, 표본표준편차 S S S 는
S ( σ Z 1 + θ , ⋯ , σ Z n + θ ) = S ( X 1 , ⋯ , X n ) = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 = 1 n − 1 ∑ i = 1 n ( σ Z i + θ − σ Z ˉ − θ ) 2 = 1 n − 1 ∑ i = 1 n σ 2 ( Z i − Z ˉ ) 2 = σ 1 n − 1 ∑ i = 1 n ( Z i − Z ˉ ) 2 = σ S ( Z 1 , ⋯ , Z n )
\begin{align*}
& S \left( \sigma Z_{1} + \theta , \cdots , \sigma Z_{n} + \theta \right)
\\ =& S \left( X_{1} , \cdots , X_{n} \right)
\\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( X_{i} - \bar{X} \right)^{2} }
\\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( \sigma Z_{i} + \theta - \sigma \bar{Z} - \theta \right)^{2} }
\\ =& \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \sigma^{2} \left( Z_{i} - \bar{Z} \right)^{2} }
\\ =& \sigma \sqrt{ {{1} \over {n-1}} \sum_{i=1}^{n} \left( Z_{i} - \bar{Z} \right)^{2} }
\\ =& \sigma S \left( Z_{1} , \cdots , Z_{n} \right)
\end{align*}
= = = = = = S ( σ Z 1 + θ , ⋯ , σ Z n + θ ) S ( X 1 , ⋯ , X n ) n − 1 1 i = 1 ∑ n ( X i − X ˉ ) 2 n − 1 1 i = 1 ∑ n ( σ Z i + θ − σ Z ˉ − θ ) 2 n − 1 1 i = 1 ∑ n σ 2 ( Z i − Z ˉ ) 2 σ n − 1 1 i = 1 ∑ n ( Z i − Z ˉ ) 2 σ S ( Z 1 , ⋯ , Z n )
이다. 이들의 비 R / S R/S R / S 는 애초에 θ \theta θ 가 없어져서 θ \theta θ 에 대한 보조통계량이며, 비의 분자 분모에서 σ \sigma σ 가 약분되므로 σ \sigma σ 에 대한 보조통계량도 된다. 이는 언뜻 생각해보아도 둘 모두가 데이터의 산포도를 나타낸다는 점에서 직관적으로 말이 된다.