logo

충분통계량이 포함된 최강력검정 📂수리통계학

충분통계량이 포함된 최강력검정

정리

가설검정: $$ \begin{align*} H_{0} :& \theta = \theta_{0} \\ H_{1} :& \theta = \theta_{1} \end{align*} $$

위와 같은 가설검정에서 $\theta$ 에 대한 충분통계량 $T$ 의 $\theta_{0}, \theta_{1}$ 에 대한 확률밀도함수 혹은 확률질량함수를 $g \left( t | \theta_{0} \right), g \left( t | \theta_{1} \right)$ 라고 하자. 그러면 기각역 $S$ 와 어떤 상수 $k \ge 0$ 에 대해, 다음 세 조건을 만족하면서 $T$ 에 종속된 모든 가설 검정은 레벨 $\alpha$최강력검정이다.

  • (i): $g \left( t | \theta_{1} \right) > k g \left( t | \theta_{0} \right)$ 이면 $t \in S$
  • (ii): $g \left( t | \theta_{1} \right) < k g \left( t | \theta_{0} \right)$ 이면 $t \in S^{c}$
  • (iii): $\alpha = P_{\theta_{0}} \left( T \in S \right)$

설명

이 정리는 본질적으로 피어슨-네이만 보조정리의 따름정리다. 칼린-루빈 정리의 증명에 쓰이는 것뿐만 아니라, 충분통계량을 통해 최강력검정을 간편하게 고안할 수 있다는 점을 시사한다.

증명 1

원래의 샘플 $\mathbf{X}$ 에 대한 기각역은 $R = \left\{ \mathbf{x} : T \left( \mathbf{X} \right) \in S \right\}$ 다. 네이만 인수분해 정리에 따라, $\mathbf{X}$ 의 확률밀도함수 혹은 확률질량함수는 음이 아닌 함수 $h \left( \mathbf{x} \right)$ 에 대해 $$ f \left( \mathbf{x} | \theta_{i} \right) = g \left( T \left( \mathbf{x} \right) | \theta_{i} \right) h \left( \mathbf{x} \right) \qquad , i = 0,1 $$ 와 같이 나타낼 수 있다. 정리에서 만족시킨다고 가정한 조건 (i), (ii)에 따라 $$ \begin{align*} \mathbf{x} \in R \impliedby & f \left( \mathbf{x} | \theta_{1} \right) > g \left( T \left( \mathbf{x} \right) | \theta_{1} \right) h \left( \mathbf{x} \right) = k g \left( t | \theta_{0} \right) = k f \left( \mathbf{x} | \theta_{0} \right) \\ \mathbf{x} \in R^{c} \impliedby & f \left( \mathbf{x} | \theta_{1} \right) < g \left( T \left( \mathbf{x} \right) | \theta_{1} \right) h \left( \mathbf{x} \right) = k g \left( t | \theta_{0} \right) = k f \left( \mathbf{x} | \theta_{0} \right) \end{align*} $$ 이고, 조건 (iii)에 따라 다음이 성립한다. $$ P_{\theta_{0}} \left( \mathbf{X} \in R \right) = P_{\theta_{0}} \left( T \left( \mathbf{X} \right) \in S \right) = \alpha $$

피어슨-네이만 보조정리: 위와 같은 가설검정에서 $\theta_{0}, \theta_{1}$ 에 대한 확률밀도함수 혹은 확률질량함수를 $f \left( \mathbf{x} | \theta_{0} \right), f \left( \mathbf{x} | \theta_{1} \right)$ 이라 하고 기각역 $R$ 과 어떤 상수 $k \ge 0$ 에 대해 만약

  • (i): $f \left( \mathbf{x} | \theta_{1} \right) > k f \left( \mathbf{x} | \theta_{0} \right)$ 이면 $\mathbf{x} \in R$
  • (ii): $f \left( \mathbf{x} | \theta_{1} \right) < k f \left( \mathbf{x} | \theta_{0} \right)$ 이면 $\mathbf{x} \in R^{c}$
  • (iii): $\alpha = P_{\theta_{0}} \left( \mathbf{X} \in R \right)$

이라면, 다음 두 명제는 동치다.

피어슨-네이만 보조정리의 $(\impliedby)$ 에 따라, 정리에서 주어진 가설검정은 최강력검정이다.


  1. Casella. (2001). Statistical Inference(2nd Edition): p389. ↩︎