가설검정과 신뢰집합의 일대일 대응관계
정리
모수공간 $\Theta$ 와 공간 $\mathcal{X}$ 가 주어져 있다고 하자.
- 각각의 $\theta_{0} \in \Theta$ 에 대해 $A \left( \theta_{0} \right)$ 을 가설검정 $H_{0} : \theta = \theta_{0}$ 의 레벨 $\alpha$ 채택역이라 하자. 각각의 $\mathbf{x} \in \mathcal{X}$ 에 대해 다음과 같이 집합 $C \left( \mathbf{x} \right) \subset \Theta$ $$ C \left( \mathbf{x} \right) := \left\{ \theta_{0} : \mathbf{x} \in A \left( \theta_{0} \right) \right\} $$ 을 정의하자. 그러면 랜덤 집합random set $C \left( \mathbf{X} \right)$ 는 $1 - \alpha$ 신뢰집합이다.
- 역으로, $C \left( \mathbf{X} \right)$ 가 $1 - \alpha$ 신뢰집합이라 하자. 모든 $\theta_{0} \in \Theta$ 에 대해 다음과 같이 집합 $A \left( \theta_{0} \right) \subset \mathcal{X}$ $$ A \left( \theta_{0} \right) = \left\{ \mathbf{x} : \theta_{0} \in C \left( \mathbf{x} \right) \right\} $$ 을 정의하자. 그러면 사건 $A \left( \theta_{0} \right)$ 은 가설검정 $H_{0} : \theta = \theta_{0}$ 의 레벨 $\alpha$ 채택역이다.
설명
이 정리의 모티브를 간단하게 요약하자면 다음과 같다. $$ \theta_{0} \in C \left( \mathbf{x} \right) \iff \mathbf{x} \in A \left( \theta_{0} \right) $$
증명 1
$\left( \implies \right)$
$A \left( \theta_{0} \right)$ 가 레벨 $\alpha$ 의 채택역이므로, $$ \begin{align*} P_{\theta_{0}} \left( \mathbf{X} \notin A \left( \theta_{0} \right) \right) \le & \alpha \\ P_{\theta_{0}} \left( \mathbf{X} \in A \left( \theta_{0} \right) \right) \ge & 1 - \alpha \end{align*} $$ 이다. 가정에서 이는 모든 $\theta_{0}$ 에 대해 성립했으므로 $\theta$ 라 적을 수 있고, $C \left( \mathbf{x} \right) = \left\{ \theta_{0} : \mathbf{x} \in A \left( \theta_{0} \right) \right\}$ 라 정의했으므로 $C \left( \mathbf{X} \right)$ 의 커버리지 확률은 $$ P_{\theta} \left( \mathbf{X} \in C \left( \mathbf{X} \right) \right) = P_{\theta} \left( \mathbf{X} \in A \left( \theta \right) \right) \ge 1 - \alpha $$ 이다. 다시 말해, $C \left( \mathbf{X} \right)$ 는 $1-\alpha$ 신뢰집합이다.
$\left( \impliedby \right)$
채택역 $A \left( \theta_{0} \right)$ 인 $H_{0} : \theta = \theta_{0}$ 의 제1종 오류 확률은 $$ P_{\theta_{0}} \left( \mathbf{X} \notin A \left( \theta_{0} \right) \right) = P_{\theta_{0}} \left( \theta_{0} \notin C \left( \mathbf{X} \right) \right) \le \alpha $$ 이므로, 레벨 $\alpha$ 가설검정이다.
■
Casella. (2001). Statistical Inference(2nd Edition): p422. ↩︎