logo

최정확 신뢰집합 📂수리통계학

최정확 신뢰집합

정의 1

$\theta$ 에 대한 가설검정$1 - \alpha$ 신뢰집합을 $C \left( \mathbf{x} \right)$ 이라 하고, 채택역을 $A \left( \theta \right) = C \left( \mathbf{x} \right)^{c}$ 이라 하자.

  1. $P_{\theta} \left( \theta’ \in C \left( \mathbf{X} \right) \right)$ 를 $\theta’ \ne \theta$ 에 대한 펄스 커버리지false Coverage 확률이라 한다. 원래의 커버리지 확률 $P_{\theta} \left( \theta \in C \left( \mathbf{X} \right) \right)$ 을 이와 대비되는 표현인 트루 커버리지true Coverage 확률이라 부른다.
  2. $1-\alpha$ 신뢰집합 $C \left( \mathbf{x} \right)$ 이 모든 $\theta’ \ne \theta$ 에 대해 펄스 커버리지 확률이 $1-\alpha$ 보다 작거나 같으면 불편unbiased이라 한다. 다시 말해, 다음을 성립시킨다. $$ P_{\theta} \left( \theta’ \in C \left( \mathbf{X} \right) \right) \le 1 - \alpha $$
  3. $1-\alpha$ 신뢰집합 중 펄스 커버리지 확률을 최소화하는 $1-\alpha$ 신뢰집합을 최정확 신뢰집합uniformly Most Accurate(UMA) Confidence set이라 하고, 신뢰구간일 때는 네이만-최단neyman-shortest라 하기도 한다.

설명

신뢰구간

특히 $C \left( \mathbf{X} \right)$ 가 신뢰구간일 때, 펄스 커버리지 확률은 다음과 같이 세가지로 구분해서 따로 정의한다. $$ \begin{align*} C \left( \mathbf{X} \right) = \left[ L , U \right] \implies & P_{\theta} \left( \theta’ \in C \left( \mathbf{X} \right) \right) \qquad , \theta’ \ne \theta \\ C \left( \mathbf{X} \right) = \left[ L , \infty \right) \implies & P_{\theta} \left( \theta’ \in C \left( \mathbf{X} \right) \right) \qquad , \theta’ < \theta \\ C \left( \mathbf{X} \right) = \left( -\infty , U \right] \implies & P_{\theta} \left( \theta’ \in C \left( \mathbf{X} \right) \right) \qquad , \theta’ > \theta \end{align*} $$

UMP 가설검정과의 관계

가설검정과 신뢰집합의 일대일 대응관계에 따르면 최강력검정에도 그에 대응되는 신뢰집합이 있어야할텐데, 그것이 바로 최정확 신뢰집합이라 간주해도 무방하다.

정의에서 펄스 커버리지 확률을 최소화한다는 것은 가설검정이 최적optimal인가 하는 질문과도 맞닿아있다. 이와 대응되는 신뢰구간이 최적이라는 것은 그 길이가 가장 짧다는 것이고, 우리는 같은 신뢰수준 하에서라면 신뢰구간이 가장 짧기를 바라므로 이를 네이만-최단이라 부르는 것도 납득이 될 것이다.

생각해보면 네이만-피어슨 보조정리칼린-루빈 정리와 같은 정리들이 보장해주는 최강성은 너무나 한정적이었다. 기본적으로 대부분의 최강력검정들은 단측one-sided 검정이었는데, UMA는 양측two-sided 검정에서 그 의미가 특히 중요해진다.


  1. Casella. (2001). Statistical Inference(2nd Edition): p444~446. ↩︎