가설 검정의 검정력 함수

가설 검정의 검정력 함수

Power Function of Hypothesis Test

정의 1

가설검정: $$ \begin{align*} H_{0} :& \theta \in \Theta_{0} \\ H_{1} :& \theta \in \Theta_{0}^{c} \end{align*} $$

위와 같은 가설검정이 주어져 있고 $\alpha \in [0,1]$ 이라 하자.

  1. 모수 $\theta$ 에 대해 기각역이 $R$ 인 함수 $\beta (\theta) := P_{\theta} \left( \mathbf{X} \in \mathbb{R} \right)$ 을 검정력 함수Power Function라 한다.
  2. $\sup_{\theta \in \Theta_{0}} \beta (\theta) = \alpha$ 면 주어진 가설검정을 사이즈Size $\alpha$ 가설검정이라 한다.
  3. $\sup_{\theta \in \Theta_{0}} \beta (\theta) \le \alpha$ 면 주어진 가설검정을 레벨Level $\alpha$ 가설검정이라 한다.

설명

파워?

보통 수학에서 파워라 하면 거듭제곱 pow나 冪덮을 멱자를 써서 멱함수 $f(x) = x^{-\alpha}$ 라 말하는데, 통계학의 맥락에서는 그냥 가설검정에서의 검정하는 힘Power이라 받아들이면 된다.

검정력?

정의에서 $\beta$ 는 확률 $P_{\theta}$ 를 통해 정의되므로 당연히 그 치역은 $[0,1]$ 의 부분집합이다. $\beta (\theta)$ 의 값이 크다는 것―검정력, 검정하는 힘이 크다는 것은 곧 귀무가설을 기각 시키는 힘이다. 대립가설을 기각시켜도 검정은 검정 아닌가? 하는 의문이 들 수 있는데, 원래 어떤 가설검정이든 말을 할때는 귀무가설을 기준으로 말하기도 하고 $R$ 이 귀무가설의 기각역이니 검정이라 하면 오직 귀무가설이 기각되는지 아닌지만 신경쓰면 될 것이다.

우리는 이 검정력 함수를 통해 가설검정의 좋고 나쁨을 평가한다. 더 좋은 검정방법이 있다면 그것을 더 강하다More Powerful고 말하는데, 우리는 이러한 표현에서 보편적인 수학에서의 Power와 달리 정말 힘을 말하는 것임을 알 수 있다. 수리통계학의 관점에서 어떤 가설검정이 합리적인지, 효율적인지 따지는 것은 아주 자연스러운 모티브다.

다만 여기서 무턱대고 검정력 자체만을 좋고 나쁨의 지표로 보아서는 곤란하다. 가령 어떤 샘플이 들어오든 귀무가설을 기각해버리는 $\beta(\theta) = 1 = 100 \%$ 을 생각해보면 검정력 자체야 아주 강하긴한데, 너무 지나치게 강해서 제1종 오류(귀무가설이 참인데 기각하는 오류)를 전혀 잡지 못하게 된다.

사이즈와 레벨

보통 사이즈와 레벨이라는 단어는 구분하지 않는 경우가 많고, 이랬다가 저랬다가 하면서 쓰긴 하지만 일단 저렇게 정의를 하게 되면 당연히 레벨 $\alpha$ 테스트의 집합은 사이즈 $\alpha$ 테스트의 집합을 포함한다. 이 차이를 면밀하게 따지고 고민해야할 연구 주제에서는 엄격하게 구분해서 용어를 사용해야 할 것이다.

$\alpha$ 의 의미는 무엇인가? 사이즈든 레벨이든 $\alpha$ 가 높다는 것은 귀무가설이 참일 때 기각될 확률이 큰 모수가 있다는 것이다. 이 $\alpha$ 가 클수록 관대하게 귀무가설을 기각하고, 만약 $\alpha$ 가 아주 작다면 아주 보수적인 검정이 된다. 이러한 차이는 기각역에 따라서 난다. 한편 수준Level이라는 표현과 이 설명에서 유의수준Critical Level이 떠오르는 것이 자연스럽지만, 결국 다른 이야기는 다른 이야기기 때문에 억지로 엮을 필요도 없고 사실 엮지도 말아야한다. 개념적으로만 받아들이자.

예시: 정규분포

$$ \begin{align*} H_{0} :& \theta \le \theta_{0} \\ H_{1} :& \theta > \theta_{0} \end{align*} $$ 분산이 알려진 정규분포 $N \left( \theta , \sigma^{2} \right)$ 의 랜덤샘플 $X_{1} , \cdots , X_{n}$ 에 대해 위와 같은 가설검정을 생각해보면, z-스코어가 어떤 상수 $c$ 보다 크면 귀무가설을 기각할 수 있을 것이다. 검정력 함수 $\beta$ 는 다음과 같이 $\displaystyle {{ \bar{X} - \theta_{0} } \over { \sigma / \sqrt{n} }}$ 가 있는 확률 $P$ 안을 $\theta$ 에 대한 식으로 바꿈으로써 구할 수 있다. $$ \begin{align*} \beta \left( \theta \right) =& P_{\theta} \left( {{ \bar{X} - \theta_{0} } \over { \sigma / \sqrt{n} }} > c \right) \\ =& P_{\theta} \left( {{ \bar{X} - \theta } \over { \sigma / \sqrt{n} }} > c + {{ \theta_{0} - \theta } \over { \sigma / \sqrt{n} }} \right) \\ =& P_{\theta} \left( Z > c + {{ \theta_{0} - \theta } \over { \sigma / \sqrt{n} }} \right) \end{align*} $$ 여기서 $\displaystyle Z := {{ \bar{X} - \theta_{0} } \over { \sigma / \sqrt{n} }}$ 는 표준정규분포를 따르는 확률변수다.


  1. Casella. (2001). Statistical Inference(2nd Edition): p383, 385. ↩︎

댓글