수리통계적인 유의확률의 정의

수리통계적인 유의확률의 정의

Definition of p-value in Mathematical Statistics

정의 1

가설검정 $H_{0} \text{ vs } H_{1}$ 이 주어져 있다고 하자. 모든 실현 $\mathbf{x} \in \Omega$ 에 대해 $0 \le p \left( \mathbf{x} \right) \le 1$ 를 만족시키는 검정 통계량 $p \left( \mathbf{X} \right)$ 를 유의확률 혹은 p-밸류p-value라 한다. $p \left( \mathbf{X} \right)$ 가 모든 $\theta \in \Theta_{0}$ 와 모든 $\alpha \in [0,1]$ 에 대해 다음을 만족하면 유효하다Valid고 말한다. $$ P_{\theta} \left( p \left( \mathbf{X} \right) \le \alpha \right) \le \alpha $$

설명

유효한 p-밸류의 조건에 있는 수식을 풀어서 생각해보면, 귀무가설 하에서 $p \left( \mathbf{X} \right) \le \alpha$ 일 확률이 작다는 의미가 된다. 다시 말해, $p \left( \mathbf{X} \right)$ 가 작으면 $H_{0}$ 가 기각된다는 근거가 된다. 이러한 의미에서 조건의 부등식은 ‘유효한 유의확률’의 조건으로써 타당함을 확인할 수 있다.

통계학을 공부하는 이상 유의확률은 수도 없이 볼테니 뻔한 설명은 덧붙이지 않겠다. 다만 수리통계적인 의미에서 주목할만한 점은 유의확률 역시 통계량이며, 따라서 확률변수라는 사실이다. 유효성Validity에 대한 정의가 없이도 유의확률은 치역이 $[0,1]$ 에 속하기만 하면 되고, ‘작으면 귀무가설을 기각한다’라는 식의 직관적인 의미는 고려하지 않는다. 물론 유효하지 않은 유의확률을 쓸 이유는 없으나, 이렇게 수식으로 간단명료하게 p-밸류를 정의할 수 있다는 점이 중요하다.


  1. Casella. (2001). Statistical Inference(2nd Edition): p397. ↩︎

댓글