logo

수리통계적인 가설검정의 정의 📂수리통계학

수리통계적인 가설검정의 정의

정의 1

  1. 모수에 관한 명제가설hypothesis이라 한다.
  2. 주어진 샘플에 따라 가설 $H_{0}$ 을 참으로 받아들이게 만들거나 가설 $H_{0}$ 을 기각하고 $H_{1}$ 을 채택하는 문제를 가설 검정hypothesis Test이라 한다. 가설검정에서 상보적인complementary 가설 $H_{0}$, $H_{1}$ 을 각각 귀무가설null Hypothesis, 대립가설altanative Hypothesis라 부른다.
  3. 귀무가설 $H_{0}$ 을 기각하게끔 하는, 표본공간 $\Omega$ 의 부분집합 $R \subset \Omega$ 을 기각역rejection Region이라 한다.

설명

비단 통계학과가 아니더라도, 신입생 수준의 통계학이라도 접하면 가설검정에 대한 설명을 듣게 된다. 그것으로 충분한 사람들도 많지만 위의 정의들은 가능한 수리적으로, 애매모호함 없이, 엄밀하게 가설검정을 말하고 있다.

아래의 설명들은 독자가 이미 가설검정이라는 컨셉에 어느정도 익숙하다는 가정하에 쓰여졌다. 수리통계적으로 개념을 잡아보자.

가설

정의에 따르면 가설은 그냥 아무 ‘말’이 아니라 명제다. 여기서 모수에 대한 명제라는 언급이 중요하다. 가령 ‘정규성 검정’과 같이 그 명명 자체는 모수가 아니라 분포 그 자체에 대한 검정처럼 보이는 경우가 있더라도 파고들어보면 반드시 모수가 숨어있다. 예로써 하르케-베라 테스트는 정규성 검정이며, 알고보면 왜도첨도를 통해 가설검정을 한다.

가설 검정

‘채택하는’에 밑줄이 그어져있는데, 조심하라는 의미다. 알다시피 거의 대부분의 책에서 기각reject과 채택accept이라는 표현을 모두 사용하지만 거의 대부분의 교수님들이 채택이라는 표현에 주의를 준다. 대립가설을 채택한다는 것은 정말 대립가설을 참으로 받아들인다기보다는 귀무가설을 기각한 것이고, 귀무가설을 참으로 받아들인다는 것 역시 귀무가설을 기각할 수 없다는 것이지 적극적으로 ‘채택’한다는 표현은 되도록 삼가는 편이다.

귀무가설과 대립가설을 정의할 때 상보적complementary이라는 표현을 썼는데, 이 역시 수리논리적으로 보았을 때 $H_{0}$ 와 $H_{1}$ 가 서로 부정negation이 아님을 강조하는 표현이다. 가설검정에서 귀무가설이 참이 아니라는 것은 반드시 대립가설이 참이라는 결론으로 이어지지 않는다. 더 실전적으로 설명하자면 대립가설은 귀무가설과 동시에 성립할 수만 없으면 충분하다. 가령 $$ H_{0} : \theta = 0 \\ H_{1} : \theta < 0 $$ 과 같은 가설검정은 전혀 문제가 없지만, $$ H_{0} : \theta \in [-1,0] \\ H_{1} : \theta \in [0,+1] $$ 일 때는 $\theta = 0$ 일 때 귀무가설과 대립가설이 둘 다 참일 수 있어 문제가 있다.

기각역

정의에 따라 기각역은 사건이다. 가설 검정을 한 번의 시행으로 본다면, $H_{0}$ 가 기각될 확률은 곧 기각이라는 사건이 발생할 확률이다. 이 확률이 꽤 낮은데도, 가령 $\alpha = 0.05$ 보다 낮은데도 일어났다면 이는 예삿일이 아니라 주목할만한 일로 볼 수 있는 것이다. 이러한 스토리텔링에서 유의수준p-value과 같은 개념이 자연스럽게 떠오를 수 있다.

같이보기


  1. Casella. (2001). Statistical Inference(2nd Edition): p373~374. ↩︎