귀무가설과 대립가설을 정하는 방법
설명
가설검정: 귀무가설 $H_{0}$ vs 대립가설 $H_{1}$
2018년 4월 기준으로 일부 교과서나 위키백과에서는 귀무가설을 ‘통계학에서 처음부터 버릴것을 예상하는 가설’로, 대립가설을 ‘연구를 통해 입증되기를 기대하거나 예상하는 가설’로 설명하고 있는데, 통계학을 당장 필요한 부분만 공부하거나 가볍게 알아만 두는 정도면 몰라도 깊게 들어가면 이러한 정의에 무조건적으로 동의하기 어려워진다.
비과학적인 표현: 기대와 예상
실제 과학의 맥락에선 구구절절 설명할 필요도 없이 확실한 예가 많으니 조금 더 실제 사회와 가까운 곳에서 생각해보자. 이 단락에서만 대립가설을 ‘연구를 통해 입증되기를 기대하거나 예상하는 가설’이 아니라 ‘재판를 통해 입증되기를 기대하거나 예상하는 가설’이라 받아들이자.
앨리스alice가 밥bob을 고소했다고 생각해보자. 밥이 유죄임을 입증하기 위해서는 무죄추정의 원칙에 따라 상당히 확실한 증거가 있어야한다. 재판에서는 실제로 죄가 있는가 없는가보다 범죄사실을 증명할수 있느냐 없느냐가 중요한 것이고, 이때 귀무가설 $H_{0}$ 는 ‘밥에게 죄가 없다’가 되고, $H_{1}$ 는 ‘밥에게 죄가 있다’ 가 된다. 그런데 이러한 재판에서 귀무가설이 ‘처음부터 버릴것을 예상하는 가설’이라는 것은 이상하다. 밥의 범죄사실을 입증하고 싶은 사람이 앨리스니까 그렇게 귀무가설과 대립가설을 세워도 된다고 할 수도 없다. 변호사도, 판사도, 배심원도 모두 같은 귀무가설과 대립가설 아래서 재판에 임하기 때문이다. 밥의 변호사는 이 재판에서 ‘밥에게 죄가 없다’를 대립가설로 세울까? 그렇지 않을 것이다.
납득이 안된다면 밥이 앨리스를 무고죄로 역고소했다고 생각해보자. 보통의 경우 둘 중 하나는 반드시 유죄고, 이 때 밥이 입증하고 싶은 것은 앨리스가 무고죄를 저질렀다는 사실이다. 재판을 따로 보면 문제가 없다고 말할 수 있겠지만 결국 처음 앨리스가 고소를 결심했던 그 사건에 초점을 맞추면 무엇을 ‘버리는지’ 혹은 ‘입증하고 싶은지’로 귀무가설을 정한다는 설명은 적절하지 않다.
연구자의 의도
물론 이는 법리적인 이야기고 ‘통계학’이나 ‘연구’에서는 다르다고 할 수도 있겠다. 하지만 통계학과 연구에서도 귀무가설이 입증하고 싶은 가설인 예시는 얼마든지 있다. 로지스틱 회귀분석에서 모델을 선택하면 기대하는 것은 보통 그 모델이 적합하다는 것인데, 실제 적합도 검정에서는 모델이 잘 적합되었다는 것이 귀무가설이다. 현실 속에 유니콘이 존재하지 않는다는 것을 밝히는 연구에서도 귀무가설은 ‘유니콘은 존재한다’일까? 그렇지 않을 것이다.
요지는 재판이든 연구든 누군가의 ‘의도’에 따라 귀무가설과 대립가설을 정하는 게 아니라는 것이다. 밥이 무죄라는 말이나 밥은 유죄가 아니라는 말이나 긍정과 부정이 뒤바뀌었을 뿐 의미는 다르지 않다.(법리적인 해석의 사소한 차이는 넘어가도록 하자.) 회귀분석을 처음 접하면서 많이 헷갈리는 부분도 바로 이런 ‘부정’을 구분하기 힘든데에서 온다.
이 때 영어와 우리말에서 긍정과 부정의 차이를 생각해보면 도움이 된다. 예를 들어 밥이 어떤 게임을 하기 싫어한다고 해보자:
- 이때 앨리스가 우리말로 “게임하고 싶어?“라고 묻는다면 밥은 “아니, 하기 싫어.“라고 대답할 것이다. 반대로 “게임하기 싫어?“라고 묻는다면 밥은 “응, 하기 싫어.“라고 대답할 것이다.
- 한편 앨리스가 영어로 “Do you wanna play this game?“이라고 묻는다면 밥은 “No, I don’t.“라고 대답할 것이다. 반대로 “Don’t you wanna play this game?“라고 물어도 밥은 여전히 “No, I don’t.” 이라고 대답할 것이다.
비유하자면 가설검정은 영어식 질답처럼 질문이 긍정형이든 부정형이든 일관되는 대답이 돌아오도록 정해져야 한다. 어떤 분포를 사용해서 가설검정을 하게 된다면 그 가설검정은 연구자의 의도와 관계없이 해당 분포의 특징에 따라 달라진다.
같이보기
- 가설검정의 쉬운 정의: 엄밀함보다는 적당히 받아들이기 쉬운 정의를 소개한다.
- 귀무가설과 대립가설을 정하는 방법: 그 정의에 어떤 문제가 있는지 설명한다.
- 가설검정의 어려운 정의: 가설검정에 대해 비교적 엄밀한 수리통계적 정의를 소개한다.