귀무가설과 대립가설을 정하는 방법

귀무가설과 대립가설을 정하는 방법


🚧 이 포스트는 아직 이관 작업이 완료되지 않았습니다 🚧

귀무가설 $H_{0}$ vs 대립가설 $H_{1}$

귀무가설은 영가설이라는 이름으로도 불린다.2018년 4월 기준으로 일부 교과서나 위키백과에서는 귀무가설을 ‘통계학에서 처음부터 버릴것을 예상하는 가설’로, 대립가설을 ‘연구를 통해 입증되기를 기대하거나 예상하는 가설’로 설명하고 있으나 이는 상당히 잘못된 설명이다.

20180330\_120707.png 앨리스AliceBob을 고소했다고 생각해보자. 밥이 유죄임을 입증하기 위해서는 무죄추정의 원칙에 따라 상당히 확실한 증거가 있어야한다. 재판에서는 실제로 죄가 있는가 없는가보다 범죄사실을 증명할수 있느냐 없느냐가 중요한 것이고, 이때 귀무가설 $H_{0}$ 는 ‘밥에게 죄가 없다’가 되고, $H_{1}$ 는 ‘밥에게 죄가 있다’ 가 된다. 그런데 이러한 재판에서 귀무가설이 ‘처음부터 버릴것을 예상하는 가설’이라는 것은 이상하다. 밥의 범죄사실을 입증하고 싶은 사람이 앨리스니까 그렇게 귀무가설과 대립가설을 세워도 된다고 할 수도 없다. 변호사도, 판사도, 배심원도 모두 같은 귀무가설과 대립가설 아래서 재판에 임하기 때문이다. 밥의 변호사는 이 재판에서 ‘밥에게 죄가 없다’를 대립가설로 세울까? 그렇지 않을 것이다.

20180330\_120510.png 납득이 안된다면 밥이 앨리스를 무고죄로 역고소했다고 생각해보자. 보통의 경우 둘 중 하나는 반드시 유죄고, 이 때 밥이 입증하고 싶은 것은 앨리스가 무고죄를 저질렀다는 사실이다. 재판을 따로 보면 문제가 없다고 말할 수 있겠지만 결국 처음 앨리스가 고소를 결심했던 그 사건에 초점을 맞추면 무엇을 ‘버리는지’ 혹은 ‘입증하고 싶은지’로 귀무가설을 정한다는 설명은 적절하지 않다.물론 이는 법리적인 이야기고 ‘통계학’이나 ‘연구’에서는 다르다고 할 수도 있겠다. 하지만 통계학과 연구에서도 귀무가설이 입증하고 싶은 가설인 예시는 얼마든지 있다. 로지스틱 회귀분석에서 모델을 선택하면 기대하는 것은 보통 그 모델이 적합하다는 것인데, 실제 적합도 검정에서는 모델이 잘 적합되었다는 것이 귀무가설이다. 현실 속에 유니콘이 존재하지 않는다는 것을 밝히는 연구에서도 귀무가설은 ‘유니콘은 존재한다’일까? 그렇지 않을 것이다.

요지는 재판이든 연구든 누군가의 ‘의도’에 따라 귀무가설과 대립가설을 정하는 게 아니라는 것이다. 밥이 무죄라는 말이나 밥은 유죄가 아니라는 말이나 긍정과 부정이 뒤바뀌었을 뿐 의미는 다르지 않다.(법리적인 해석의 사소한 차이는 넘어가도록 하자.) 회귀분석을 처음 접하면서 많이 헷갈리는 부분도 바로 이런 ‘부정’을 구분하기 힘든데에서 온다. 이 때 영어와 우리말에서 긍정과 부정의 차이를 생각해보면 도움이 된다.

예를 들어 밥이 게임을 하기 싫어한다고 해보자. 이때 앨리스가 우리말로 “게임하고 싶어?“라고 묻는다면 밥은 “아니, 하기 싫어.“라고 대답할 것이다. 반대로 “게임하기 싫어?“라고 묻는다면 밥은 “응, 하기 싫어.“라고 대답할 것이다. 한편 앨리스가 영어로 “Do you wanna play this game?“이라고 묻는다면 밥은 “No, I don’t.“라고 대답할 것이다. 반대로 “Don’t you wanna play this game?“라고 물어도 밥은 여전히 “No, I don’t.” 이라고 대답할 것이다. 말하자면 가설은 이런 식으로 질문이 긍정형이든 부정형이든 일관되는 대답이 돌아오도록 해야한다.

그래서 결국 어떤 걸 귀무가설로 하고 어떤 걸 대립가설로 정하는지에 대한 대답은 유의확률에 대한 이야기에서 계속하도록 하겠다.

댓글