베이즈 정리로 보는 몬티홀 딜레마

베이즈 정리로 보는 몬티홀 딜레마

설명

20180927\_172017.png

알다시피 몬티홀 게임은 실제로 경품이 어디있든 관계 없이 선택을 바꾸는 것이 유리하다. 이것을 팩트로써 받아들이냐와 별개로 몬티홀 게임을 직관적으로 이해하지 못했거나 수식적인 표현이 서툰 사람들이 있다.

20180927\_173636.png

편의상 본인이 플레이어고, 1번 문을 선택했다고 생각해보자.

20180927\_173803.png

이 때 우리는 경품에 대한 어떤 정보도 없기에, 어떤 번호든 선택할 확률은 같다고 봐야한다. 그런데 이 선택을 보고 사회자가 3번을 열어주었다고 하자. 사회자는 플레이어의 선택과 실제 경품의 위치를 보고 열어줄 문을 고른다:

20180927\_173849.png

애초에 문을 열어준 사건 자체가 랜덤하게 일어난 일이 아니라는 점을 다시 생각해보자. 사회자 역시 아무 정보도 없이 아무 문이나 찍어서 경품이 없었다면 처음부터 두 개의 문만 가지고 게임을 시작한 것과 다를 게 없다. 문을 열어준 사건은 결코 우연이 아니라 플레이어의 행동을 본 뒤에 확실한 오답을 지워주는 힌트다. 당연히 플레이어는 무작위로 선택하는 것보다 많은 정보를 가진 상태고, 첫 선택을 유지하는 것이든 바꾸는 것이든 둘 중 하나가 유리해지는 것이 정상이다.

사회자의 선택이 게임을 ‘업데이트’했으니, 베이즈 정리를 통해 사후확률을 계산해보자. 1번을 유지했을 때 경품이 있을 확률을 $p_1$, 2번으로 바꿨을 때 경품이 있을 확률을 $p_2$ 이라고 하자. $$ \displaystyle p_{1} = {{ 1/3 \cdot 1/2 } \over {1/3 \cdot 1/2 + 1/3 \cdot 1 + 1/3 \cdot 0}} = {{1} \over {3}} $$

$$ \displaystyle p_{2} = {{ 1/3 \cdot 1 } \over {1/3 \cdot 1/2 + 1/3 \cdot 1 + 1/3 \cdot 0}} = {{2} \over {3}} $$ 20190430\_080007.png 간혹 ‘쉽게 말해 확률을 몰아주는 거라고 보면 된다’라는 직관적인 설명보다 구체적인 계산을 더 좋아하는 사람이 있다. 베이즈 정리를 사용하면 경우의 수를 나누면서 ‘복잡하게 머리 쓸 일 없이’ 계산만으로 같은 결과를 낼 수 있다.

댓글