베이즈 정리로 보는 몬티홀 딜레마
설명
알다시피 몬티홀 게임은 실제로 경품이 어디있든 관계 없이 선택을 바꾸는 것이 유리하다. 이것을 팩트로써 받아들이냐와 별개로 몬티홀 게임을 직관적으로 이해하지 못했거나 수식적인 표현이 서툰 사람들이 있다.
편의상 본인이 플레이어고, 1번 문을 선택했다고 생각해보자.
이 때 우리는 경품에 대한 어떤 정보도 없기에, 어떤 번호든 선택할 확률은 같다고 봐야한다. 그런데 이 선택을 보고 사회자가 3번을 열어주었다고 하자. 사회자는 플레이어의 선택과 실제 경품의 위치를 보고 열어줄 문을 고른다:
- 만약 경품이 실제로 3번에 있었다면 3번을 열어선 안되므로 3번이 열릴 확률은 $0$ 이다.
- 만약 경품이 실제로 2번에 있었다면 플레이어가 1번을 골랐고 2번을 열어줄 수 없으므로 3번이 열릴 확률은 $1$ 이다.
- 만약 경품이 실제로 1번에 있었다면 2번이든 3번이든 사회자가 마음대로 고르면 되기 때문에 3번이 열릴 확률은 $1/2$ 이다.
애초에 문을 열어준 사건 자체가 랜덤하게 일어난 일이 아니라는 점을 다시 생각해보자. 사회자 역시 아무 정보도 없이 아무 문이나 찍어서 경품이 없었다면 처음부터 두 개의 문만 가지고 게임을 시작한 것과 다를 게 없다. 문을 열어준 사건은 결코 우연이 아니라 플레이어의 행동을 본 뒤에 확실한 오답을 지워주는 힌트다. 당연히 플레이어는 무작위로 선택하는 것보다 많은 정보를 가진 상태고, 첫 선택을 유지하는 것이든 바꾸는 것이든 둘 중 하나가 유리해지는 것이 정상이다.
사회자의 선택이 게임을 ‘업데이트’했으니, 베이즈 정리를 통해 사후확률을 계산해보자. 1번을 유지했을 때 경품이 있을 확률을 $p_1$, 2번으로 바꿨을 때 경품이 있을 확률을 $p_2$ 이라고 하자. $$ p_{1} = {{ 1/3 \cdot 1/2 } \over {1/3 \cdot 1/2 + 1/3 \cdot 1 + 1/3 \cdot 0}} = {{1} \over {3}} $$
$$ p_{2} = {{ 1/3 \cdot 1 } \over {1/3 \cdot 1/2 + 1/3 \cdot 1 + 1/3 \cdot 0}} = {{2} \over {3}} $$ 간혹 ‘쉽게 말해 확률을 몰아주는 거라고 보면 된다’라는 직관적인 설명보다 구체적인 계산을 더 좋아하는 사람이 있다. 베이즈 정리를 사용하면 경우의 수를 나누면서 ‘복잡하게 머리 쓸 일 없이’ 계산만으로 같은 결과를 낼 수 있다.