ギャンブラーの破産問題
📂確率論ギャンブラーの破産問題
問題

ギャンブラーの破産問題は、二人のプレイヤーが限られたお金を賭け、どちらかが破産するまで繰り返されるゲームを想定したランダムウォークの一種だ。
君がプレイヤーの一人だとすると、上の図のように、勝つ確率がp、負ける確率が(1−p)だと言える。状態0は君が破産した場合、状態Nは相手のお金を全部取り、これ以上ゲームを繰り返さない場合だ。これは0とNで自分自身に移る確率が1であることを意味している。iはゲームを始めるときの君の所持金と見ることができる。
基本的にp=21またはi=2Nであれば、ゲームは公平ではない。このゲームは一方が破産するまで終わらないが、「君がiだけのお金を持って始めた場合、相手を破産させて勝つ確率はどれくらいか」というのが数学的に興味深い質問になる。ただ、その前に「なぜこんな不公平で極端なゲームをするのか」という質問ができる。
しかし、これはギャンブラーの破産問題を単にゲームとして見た場合に出せる質問に過ぎず、現実では公平な戦いを見つけることの方がより難しい。これは多額の資本を持つ大企業と法の保護を受ける小規模企業の闘いと見ることもできるし、同じ資源を生産する国同士の総力戦と見ることもできる。不利な戦いでもしなくてはならないときがあり、そのときの勝率が気になるのは当然のことだ。
数学に戻って、私たちの関心事は「初期資本がiで、勝率がpの場合、相手を破産させ、全てのお金を持ち去る確率」Piを計算することだ。「相手を破産させ、全てのお金を持ち去る状況」を便宜上「勝利」と呼ぼう。
解決策
Piの定義から、P0=0であり、PN=1である。
パート1.
Piは、pの確率で最初のゲームに勝利し、(i+1)から新たに始めて勝利する確率と、(1−p)の確率で最初のゲームに負け、(i−1)から新たに始めて勝利する確率を足したものだと見ることができる。式で表すとPi=pPi+1+(1−p)Pi−1になる。左辺をpと(1−p)に分けると
Pi=(p+1−p)Pi=pPi+(1−p)Pi
ゆえに
⟹⟹⟹Pi=pPi+(1−p)Pip(Pi+1−Pi)=(Pi+1−Pi)=pPi+1+(1−p)Pi−1=pPi+1+(1−p)Pi−1(1−p)(Pi−Pi−1)p1−p(Pi−Pi−1)
再帰的に解いていくとPi−Pi−1=(p1−p)i−1(P1−P0)だが、P0=0であるため
Pi−Pi−1=(p1−p)i−1P1
パート2.
P1−P0=(p1−p)0P1P2−P1=(p1−p)1P1P3−P2=(p1−p)2P1Pi−Pi−1=(p1−p)i−1P1
各辺の式を足すと、左辺は
(P1−P0)+(P2−P1)+⋯+(Pi−Pi−1)=Pi−P0=Pi
右辺は
k=1∑i(p1−p)k−1P1=1−(p1−p)1−(p1−p)iP1
整理すると
Pi=1−(p1−p)1−(p1−p)iP1
パート3.
PN=1であるため
1=PN=1−(p1−p)1−(p1−p)NP1
したがって
P1=1−(p1−p)N1−(p1−p)
パート2.で得た式にP1を代入することにより
Pi=1−(p1−p)1−(p1−p)i⋅1−(p1−p)N1−(p1−p)=1−(p1−p)N1−(p1−p)i
を得る。
■