離散マルコフ連鎖
📂確率論離散マルコフ連鎖
定義
状態空間が可算集合で、次を満たす離散的確率過程 {Xn} を 離散マルコフ連鎖dTMC または簡単に マルコフ連鎖markov Chain, MCと言う。
p(Xn+1=j∣Xn=i,Xn−1=k,⋯,X0=l)=p(Xn+1=j∣Xn=i)
参照
説明
pij:=p(Xn+1=j∣Xn=i) を 遷移確率transition Probabilityと言い、現在の状態を意味するi を ソースステートsource State、目標状態を意味するj を ターゲットステートtarget Stateという。k ステップ後の遷移確率は pij(k):=p(Xn+k=j∣Xn=i) のように表される。
マルコフ連鎖とは、これまでの歴史を全て知っている時と、現在だけを知っている時の次のステップの確率が同じ確率過程のことを言う。簡単に言えば、現在の状態だけを正確に知っていれば、過去は未来に影響を与えない確率過程だ。通常、このような性質を 無記憶性memorylessnessと呼ぶ。当然、このような仮定があれば、計算などが非常に便利になる。
例えば、降水確率に関するモデルをマルコフ連鎖で表すと考えてみよう。昨日雨が降ったかどうかに関わらず、明日の降水確率は今日雨が降ったかどうかだけに影響を受けると仮定する。雨が降った状態を0、雨が降らなかった状態を1 とし、
p00=0.7p10=0.4p01=0.3p11=0.6
とする。これは、今日雨が降ったならば、明日も雨が降る確率が70 で、雨が降らない確率が30、今日雨が降らなかったならば、明日も雨が降らない確率が60 で、雨が降る確率が40 という意味だ。
これから、
P:=[p00p10p01p11]=[0.70.40.30.6]
のような行列を通じて、このような確率計算を簡単にしてみよう。このような行列を 遷移確率行列と呼び、k ステップ後の遷移確率行列をP(k):=(pij(k)) のように表す。遷移確率行列の有用な性質として、P(n)=Pn がチャップマン・コルモゴロフ方程式を通じて証明できる。
もし今日雨が降ったなら、二日後の降水確率は
P(2)===P2[0.70.40.30.6][0.70.40.30.6][0.610.520.390.48]
となり、p00(2)=(0.7)2+(0.3)(0.4)=0.61 と正確に一致する。通常、私たちが関心を持っている問題はこれ以上に複雑で、比較的遠い未来に関心があるので、このような行列を扱うことが必須であることがわかる。
遷移確率行列の数式的定義
ちなみに、遷移確率行列の同じ行の成分を全て加えると、必ず1 になるが、これは次のステップの確率を全て加えると1 になるからである。数式で表すと、j∑pij=1 となる。確率過程論をどこで学ぶかによって、この性質を定義として受け入れることもある。