測度論で定義されるディラック測度と離散確率分布
📂確率論 測度論で定義されるディラック測度と離散確率分布 概要 基本的な確率論では、確率分布は離散か連続のどちらかであり、その説明には直感に頼るしかなかった。しかし、測度論を導入することで、数学的な不明瞭さなく離散確率分布 をきれいに定義できる。
離散確率分布 確率空間 ( Ω , F , P ) ( \Omega , \mathcal{F} , P) ( Ω , F , P ) が与えられているとする。
ステップ1. 確率変数 X X X が一つの値を取る場合
X = a X = a X = a の場合のみを考えるとき、その確率分布 P X P_{X} P X は ディラック測度 δ a \delta_{a} δ a と呼ばれる。
P X ( B ) = δ a ( B ) : = { 1 , a ∈ B 0 , a ∉ B
P_{X} (B) = \delta_{a} (B) := \begin{cases} 1 &, a \in B
\\ 0 &, a \notin B \end{cases}
P X ( B ) = δ a ( B ) := { 1 0 , a ∈ B , a ∈ / B
見ての通り、確率分布 P X P_{X} P X は ボレル集合 B ∈ B ( R ) B \in \mathcal{B} ( \mathbb{R} ) B ∈ B ( R ) に a a a が含まれるか否かのみに注目する。これは、離散と連続の違いを見極めることにより、確率分布 のタイプを理解することと本質的に大きな違いがある。もちろん、測度論を使って確率分布を新たに定義するとしても、(絶対的な)連続確率分布や離散確率分布という言葉を使えなくなるわけではない。しかし、これら2つは結局同じ確率分布であり、同じ方法で定義されるが異なる性質を持つに過ぎないことになる。
ステップ2. 確率変数 X X X が二つの値を取る場合
確率 p p p で X = a X = a X = a であり、確率 ( 1 − p ) (1-p) ( 1 − p ) で X = b X = b X = b である確率変数を考えよう。X X X は **ステップ1.**のディラック測度を使って、その確率分布を次のように表すことができる。
P X ( B ) = p δ a ( B ) + ( 1 − p ) δ b ( B )
P_{X} (B) = p \delta_{a} (B) + (1-p) \delta_{b} (B)
P X ( B ) = p δ a ( B ) + ( 1 − p ) δ b ( B )
分かりやすく展開してみると
P X ( B ) = { 1 , a , b ∈ B p , a ∈ B ∧ b ∉ B 1 − p , a ∉ B ∧ b ∈ B 0 , otherwise
P_{X} (B) = \begin{cases} 1 &, a,b \in B
\\ p &, a \in B \land b \notin B
\\ 1-p &, a \notin B \land b \in B
\\ 0 &, \text{otherwise}\end{cases}
P X ( B ) = ⎩ ⎨ ⎧ 1 p 1 − p 0 , a , b ∈ B , a ∈ B ∧ b ∈ / B , a ∈ / B ∧ b ∈ B , otherwise
このような展開に従って、離散確率分布の一般的な形を考えることができるだろう。
ステップ3. 一般的な離散確率分布 X X X
i ∈ N i \in \mathbb{N} i ∈ N に対して p i > 0 p_{i} > 0 p i > 0 であり ∑ i p i = 1 \sum_{i} p_{i} = 1 ∑ i p i = 1 である場合、次のような確率分布 P X P_{X} P X を考えることができる。
P X ( B ) = ∑ i ∈ N p i δ a i ( B )
P_{X} (B) = \sum_{i \in \mathbb{N}} p_{i} \delta_{a_{i}} (B)
P X ( B ) = i ∈ N ∑ p i δ a i ( B )
新しい定義が馴染みにくく直感的ではないと感じるかもしれないが、その「直感的でない」点こそが測度論を導入する理由とも言えるだろう。測度論まで関わった確率論に手を出したのであれば、できるだけ早くこのような表現に慣れることが良い。
離散でも連続でもない確率分布 一方で、離散確率分布を定義するためにディラック測度が必要だったわけではなく、ディラック測度を使っただけで離散確率分布であるわけではない。前述の通り測度論を導入しても、連続確率分布と離散確率分布は存在する。しかし、ディラック測度もまたそれほど特別なルベーグ測度に過ぎないので、これをどのように使うかは完全に私たちの自由にかかっている。次の例を考えてみよう:
Q. 都市 A A A と B B B が50km離れているとしよう。A A A から B B B まで時速100km/hでしか行けない車に乗って行く必要があるが、出発時刻は1時から2時の間に均一分布 でランダムに定められる。もちろん、2時前に B B B に到着すれば、車は駐車できる。では、ちょうど2時になった時の車と B B B との距離は、どのような確率分布に従うだろうか?
A. 出発時刻が1時30分前であれば、B B B に早めに到着して駐車できるだろう。しかし、1時 t > 30 t > 30 t > 30 分に出発した場合、遅れた分だけ B B B から遠く離れているだろう。確率変数として表すと以下のようになる。
X ( t ) = { 0 , t ∈ [ 0 , 30 ] ∣ 50 − 100 t 60 ∣ , t ∈ ( 30 , 60 ]
X(t) = \begin{cases} 0 &, t \in [0,30]
\\ \left| 50 - 100 {{t} \over {60}} \right| &, t \in (30, 60] \end{cases}
X ( t ) = { 0 50 − 100 60 t , t ∈ [ 0 , 30 ] , t ∈ ( 30 , 60 ]
すると、その確率分布はディラック測度 δ \delta δ と均一測度 m m m を使って以下のように表される。
P X = 1 2 δ 0 + 1 2 ⋅ 1 50 m [ 0 , 50 ]
P_{X} = {{1} \over {2}} \delta_{0} + {{1} \over {2}} \cdot {{1} \over {50}} m_{[ 0, 50]}
P X = 2 1 δ 0 + 2 1 ⋅ 50 1 m [ 0 , 50 ]
例で見たように、P X P_{X} P X は離散確率分布でも、連続確率分布でもない。
関連項目