測度論で定義されるディラック測度と離散確率分布 
📂確率論 測度論で定義されるディラック測度と離散確率分布 概要 基本的な確率論では、確率分布は離散か連続のどちらかであり、その説明には直感に頼るしかなかった。しかし、測度論を導入することで、数学的な不明瞭さなく離散確率分布 をきれいに定義できる。
離散確率分布  確率空間  ( Ω , F , P ) ( \Omega , \mathcal{F} , P) ( Ω , F , P ) 
ステップ1. 確率変数 X X X  
X = a X = a X = a P X P_{X} P X  ディラック測度 δ a \delta_{a} δ a  
P X ( B ) = δ a ( B ) : = { 1 , a ∈ B 0 , a ∉ B 
P_{X} (B) = \delta_{a} (B) := \begin{cases} 1 &, a \in B
\\ 0 &, a \notin B \end{cases}
 P X  ( B ) = δ a  ( B ) := { 1 0  , a ∈ B , a ∈ / B  
見ての通り、確率分布 P X P_{X} P X  ボレル集合  B ∈ B ( R ) B \in \mathcal{B} ( \mathbb{R} ) B ∈ B ( R ) a a a 確率分布 のタイプを理解することと本質的に大きな違いがある。もちろん、測度論を使って確率分布を新たに定義するとしても、(絶対的な)連続確率分布や離散確率分布という言葉を使えなくなるわけではない。しかし、これら2つは結局同じ確率分布であり、同じ方法で定義されるが異なる性質を持つに過ぎないことになる。
ステップ2. 確率変数 X X X  
確率 p p p X = a X = a X = a ( 1 − p ) (1-p) ( 1 − p ) X = b X = b X = b X X X 
P X ( B ) = p δ a ( B ) + ( 1 − p ) δ b ( B ) 
P_{X} (B) = p \delta_{a} (B) + (1-p) \delta_{b} (B)
 P X  ( B ) = p δ a  ( B ) + ( 1 − p ) δ b  ( B ) 
分かりやすく展開してみると
P X ( B ) = { 1 , a , b ∈ B p , a ∈ B ∧ b ∉ B 1 − p , a ∉ B ∧ b ∈ B 0 , otherwise 
P_{X} (B) = \begin{cases} 1 &, a,b \in B
\\ p &, a \in B \land b \notin B
\\ 1-p &, a \notin B \land b \in B
\\ 0 &, \text{otherwise}\end{cases}
 P X  ( B ) = ⎩ ⎨ ⎧  1 p 1 − p 0  , a , b ∈ B , a ∈ B ∧ b ∈ / B , a ∈ / B ∧ b ∈ B , otherwise  
ステップ3. 一般的な離散確率分布 X X X  
i ∈ N i \in \mathbb{N} i ∈ N p i > 0 p_{i} > 0 p i  > 0 ∑ i p i = 1 \sum_{i} p_{i} = 1 ∑ i  p i  = 1 P X P_{X} P X  
P X ( B ) = ∑ i ∈ N p i δ a i ( B ) 
P_{X} (B) = \sum_{i \in \mathbb{N}} p_{i} \delta_{a_{i}} (B)
 P X  ( B ) = i ∈ N ∑  p i  δ a i   ( B ) 
新しい定義が馴染みにくく直感的ではないと感じるかもしれないが、その「直感的でない」点こそが測度論を導入する理由とも言えるだろう。測度論まで関わった確率論に手を出したのであれば、できるだけ早くこのような表現に慣れることが良い。
離散でも連続でもない確率分布  一方で、離散確率分布を定義するためにディラック測度が必要だったわけではなく、ディラック測度を使っただけで離散確率分布であるわけではない。前述の通り測度論を導入しても、連続確率分布と離散確率分布は存在する。しかし、ディラック測度もまたそれほど特別なルベーグ測度に過ぎないので、これをどのように使うかは完全に私たちの自由にかかっている。次の例を考えてみよう:
Q.  都市 A A A B B B A A A B B B 均一分布 でランダムに定められる。もちろん、2時前に B B B B B B 
A.  出発時刻が1時30分前であれば、B B B t > 30 t > 30 t > 30 B B B 
X ( t ) = { 0 , t ∈ [ 0 , 30 ] ∣ 50 − 100 t 60 ∣ , t ∈ ( 30 , 60 ] 
X(t) = \begin{cases} 0 &, t \in [0,30]
\\ \left| 50 - 100 {{t} \over {60}} \right| &, t \in (30, 60] \end{cases}
 X ( t ) = { 0  50 − 100 60 t    , t ∈ [ 0 , 30 ] , t ∈ ( 30 , 60 ]  
すると、その確率分布はディラック測度 δ \delta δ m m m 
P X = 1 2 δ 0 + 1 2 ⋅ 1 50 m [ 0 , 50 ] 
P_{X} = {{1} \over {2}} \delta_{0} + {{1} \over {2}} \cdot {{1} \over {50}} m_{[ 0, 50]}
 P X  = 2 1  δ 0  + 2 1  ⋅ 50 1  m [ 0 , 50 ]  
例で見たように、P X P_{X} P X  
関連項目