logo

数理統計学における条件付き確率分布 📂数理統計学

数理統計学における条件付き確率分布

定義

  1. 離散確率変数X1,X2,,XnX_{1}, X_{2}, \cdots , X_{n}に対し、次のp2,,n1p_{2, \cdots , n \mid 1}X1=x1X_{1} = x_{1}が与えられた時のX2,,Xn X_{2}, \cdots , X_{n}結合条件付き確率質量関数という。 p2,,n1(x2,,xnX1=x1)=p1,,n(x1,x2,,xn)p1(X1=x1) p_{2, \cdots , n \mid 1} ( x_{2} , \cdots ,x_{n} \mid X_{1} = x_{1} ) = {{ p_{1, \cdots , n}(x_{1} , x_{2} , \cdots , x_{n}) } \over { p_{1}( X_{1} = x_{1} ) }}
  2. 連続確率変数X1,X2,,XnX_{1}, X_{2}, \cdots , X_{n}に対し、次のf2,,n1f_{2, \cdots , n \mid 1}X1=x1X_{1} = x_{1}が与えられた時のX2,,Xn X_{2}, \cdots , X_{n}結合条件付き確率密度関数という。 f2,,n1(x2,,xnX1=x1)=f1,,n(x1,x2,,xn)f1(X1=x1) f_{2, \cdots , n \mid 1} ( x_{2} , \cdots ,x_{n} \mid X_{1} = x_{1} ) = {{ f_{1, \cdots , n}(x_{1} , x_{2} , \cdots , x_{n}) } \over { f_{1}( X_{1} = x_{1} ) }}
  3. X2,,XnX_{2} , \cdots , X_{n}に対する関数uuが与えられた時、次をX1=x1X_{1} = x_{1}が与えられた時のu(X2,,Xn)u( X_{2}, \cdots , X_{n} )条件付き期待値という。 E[u(X2,,Xn)X1=x1]=u(x2,,xn)f2,,n1(x2,,xnX1=x1)dx2,dxn \begin{align*} & E \left[ u \left( X_{2} , \cdots , X_{n} \right) \mid X_{1} = x_{1} \right] \\ =& \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} u (x_{2} , \cdots , x_{n}) f_{2 , \cdots , n \mid 1} (x_{2} , \cdots, x_{n} \mid X_{1} = x_{1}) dx_{2} \cdots , dx_{n} \end{align*}

定理

  • [1] 条件付き分散: Var(X2X1=x1)=E[(X2E(X2X1=x1))2X1=x1]=E(X22X1=x1)[E(X2X1=x1)]2 \begin{align*} \Var (X_{2} | X_{1} = x_{1}) =& E \left[ \left( X_{2} - E (X_{2} \mid X_{1} = x_{1}) \right)^{2} \mid X_{1} = x_{1} \right] \\ =& E \left( X_{2}^{2} \mid X_{1} = x_{1} \right) - \left[ E(X_{2} \mid X_{1} = x_{1}) \right]^{2} \end{align*}
  • [2]: E[E(X2X1)]=E(X2)E \left[ E (X_{2} | X_{1}) \right] = E (X_{2} )
  • [3]: Var(X2)\Var(X_{2})が存在すればVar[E(X2X1)]Var(X2)\Var \left[ E \left( X_{2} \mid X_{1} \right) \right] \le \Var (X_{2})

説明

条件付き確率、条件付き期待値は、教科課程のレベルであったように、数理統計学でも最も計算が難しい部分に属している。他のことはさておき、多変量である以上、計算が多くなるのは避けられない。もちろん、条件付きという概念にはその価値がある。一方で、主として微積分学に依存している数理統計学と異なり、測度論に基づいた確率論へと発展すると、その計算ははるかに簡潔になる。要旨は、「無視することはないが、過度に執着することもない」ということだ。

参照