数理統計学における条件付き確率分布
定義
- 離散確率変数$X_{1}, X_{2}, \cdots , X_{n}$に対し、次の$p_{2, \cdots , n \mid 1}$を$X_{1} = x_{1}$が与えられた時の$ X_{2}, \cdots , X_{n}$の結合条件付き確率質量関数という。 $$ p_{2, \cdots , n \mid 1} ( x_{2} , \cdots ,x_{n} \mid X_{1} = x_{1} ) = {{ p_{1, \cdots , n}(x_{1} , x_{2} , \cdots , x_{n}) } \over { p_{1}( X_{1} = x_{1} ) }} $$
- 連続確率変数$X_{1}, X_{2}, \cdots , X_{n}$に対し、次の$f_{2, \cdots , n \mid 1}$を$X_{1} = x_{1}$が与えられた時の$ X_{2}, \cdots , X_{n}$の結合条件付き確率密度関数という。 $$ f_{2, \cdots , n \mid 1} ( x_{2} , \cdots ,x_{n} \mid X_{1} = x_{1} ) = {{ f_{1, \cdots , n}(x_{1} , x_{2} , \cdots , x_{n}) } \over { f_{1}( X_{1} = x_{1} ) }} $$
- $X_{2} , \cdots , X_{n}$に対する関数$u$が与えられた時、次を$X_{1} = x_{1}$が与えられた時の$u( X_{2}, \cdots , X_{n} )$の条件付き期待値という。 $$ \begin{align*} & E \left[ u \left( X_{2} , \cdots , X_{n} \right) \mid X_{1} = x_{1} \right] \\ =& \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} u (x_{2} , \cdots , x_{n}) f_{2 , \cdots , n \mid 1} (x_{2} , \cdots, x_{n} \mid X_{1} = x_{1}) dx_{2} \cdots , dx_{n} \end{align*} $$
定理
- [1] 条件付き分散: $$ \begin{align*} \operatorname{Var} (X_{2} | X_{1} = x_{1}) =& E \left[ \left( X_{2} - E (X_{2} \mid X_{1} = x_{1}) \right)^{2} \mid X_{1} = x_{1} \right] \\ =& E \left( X_{2}^{2} \mid X_{1} = x_{1} \right) - \left[ E(X_{2} \mid X_{1} = x_{1}) \right]^{2} \end{align*} $$
- [2]: $E \left[ E (X_{2} | X_{1}) \right] = E (X_{2} )$
- [3]: $\operatorname{Var}(X_{2})$が存在すれば$\operatorname{Var} \left[ E \left( X_{2} \mid X_{1} \right) \right] \le \operatorname{Var} (X_{2})$
説明
条件付き確率、条件付き期待値は、教科課程のレベルであったように、数理統計学でも最も計算が難しい部分に属している。他のことはさておき、多変量である以上、計算が多くなるのは避けられない。もちろん、条件付きという概念にはその価値がある。一方で、主として微積分学に依存している数理統計学と異なり、測度論に基づいた確率論へと発展すると、その計算ははるかに簡潔になる。要旨は、「無視することはないが、過度に執着することもない」ということだ。