logo

測度論で定義される確率変数の条件付き確率 📂確率論

測度論で定義される確率変数の条件付き確率

定義

確率空間 (Ω,F,P)( \Omega , \mathcal{F} , P) が与えられているとする。

  1. G\mathcal{G}F\mathcal{F} のサブシグマフィールドである場合、事象 FFF \in \mathcal{F} に対して P(FG):=E(1FG) P(F | \mathcal{G}) := E ( \mathbb{1}_{F} | \mathcal{G}) G\mathcal{G} についての FF条件付き確率と呼ぶ。
  2. 次のように定義された fYX=xf_{Y | X =x}X=xX=x の場合の YY条件付き密度と呼ぶ。 fYX=x(yX=x):=yP(YyX=x) f_{Y | X = x} (y | X = x) := {{\partial } \over {\partial y }} P( Y \le y | X = x)

  • 測度論を触れたことがなければ、確率空間という言葉は無視してもいいが、測度論の知識が全くないと、このポストの内容を正しく理解することはほとんど不可能だ。
  • G\mathcal{G}F\mathcal{F} のサブシグマフィールドであることは、両者が Ω\Omega のシグマフィールドであり、GF\mathcal{G} \subset \mathcal{F} であることを意味する。

説明

測度論が導入された条件付き確率は、条件付き期待値によって定義される。

一方、確率変数 XX によって生成される Ω\Omega の最も小さいシグマフィールド σ(X)={X1(B):BB(R)}\sigma (X) = \left\{ X^{-1} (B) : B \in \mathcal{B}(\mathbb{R}) \right\} について、次のような馴染み深い表現を使用する。 E(YX):=E(Yσ(X)) E(Y|X) := E \left( Y | \sigma (X) \right) そして、確率や期待値のカッコ内で、YyY \le y は次のような事象を意味する。 (Yy):={ωB:Y(B)y,BB(R)}F (Y \le y) := \left\{ \omega \in B : Y(B) \le y , B \in \mathcal{B}(\mathbb{R}) \right\} \in \mathcal{F} これらの表記を使用して、条件付き確率 fYX=x(yX=x)=f(x,y)fX(x)\displaystyle f_{Y | X = x} (y | X = x) = {{ f(x,y) } \over { f_{X} (x) }} を導出してみよう。

導出

条件付き確率の期待値の条件により、P(YX)=E(1(Yy)X)=E(1(Yy)σ(X))P(Y \le | X ) = E \left( \mathbb{1}_{(Y \le y)} | X \right) = E \left( \mathbb{1}_{(Y \le y)} | \sigma (X) \right) は当然 σ(X)\sigma (X)-可測である。もちろん、XXYY結合密度 f(x,y):=f(X,Y)(x,y)f(x,y) := f_{(X,Y)} (x,y) を持つと仮定している。

全ての ボレル集合 BB(R)B \in \mathcal{B}(\mathbb{R})F=X1(B)F = X^{-1}(B) に対して FP(YyX)dP=FE(1(Yy)X)dP=F1(Yy)dP=F1(Yy)1FdP=E(1(Yy)1F)=1F1(Yy)f(x,u)dudx=xFyf(x,u)dudx=xFyf(x,u)fX(x)fX(x)dudx=xFyf(x,u)fX(x)dufX(x)dx=E(yf(X,u)fX(X)du)=Fyf(X,u)fX(X)dudP \begin{align*} \int_{F} P(Y \le y | X ) dP =& \int_{F} E \left( \mathbb{1}_{(Y \le y)} | X \right) dP \\ =& \int_{F} \mathbb{1}_{(Y \le y)} dP \\ =& \int_{F} \mathbb{1}_{(Y \le y)} \mathbb{1}_{F} dP \\ =& E \left( \mathbb{1}_{(Y \le y)} \mathbb{1}_{F} \right) \\ =& \iint \mathbb{1}_{F} \mathbb{1}_{(Y \le y)} f(x,u) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} f(x,u) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} {{ f(x,u) } \over { f_{X} (x) }} f_{X} (x) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} {{ f(x,u) } \over { f_{X} (x) }} du f_{X} (x) dx \\ =& E \left( \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du \right) \\ =& \int_{F} \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du dP \end{align*}

ルベーグ積分の性質: Afdm=0    f=0 a.e. \int_{A} f dm = 0 \iff f = 0 \text{ a.e.}

まとめると、FP(YyX)dP=Fyf(X,u)fX(X)dudP\displaystyle \int_{F} P(Y \le y | X ) dP = \int_{F} \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du dP であるから、ほとんど確実に P(YyX)=yf(X,u)fX(X)du P(Y \le y | X ) = \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du である。最後に微積分学の基本定理に従って fYX=x(yX=x)=yP(YyX=x)=f(x,y)fX(x) a.s. \begin{align*} f_{Y|X=x} ( y | X=x ) =& {{ \partial } \over { \partial y }} P(Y \le y | X=x ) \\ =& {{ f(x,y) } \over { f_{X} (x) }} \text{ a.s.} \end{align*}

参考