logo

측도론으로 정의되는 확률 변수의 조건부 확률 📂확률론

측도론으로 정의되는 확률 변수의 조건부 확률

정의

확률 공간 (Ω,F,P)( \Omega , \mathcal{F} , P) 이 주어져 있다고 하자.

  1. G\mathcal{G}F\mathcal{F} 의 서브 시그마 필드라고 할 때, 사건 FFF \in \mathcal{F} 에 대해 P(FG):=E(1FG) P(F | \mathcal{G}) := E ( \mathbb{1}_{F} | \mathcal{G}) G\mathcal{G} 에 대한 FF조건부 확률이라고 한다.
  2. 다음과 같이 정의된 fYX=xf_{Y | X =x}X=xX=x 일 때 YY조건부 밀도라고 한다. fYX=x(yX=x):=yP(YyX=x) f_{Y | X = x} (y | X = x) := {{\partial } \over {\partial y }} P( Y \le y | X = x)

  • 아직 측도론을 접하지 못했다면 확률 공간이라는 말은 무시해도 좋다고 말하고 싶지만, 사실 측도론을 전혀 모르면서 본 포스트의 내용을 제대로 이해하는 것은 거의 불가능하다.
  • G\mathcal{G}F\mathcal{F} 의 서브 시그마 필드라는 것은 둘 다 Ω\Omega 의 시그마 필드이되, GF\mathcal{G} \subset \mathcal{F} 임을 의미한다.

설명

측도론이 도입된 조건부 확률은 조건부 기대값에 의해 정의된다.

한편 확률 변수 XX 로써 생성되는 Ω\Omega 의 가장 작은 시그마 필드 σ(X)={X1(B):BB(R)}\sigma (X) = \left\{ X^{-1} (B) : B \in \mathcal{B}(\mathbb{R}) \right\} 에 대해서 다음과 같은 익숙한 표현을 사용한다. E(YX):=E(Yσ(X)) E(Y|X) := E \left( Y | \sigma (X) \right) 그리고 확률이나 기대값의 괄호 안에서 YyY \le y 은 다음과 같은 사건을 의미한다. (Yy):={ωB:Y(B)y,BB(R)}F (Y \le y) := \left\{ \omega \in B : Y(B) \le y , B \in \mathcal{B}(\mathbb{R}) \right\} \in \mathcal{F} 이러한 노테이션들을 사용해서 조건부 확률 fYX=x(yX=x)=f(x,y)fX(x)\displaystyle f_{Y | X = x} (y | X = x) = {{ f(x,y) } \over { f_{X} (x) }} 를 유도해보자.

유도

조건부 확률의 기대값의 조건에 따라 P(YX)=E(1(Yy)X)=E(1(Yy)σ(X))P(Y \le | X ) = E \left( \mathbb{1}_{(Y \le y)} | X \right) = E \left( \mathbb{1}_{(Y \le y)} | \sigma (X) \right) 는 당연히 σ(X)\sigma (X)-가측이다. 물론 XX, YY조인트 밀도 f(x,y):=f(X,Y)(x,y)f(x,y) := f_{(X,Y)} (x,y) 를 가진다고 가정한다.

모든 보렐 셋 BB(R)B \in \mathcal{B}(\mathbb{R})F=X1(B)F = X^{-1}(B) 에 대해 FP(YyX)dP=FE(1(Yy)X)dP=F1(Yy)dP=F1(Yy)1FdP=E(1(Yy)1F)=1F1(Yy)f(x,u)dudx=xFyf(x,u)dudx=xFyf(x,u)fX(x)fX(x)dudx=xFyf(x,u)fX(x)dufX(x)dx=E(yf(X,u)fX(X)du)=Fyf(X,u)fX(X)dudP \begin{align*} \int_{F} P(Y \le y | X ) dP =& \int_{F} E \left( \mathbb{1}_{(Y \le y)} | X \right) dP \\ =& \int_{F} \mathbb{1}_{(Y \le y)} dP \\ =& \int_{F} \mathbb{1}_{(Y \le y)} \mathbb{1}_{F} dP \\ =& E \left( \mathbb{1}_{(Y \le y)} \mathbb{1}_{F} \right) \\ =& \iint \mathbb{1}_{F} \mathbb{1}_{(Y \le y)} f(x,u) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} f(x,u) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} {{ f(x,u) } \over { f_{X} (x) }} f_{X} (x) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} {{ f(x,u) } \over { f_{X} (x) }} du f_{X} (x) dx \\ =& E \left( \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du \right) \\ =& \int_{F} \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du dP \end{align*}

르벡 적분의 성질: Afdm=0    f=0 a.e. \int_{A} f dm = 0 \iff f = 0 \text{ a.e.}

정리하면 FP(YyX)dP=Fyf(X,u)fX(X)dudP\displaystyle \int_{F} P(Y \le y | X ) dP = \int_{F} \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du dP 이므로, 거의 확실히 P(YyX)=yf(X,u)fX(X)du P(Y \le y | X ) = \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du 이다. 마지막으로 미적분학의 기본정리에 따라 fYX=x(yX=x)=yP(YyX=x)=f(x,y)fX(x) a.s. \begin{align*} f_{Y|X=x} ( y | X=x ) =& {{ \partial } \over { \partial y }} P(Y \le y | X=x ) \\ =& {{ f(x,y) } \over { f_{X} (x) }} \text{ a.s.} \end{align*}

같이보기