측도론으로 정의되는 확률 변수의 조건부 확률

측도론으로 정의되는 확률 변수의 조건부 확률

Conditional probability in terms of measure theory

정의

확률 공간 $( \Omega , \mathcal{F} , P)$ 이 주어져 있다고 하자.

  1. $\mathcal{G}$ 가 $\mathcal{F}$ 의 서브 시그마 필드라고 할 때, 사건 $F \in \mathcal{F}$ 에 대해 $$ P(F | \mathcal{G}) := E ( \mathbb{1}_{F} | \mathcal{G}) $$ 를 $\mathcal{G}$ 에 대한 $F$ 의 조건부 확률이라고 한다.
  2. 다음과 같이 정의된 $f_{Y | X =x}$ 를 $X=x$ 일 때 $Y$ 의 조건부 밀도라고 한다. $$ f_{Y | X = x} (y | X = x) := {{\partial } \over {\partial y }} P( Y \le y | X = x) $$

  • 아직 측도론을 접하지 못했다면 확률 공간이라는 말은 무시해도 좋다고 말하고 싶지만, 사실 측도론을 전혀 모르면서 본 포스트의 내용을 제대로 이해하는 것은 거의 불가능하다.
  • $\mathcal{G}$ 가 $\mathcal{F}$ 의 서브 시그마 필드라는 것은 둘 다 $\Omega$ 의 시그마 필드이되, $\mathcal{G} \subset \mathcal{F}$ 임을 의미한다.

설명

측도론이 도입된 조건부 확률은 조건부 기대값에 의해 정의된다.

한편 확률 변수 $X$ 로써 생성되는 $\Omega$ 의 가장 작은 시그마 필드 $\sigma (X) = \left\{ X^{-1} (B) : B \in \mathcal{B}(\mathbb{R}) \right\}$ 에 대해서 다음과 같은 익숙한 표현을 사용한다. $$ E(Y|X) := E \left( Y | \sigma (X) \right) $$ 그리고 확률이나 기대값의 괄호 안에서 $Y \le y$ 은 다음과 같은 사건을 의미한다. $$ (Y \le y) := \left\{ \omega \in B : Y(B) \le y , B \in \mathcal{B}(\mathbb{R}) \right\} \in \mathcal{F} $$ 이러한 노테이션들을 사용해서 조건부 확률 $\displaystyle f_{Y | X = x} (y | X = x) = {{ f(x,y) } \over { f_{X} (x) }}$ 를 유도해보자.

유도

조건부 확률의 기대값의 조건에 따라 $P(Y \le | X ) = E \left( \mathbb{1}_{(Y \le y)} | X \right) = E \left( \mathbb{1}_{(Y \le y)} | \sigma(X) \right)$ 는 당연히 $\sigma(X)$-가측이다. 물론 $X$, $Y$ 는 조인트 밀도 $f(x,y) := f_{(X,Y)} (x,y)$ 를 가진다고 가정한다.

모든 보렐 셋 $B \in \mathcal{B}(\mathbb{R})$ 과 $F = X^{-1}(B)$ 에 대해 $$ \begin{align*} \int_{F} P(Y \le y | X ) dP =& \int_{F} E \left( \mathbb{1}_{(Y \le y)} | X \right) dP \\ =& \int_{F} \mathbb{1}_{(Y \le y)} dP \\ =& \int_{F} \mathbb{1}_{(Y \le y)} \mathbb{1}_{F} dP \\ =& E \left( \mathbb{1}_{(Y \le y)} \mathbb{1}_{F} \right) \\ =& \iint \mathbb{1}_{F} \mathbb{1}_{(Y \le y)} f(x,u) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} f(x,u) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} {{ f(x,u) } \over { f_{X} (x) }} f_{X} (x) du dx \\ =& \int_{x \in F} \int_{-\infty}^{y} {{ f(x,u) } \over { f_{X} (x) }} du f_{X} (x) dx \\ =& E \left( \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du \right) \\ =& \int_{F} \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du dP \end{align*} $$

르벡 적분의 성질: $$ \int_{A} f dm = 0 \iff f = 0 \text{ a.e.} $$

정리하면 $\displaystyle \int_{F} P(Y \le y | X ) dP = \int_{F} \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du dP$ 이므로, 거의 확실히 $$ P(Y \le y | X ) = \int_{-\infty}^{y} {{ f(X,u) } \over { f_{X} (X) }} du $$ 이다. 마지막으로 미적분학의 기본정리에 따라 $$ \begin{align*} f_{Y|X=x} ( y | X=x ) =& {{ \partial } \over { \partial y }} P(Y \le y | X=x ) \\ =& {{ f(x,y) } \over { f_{X} (x) }} \text{ a.s.} \end{align*} $$

같이보기

댓글