조건부 기대값의 스무딩 성질들
정리
확률 공간 $( \Omega , \mathcal{F} , P)$ 와 서브 시그마 필드 $\mathcal{G}, \mathcal{G} ' \subset \mathcal{F}$ 가 주어져있다고 하고 $X$, $Y$ 가 확률 변수라고 하자.
- [1]: $X$ 가 $\mathcal{G}$-가측이면 $$ E(XY | \mathcal{G}) = X E (Y | \mathcal{G}) \text{ a.s.} $$
- [2]: $\mathcal{G} ' \subset \mathcal{G}$ 이면 $$ \begin{align*} E (X | \mathcal{G} ') =& E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right) \\ =& E \left( E ( X | \mathcal{G} ') | \mathcal{G} \right) \end{align*} $$
- $\mathcal{G}$ 가 $\mathcal{F}$ 의 서브 시그마 필드라는 것은 둘 다 $\Omega$ 의 시그마 필드이되, $\mathcal{G} \subset \mathcal{F}$ 임을 의미한다.
- $X$ 가 $\mathcal{G}$-가측 함수라는 것은 모든 보렐 셋 $B \in \mathcal{B}(\mathbb{R})$ 에 대해 $X^{-1} (B) \in \mathcal{G}$ 라는 의미다.
설명
조건부 기대값을 다룰 때는 시그마 필드가 확률 변수에 대한 ‘정보’라고 볼 수 있다. 특히 스무딩 프로퍼티는 수식적인 증명에 집착하기보다는 직관적인 설명을 잘 이해해야한다:
- [1]: $X$ 가 스칼라도 아닌데 $E$ 를 드나들 수 있다는 것은 그 식만 놀라울뿐만 아니라 어디든지 요긴하게 쓸 수 있음을 어렵지 않게 짐작할 수 있다. 확률 변수 $X$ 가 $\mathcal{G}$-가측이라는 것은 시그마 필드 $\mathcal{G}$ 가 $X$ 의 모든 정보를 알고 있다는 것이다. $X$ 그 자체를 이미 알고 있으므로 $X$ 가 어떻게 나올지 그 기대값을 계산할 필요가 없고, 그냥 $E$ 밖으로 나가면 된다. 수학적으로 $X$ 는 스칼라가 아니지만, 적어도 $\mathcal{G}$ 가 주어져 있을 때 $X$ 는 이미 확정된 값―스칼라가 되어버리는 것이다.
- [2]: $\mathcal{G}$ 가 $\mathcal{F}$ 서브 시그마 필드라는 것은 $\mathcal{G}$ 가 $\mathcal{F}$ 보다 적은 정보를 가지고 있다는 의미로 받아들여도 좋다. 수식을 잘 보면 기대값을 취하는 순서에 상관 없이 정보량이 작은 쪽의 결과를 얻는다. 이를 직관적으로 해석해보자:
- $E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right)$: $\mathcal{G}$ 가 $X$ 에 대해서 많은 정보를 줘봤자 $\mathcal{G} ' $ 의 정보가 부족해서 결국 $\mathcal{G} ' $ 수준의 기대값을 얻은 것으로 볼 수 있다.
- $E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G} ') | \mathcal{G} \right)$: $\mathcal{G} ' \subset \mathcal{G}$ 는 곧 $\mathcal{G} ' $ 가 아는 정보는 $\mathcal{G}$ 도 다 안다는 의미인데, $\mathcal{G} ' $ 가 $X$ 에 대해서 주는 정보라고 해봤자 이미 다 알던거라 $\mathcal{G} ' $ 수준의 기대값을 얻은 것으로 볼 수 있다.
증명
[1]
전략: 지시 함수부터 시작해서 심플 함수로 일반화하고, 임의의 함수를 음이 아닌 함수로 나타내는 트릭을 이용해서 양수의 경우로 몰아버린다.
Part 1. $M \in \mathcal{G}$, $X = \mathbb{1}_{M}$
모든 $A \in \mathcal{G}$ 에 대해 $$ \begin{align*} \int_{A} E ( XY | \mathcal{G} ) dP =& \int_{A} XY dP \\ =& \int_{A} \mathbb{1}_{M} Y dP \\ =& \int_{A \cap M} Y dP \\ =& \int_{A \cap M} E(Y | \mathcal{G}) dP \\ =& \int_{A} \mathbb{1}_{M} E(Y | \mathcal{G}) dP \\ =& \int_{A} X E(Y | \mathcal{G}) dP \end{align*} $$ $\displaystyle \forall A \in \mathcal{F}, \int_{A} f dm = 0 \iff f = 0 \text{ a.e.}$이므로 $$ E ( XY | \mathcal{G} ) = X E(Y | \mathcal{G}) \text{ a.s.} $$
Part 2. $M \in \mathcal{G}$, $\displaystyle X = \sum_{i=1}^{n} a_{i} \mathbb{1}_{M_{i}}$
$$ \begin{align*} E(XY | \mathcal{G} ) =& E( \sum_{i=1}^{n} a_{i} \mathbb{1}_{M_{i}} Y | \mathcal{G} ) \\ =& \sum_{i=1}^{n} a_{i} E( \mathbb{1}_{M_{i}} Y | \mathcal{G} ) \end{align*} $$ 여기서 Part 1.에 의해 $E( \mathbb{1}_{M_{i}} Y | \mathcal{G} ) = \mathbb{1}_{M_{i}} E( Y | \mathcal{G} )$ 이므로 $$ \begin{align*} E(XY | \mathcal{G} ) =& \sum_{i=1}^{n} a_{i} E( \mathbb{1}_{M_{i}} Y | \mathcal{G} ) \\ =& \sum_{i=1}^{n} a_{i} \mathbb{1}_{M_{i}} E( Y | \mathcal{G} ) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*} $$
Part 3. $X \ge 0$, $Y \ge 0$
$X$ 에 대해 $X_{n} \nearrow X$ 를 만족하는 심플 함수의 수열 $\left\{ X_{n} \right\}_{n \in \mathbb{N}}$ 을 다음과 같이 정의하자. $$ X_{n} := \sum_{k=1}^{n 2^n } {{k-1} \over {2^n}} \mathbb{1}_{ \left( {{k-1} \over {2^n}} \le X < {{k} \over {2^n}} \right)} $$ 그러면 $X_{n}$ 역시 $\mathcal{G}$-가측이며, $X_{n} Y \nearrow XY$ 다. $X_{n}$ 은 Part 2에 따라 $E$ 를 넘나들 수 있으므로, 조건부 단조 수렴 정리에 따라 $$ \begin{align*} E(XY | \mathcal{G} ) =& E \left( \lim_{n \to \infty} X_{n} Y | \mathcal{G} \right) \\ =& \lim_{n \to \infty} E \left( X_{n} Y | \mathcal{G} \right) \\ =& \lim_{n \to \infty} X_{n} E \left( Y | \mathcal{G} \right) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*} $$
Part 4. $X \ge 0$
$Y:= Y^{+} - Y^{-}$ 라고 두면 Part 3에 따라 $$ \begin{align*} E(XY | \mathcal{G} ) =& E(XY^{+} | \mathcal{G} ) - E(XY^{-} | \mathcal{G} ) \\ =& XE(Y^{+} | \mathcal{G} ) - XE(Y^{-} | \mathcal{G} ) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*} $$
–
Part 5. 그 외
$X := X^{+} - X^{-}$ 라고 두면 Part 4에 따라 $$ \begin{align*} E(XY | \mathcal{G} ) =& E(X^{+}Y | \mathcal{G} ) - E(X^{-}Y | \mathcal{G} ) \\ =& X^{+}E(Y | \mathcal{G} ) - X^{-}E(Y | \mathcal{G} ) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*} $$
■
[2]
Part 1. $E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right)$
모든 $A \in \mathcal{G} ' $ 에 대해 $$ \begin{align*} \int_{A} E (X | \mathcal{G} ') dP =& \int_{A} X dP \\ =& \int_{A} E(X | \mathcal{G}) dP \\ =& \int_{A} E \left( E(X | \mathcal{G}) | \mathcal{G} ' \right) dP \end{align*} $$ $\displaystyle \forall A \in \mathcal{F}, \int_{A} f dm = 0 \iff f = 0 \text{ a.e.}$이므로 $$ E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right) $$
Part 2. $E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G} ') | \mathcal{G} \right)$
$\mathcal{G} ' \subset \mathcal{G}$ 이므로 [1]에 의해 $$ \begin{align*} E (X | \mathcal{G} ') =& E (X | \mathcal{G} ') \cdot E (1 | \mathcal{G}) \\ =& E \left( E ( X | \mathcal{G} ') \cdot 1 | \mathcal{G} \right) \end{align*} $$
■