logo

조건부 기대값의 스무딩 성질들 📂확률론

조건부 기대값의 스무딩 성질들

정리

확률 공간 (Ω,F,P)( \Omega , \mathcal{F} , P) 와 서브 시그마 필드 G,GF\mathcal{G}, \mathcal{G} ' \subset \mathcal{F} 가 주어져있다고 하고 XX, YY확률 변수라고 하자.

  • [1]: XXG\mathcal{G}-가측이면 E(XYG)=XE(YG) a.s. E(XY | \mathcal{G}) = X E (Y | \mathcal{G}) \text{ a.s.}
  • [2]: GG\mathcal{G} ' \subset \mathcal{G} 이면 E(XG)=E(E(XG)G)=E(E(XG)G) \begin{align*} E (X | \mathcal{G} ') =& E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right) \\ =& E \left( E ( X | \mathcal{G} ') | \mathcal{G} \right) \end{align*}

  • G\mathcal{G}F\mathcal{F} 의 서브 시그마 필드라는 것은 둘 다 Ω\Omega시그마 필드이되, GF\mathcal{G} \subset \mathcal{F} 임을 의미한다.
  • XXG\mathcal{G}-가측 함수라는 것은 모든 보렐 셋 BB(R)B \in \mathcal{B}(\mathbb{R}) 에 대해 X1(B)GX^{-1} (B) \in \mathcal{G} 라는 의미다.

설명

조건부 기대값을 다룰 때는 시그마 필드가 확률 변수에 대한 ‘정보’라고 볼 수 있다. 특히 스무딩 프로퍼티는 수식적인 증명에 집착하기보다는 직관적인 설명을 잘 이해해야한다:

  • [1]: XX 가 스칼라도 아닌데 EE 를 드나들 수 있다는 것은 그 식만 놀라울뿐만 아니라 어디든지 요긴하게 쓸 수 있음을 어렵지 않게 짐작할 수 있다. 확률 변수 XXG\mathcal{G}-가측이라는 것은 시그마 필드 G\mathcal{G}XX 의 모든 정보를 알고 있다는 것이다. XX 그 자체를 이미 알고 있으므로 XX 가 어떻게 나올지 그 기대값을 계산할 필요가 없고, 그냥 EE 밖으로 나가면 된다. 수학적으로 XX 는 스칼라가 아니지만, 적어도 G\mathcal{G} 가 주어져 있을 때 XX 는 이미 확정된 값―스칼라가 되어버리는 것이다.
  • [2]: G\mathcal{G}F\mathcal{F} 서브 시그마 필드라는 것은 G\mathcal{G}F\mathcal{F} 보다 적은 정보를 가지고 있다는 의미로 받아들여도 좋다. 수식을 잘 보면 기대값을 취하는 순서에 상관 없이 정보량이 작은 쪽의 결과를 얻는다. 이를 직관적으로 해석해보자:
    • E(XG)=E(E(XG)G)E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right): G\mathcal{G}XX 에 대해서 많은 정보를 줘봤자 G\mathcal{G} ' 의 정보가 부족해서 결국 G\mathcal{G} ' 수준의 기대값을 얻은 것으로 볼 수 있다.
    • E(XG)=E(E(XG)G)E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G} ') | \mathcal{G} \right): GG\mathcal{G} ' \subset \mathcal{G} 는 곧 G\mathcal{G} ' 가 아는 정보는 G\mathcal{G} 도 다 안다는 의미인데, G\mathcal{G} ' XX 에 대해서 주는 정보라고 해봤자 이미 다 알던거라 G\mathcal{G} ' 수준의 기대값을 얻은 것으로 볼 수 있다.

증명

[1]

전략: 지시 함수부터 시작해서 심플 함수로 일반화하고, 임의의 함수를 음이 아닌 함수로 나타내는 트릭을 이용해서 양수의 경우로 몰아버린다.


Part 1. MGM \in \mathcal{G}, X=1MX = \mathbb{1}_{M}

모든 AGA \in \mathcal{G} 에 대해 AE(XYG)dP=AXYdP=A1MYdP=AMYdP=AME(YG)dP=A1ME(YG)dP=AXE(YG)dP \begin{align*} \int_{A} E ( XY | \mathcal{G} ) dP =& \int_{A} XY dP \\ =& \int_{A} \mathbb{1}_{M} Y dP \\ =& \int_{A \cap M} Y dP \\ =& \int_{A \cap M} E(Y | \mathcal{G}) dP \\ =& \int_{A} \mathbb{1}_{M} E(Y | \mathcal{G}) dP \\ =& \int_{A} X E(Y | \mathcal{G}) dP \end{align*} AF,Afdm=0    f=0 a.e.\displaystyle \forall A \in \mathcal{F}, \int_{A} f dm = 0 \iff f = 0 \text{ a.e.}이므로 E(XYG)=XE(YG) a.s. E ( XY | \mathcal{G} ) = X E(Y | \mathcal{G}) \text{ a.s.}


Part 2. MGM \in \mathcal{G}, X=i=1nai1Mi\displaystyle X = \sum_{i=1}^{n} a_{i} \mathbb{1}_{M_{i}}

E(XYG)=E(i=1nai1MiYG)=i=1naiE(1MiYG) \begin{align*} E(XY | \mathcal{G} ) =& E( \sum_{i=1}^{n} a_{i} \mathbb{1}_{M_{i}} Y | \mathcal{G} ) \\ =& \sum_{i=1}^{n} a_{i} E( \mathbb{1}_{M_{i}} Y | \mathcal{G} ) \end{align*} 여기서 Part 1.에 의해 E(1MiYG)=1MiE(YG)E( \mathbb{1}_{M_{i}} Y | \mathcal{G} ) = \mathbb{1}_{M_{i}} E( Y | \mathcal{G} ) 이므로 E(XYG)=i=1naiE(1MiYG)=i=1nai1MiE(YG)=XE(YG) a.s. \begin{align*} E(XY | \mathcal{G} ) =& \sum_{i=1}^{n} a_{i} E( \mathbb{1}_{M_{i}} Y | \mathcal{G} ) \\ =& \sum_{i=1}^{n} a_{i} \mathbb{1}_{M_{i}} E( Y | \mathcal{G} ) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*}


Part 3. X0X \ge 0, Y0Y \ge 0

XX 에 대해 XnXX_{n} \nearrow X 를 만족하는 심플 함수수열 {Xn}nN\left\{ X_{n} \right\}_{n \in \mathbb{N}} 을 다음과 같이 정의하자. Xn:=k=1n2nk12n1(k12nX<k2n) X_{n} := \sum_{k=1}^{n 2^n } {{k-1} \over {2^n}} \mathbb{1}_{ \left( {{k-1} \over {2^n}} \le X < {{k} \over {2^n}} \right)} 그러면 XnX_{n} 역시 G\mathcal{G}-가측이며, XnYXYX_{n} Y \nearrow XY 다. XnX_{n} 은 Part 2에 따라 EE 를 넘나들 수 있으므로, 조건부 단조 수렴 정리에 따라 E(XYG)=E(limnXnYG)=limnE(XnYG)=limnXnE(YG)=XE(YG) a.s. \begin{align*} E(XY | \mathcal{G} ) =& E \left( \lim_{n \to \infty} X_{n} Y | \mathcal{G} \right) \\ =& \lim_{n \to \infty} E \left( X_{n} Y | \mathcal{G} \right) \\ =& \lim_{n \to \infty} X_{n} E \left( Y | \mathcal{G} \right) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*}


Part 4. X0X \ge 0

Y:=Y+YY:= Y^{+} - Y^{-} 라고 두면 Part 3에 따라 E(XYG)=E(XY+G)E(XYG)=XE(Y+G)XE(YG)=XE(YG) a.s. \begin{align*} E(XY | \mathcal{G} ) =& E(XY^{+} | \mathcal{G} ) - E(XY^{-} | \mathcal{G} ) \\ =& XE(Y^{+} | \mathcal{G} ) - XE(Y^{-} | \mathcal{G} ) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*}

Part 5. 그 외

X:=X+XX := X^{+} - X^{-} 라고 두면 Part 4에 따라 E(XYG)=E(X+YG)E(XYG)=X+E(YG)XE(YG)=XE(YG) a.s. \begin{align*} E(XY | \mathcal{G} ) =& E(X^{+}Y | \mathcal{G} ) - E(X^{-}Y | \mathcal{G} ) \\ =& X^{+}E(Y | \mathcal{G} ) - X^{-}E(Y | \mathcal{G} ) \\ =& X E(Y | \mathcal{G}) \text{ a.s.} \end{align*}

[2]

Part 1. E(XG)=E(E(XG)G)E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right)

모든 AGA \in \mathcal{G} ' 에 대해 AE(XG)dP=AXdP=AE(XG)dP=AE(E(XG)G)dP \begin{align*} \int_{A} E (X | \mathcal{G} ') dP =& \int_{A} X dP \\ =& \int_{A} E(X | \mathcal{G}) dP \\ =& \int_{A} E \left( E(X | \mathcal{G}) | \mathcal{G} ' \right) dP \end{align*} AF,Afdm=0    f=0 a.e.\displaystyle \forall A \in \mathcal{F}, \int_{A} f dm = 0 \iff f = 0 \text{ a.e.}이므로 E(XG)=E(E(XG)G) E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G}) | \mathcal{G} ' \right)


Part 2. E(XG)=E(E(XG)G)E (X | \mathcal{G} ') = E \left( E ( X | \mathcal{G} ') | \mathcal{G} \right)

GG\mathcal{G} ' \subset \mathcal{G} 이므로 [1]에 의해 E(XG)=E(XG)E(1G)=E(E(XG)1G) \begin{align*} E (X | \mathcal{G} ') =& E (X | \mathcal{G} ') \cdot E (1 | \mathcal{G}) \\ =& E \left( E ( X | \mathcal{G} ') \cdot 1 | \mathcal{G} \right) \end{align*}