조건부 기대값의 스무딩 성질들
📂확률론조건부 기대값의 스무딩 성질들
정리
확률 공간 (Ω,F,P) 와 서브 시그마 필드 G,G′⊂F 가 주어져있다고 하고 X, Y 가 확률 변수라고 하자.
- [1]: X 가 G-가측이면
E(XY∣G)=XE(Y∣G) a.s.
- [2]: G′⊂G 이면
E(X∣G′)==E(E(X∣G)∣G′)E(E(X∣G′)∣G)
- G 가 F 의 서브 시그마 필드라는 것은 둘 다 Ω 의 시그마 필드이되, G⊂F 임을 의미한다.
- X 가 G-가측 함수라는 것은 모든 보렐 셋 B∈B(R) 에 대해 X−1(B)∈G 라는 의미다.
설명
조건부 기대값을 다룰 때는 시그마 필드가 확률 변수에 대한 ‘정보’라고 볼 수 있다. 특히 스무딩 프로퍼티는 수식적인 증명에 집착하기보다는 직관적인 설명을 잘 이해해야한다:
- [1]: X 가 스칼라도 아닌데 E 를 드나들 수 있다는 것은 그 식만 놀라울뿐만 아니라 어디든지 요긴하게 쓸 수 있음을 어렵지 않게 짐작할 수 있다. 확률 변수 X 가 G-가측이라는 것은 시그마 필드 G 가 X 의 모든 정보를 알고 있다는 것이다. X 그 자체를 이미 알고 있으므로 X 가 어떻게 나올지 그 기대값을 계산할 필요가 없고, 그냥 E 밖으로 나가면 된다. 수학적으로 X 는 스칼라가 아니지만, 적어도 G 가 주어져 있을 때 X 는 이미 확정된 값―스칼라가 되어버리는 것이다.
- [2]: G 가 F 서브 시그마 필드라는 것은 G 가 F 보다 적은 정보를 가지고 있다는 의미로 받아들여도 좋다. 수식을 잘 보면 기대값을 취하는 순서에 상관 없이 정보량이 작은 쪽의 결과를 얻는다. 이를 직관적으로 해석해보자:
- E(X∣G′)=E(E(X∣G)∣G′): G 가 X 에 대해서 많은 정보를 줘봤자 G′ 의 정보가 부족해서 결국 G′ 수준의 기대값을 얻은 것으로 볼 수 있다.
- E(X∣G′)=E(E(X∣G′)∣G): G′⊂G 는 곧 G′ 가 아는 정보는 G 도 다 안다는 의미인데, G′ 가 X 에 대해서 주는 정보라고 해봤자 이미 다 알던거라 G′ 수준의 기대값을 얻은 것으로 볼 수 있다.
증명
[1]
전략: 지시 함수부터 시작해서 심플 함수로 일반화하고, 임의의 함수를 음이 아닌 함수로 나타내는 트릭을 이용해서 양수의 경우로 몰아버린다.
Part 1. M∈G, X=1M
모든 A∈G 에 대해
∫AE(XY∣G)dP======∫AXYdP∫A1MYdP∫A∩MYdP∫A∩ME(Y∣G)dP∫A1ME(Y∣G)dP∫AXE(Y∣G)dP
∀A∈F,∫Afdm=0⟺f=0 a.e.이므로
E(XY∣G)=XE(Y∣G) a.s.
Part 2. M∈G, X=i=1∑nai1Mi
E(XY∣G)==E(i=1∑nai1MiY∣G)i=1∑naiE(1MiY∣G)
여기서 Part 1.에 의해 E(1MiY∣G)=1MiE(Y∣G) 이므로
E(XY∣G)===i=1∑naiE(1MiY∣G)i=1∑nai1MiE(Y∣G)XE(Y∣G) a.s.
Part 3. X≥0, Y≥0
X 에 대해 Xn↗X 를 만족하는 심플 함수의 수열 {Xn}n∈N 을 다음과 같이 정의하자.
Xn:=k=1∑n2n2nk−11(2nk−1≤X<2nk)
그러면 Xn 역시 G-가측이며, XnY↗XY 다. Xn 은 Part 2에 따라 E 를 넘나들 수 있으므로, 조건부 단조 수렴 정리에 따라
E(XY∣G)====E(n→∞limXnY∣G)n→∞limE(XnY∣G)n→∞limXnE(Y∣G)XE(Y∣G) a.s.
Part 4. X≥0
Y:=Y+−Y− 라고 두면 Part 3에 따라
E(XY∣G)===E(XY+∣G)−E(XY−∣G)XE(Y+∣G)−XE(Y−∣G)XE(Y∣G) a.s.
–
Part 5. 그 외
X:=X+−X− 라고 두면 Part 4에 따라
E(XY∣G)===E(X+Y∣G)−E(X−Y∣G)X+E(Y∣G)−X−E(Y∣G)XE(Y∣G) a.s.
■
[2]
Part 1. E(X∣G′)=E(E(X∣G)∣G′)
모든 A∈G′ 에 대해
∫AE(X∣G′)dP===∫AXdP∫AE(X∣G)dP∫AE(E(X∣G)∣G′)dP
∀A∈F,∫Afdm=0⟺f=0 a.e.이므로
E(X∣G′)=E(E(X∣G)∣G′)
Part 2. E(X∣G′)=E(E(X∣G′)∣G)
G′⊂G 이므로 [1]에 의해
E(X∣G′)==E(X∣G′)⋅E(1∣G)E(E(X∣G′)⋅1∣G)
■