확률론의 혼성 정리 증명
정리
공간 $S$ 가 거리 공간 $( S , \rho)$ 이면서 가측 공간 $(S,\mathcal{B}(S))$ 이라고 하자.
다음은 모두 동치다.
- (1): $P_{n} \overset{W}{\to} P$
- (2): 모든 바운디드, 균등연속함수 $f$ 에 대해 $\displaystyle \int_{S} f dP_{n} \to \int_{S}f d P$
- (3): 모든 클로즈드 셋 $F$ 에 대해 $\displaystyle \limsup_{n\to\infty} P_{n}(F) \le P(F)$
- (4): 모든 오픈 셋 $G$ 에 대해 $\displaystyle P(G) \le \liminf_{n\to\infty} P_{n}(G)$
- (5): $P(\partial A) = 0$ 인 모든 $A$ 에 대해 $\displaystyle \lim_{n\to\infty} P_{n}(A) = P(A)$
설명
Portmanteau는 ‘여러가지로 이루어진’ 혹은 ‘혼성어’라는 뜻을 가진 영단어다. 이것을 바로 혼성이라고 순화하는 것은 무척 매끄럽지 못한데, 관습적으로는 [폴ㅌ맨퉈] 비슷하게 읽고 그것만으로는 뜻을 짐작하기 어려워 부득이하게 혼성 정리라고 번역했다. 혼성 정리는 사실 확률 측도가 아니라도 유한 측도 $\mu$ 에 대해 일반화할 수 있으며, 측도의 약한 수렴에 대한 동치조건을 제시해주므로 굉장히 중요한 정리다.
증명
전략: 증명을 위해 다음의 노테이션을 소개한다. 자세한 설명을 읽어두는 것을 추천한다.
- 원소 $x \in S$ 와 부분집합 $A \subset S$, 그리고 $\delta >0$ 에 대해 $$ \rho (x, A) := \inf \left\{ \rho (x,a) : a \in A \right\} $$
$$ A^{\delta} := \left\{ x \in S : \rho (x, A) < \delta \right\} $$
- 어떤 픽스된 $F \subset S$ 에 대해 $$ \begin{align*} f_{\delta}(x) :=& \left( 1 - \rho (x, F) / \delta \right)^{+} \\ =& \begin{cases} 1 &, x \in F \\ 1 - \rho (x,F)/\delta &, x \notin F \land x \in F^{\delta} \\ 0 &, x \notin F^{\delta} \end{cases} \end{align*} $$
Part 1. $(1) \implies (2)$
약한 수렴의 정의에 따라 자명하다.
Part 2. $(2) \implies (3)$
$$f_{\varepsilon}(x) : = \left( 1 - \rho ( x, F) / \varepsilon \right)^{+} $$ $f_{\varepsilon}$ 를 위와 같이 정의하면 $f_{\varepsilon}$ 는 바운디드고 균등연속이다. 또한 모든 $\varepsilon > 0$ 에 대해 $I_{F}(x) \le f_{\varepsilon}(x) \le I_{F}^{\varepsilon} (x)$ 이므로 $$ \int_{S} I_{F} dP_{n} \le \int_{S} f_{\varepsilon} dP_{n} \le \int I_{F^{\varepsilon}} dP_{n} $$ 여기서 $\displaystyle P_{n}(F) = \int_{F} dP_{n} = \int_{S} 1_{F} dP_{n}$ 이므로 $$ P_{n}(F) \le \int_{S} f_{\varepsilon} dP_{n} $$ 양변에 $\displaystyle \limsup_{n \to \infty}$ 를 취하면 $f_{\varepsilon}$ 가 바운디드고 균등연속이었으므로 $(2)$ 에 따라 $$ \begin{align*} \displaystyle \limsup_{n \to \infty} P_{n}(F) \le & \limsup_{n \to \infty} \int_{S} f_{\varepsilon} dP_{n} \\ =& \int_{S} f_{\varepsilon} dP \\ \le & P\left( F^{\varepsilon} \right) \end{align*} $$ 양변에 $\displaystyle \lim_{\varepsilon \to 0}$ 를 취하면 측도의 위로부터의 연속성에 따라 $$ \begin{align*} \limsup_{n \to \infty} P_{n}(F) =& \lim_{\varepsilon \to 0} \limsup_{n \to \infty} P_{n}(F) \\ \le & \lim_{\varepsilon \to 0} P \left( F^{\varepsilon} \right) \\ =& P\left( \overline{F} \right) \end{align*} $$ $F$ 가 닫힌 집합이면 $\overline{F} = F$ 이므로 $$ \limsup_{n\to\infty} P_{n}(F) \le P(F) $$
Part 3. $(3) \iff (4)$
$G:= F^{c}$ 로 두면 $G$ 는 오픈 셋이고 $$ \begin{align*} & \displaystyle \limsup_{n\to\infty} P_{n}(F) \le P(F) \\ \iff & -P(F) \le -\limsup_{n\to\infty} P_{n}(F) \\ \iff & 1 -P(F) \le 1 -\limsup_{n\to\infty} P_{n}(F) \\ \iff & P(G) \le \liminf_{n\to\infty} \left[ 1 -P_{n}(F) \right] \\ \iff & P(G) \le \liminf_{n\to\infty} P_{n}(G) \end{align*} $$
Part 4. $(3),(4) \implies (5)$
인테리어, 클로져, 바운더리에 대해 간략하게 리뷰해보자.
$A^{\circ} \subset A \subset \overline{A}$여기서 인테리어 $A^{\circ}$ 는 $A$ 의 가장 큰 열린 부분집합이고, 클로져 $\overline{A}$ 는 $A$ 의 가장 작은 닫힌 초집합이다. 또한 $A$ 의 바운더리 $\partial A = \overline{A} \setminus A^{\circ}$ 는 당연히 $A^{\circ}$ 과는 디스조인트하다.
$(3)$ 에 따라 $$ \limsup_{n \to \infty} P_{n}(A) \le \limsup_{n \to \infty} P_{n}\left( \overline{A} \right) \le P \left( \overline{A} \right) $$ $(4)$ 에 따라 $$ P \left( A^{\circ} \right) \le \liminf_{n \to \infty} P_{n} \left( A^{\circ} \right) \le \liminf_{n \to \infty} P_{n}(A) $$ $P \left( \partial A \right) = 0$ 이므로 $P \left( A^{\circ} \right) = P(A) = P \left( \overline{A} \right)$ 이고 $$ P(A) = P \left( A^{\circ} \right) \le \liminf_{n \to \infty} P_{n}(A) \le \limsup_{n \to \infty} P_{n}(A) \le P \left( \overline{A} \right) = P(A) $$ 따라서 $$ \lim_{n \to \infty} P_{n}(A) = P(A) $$
Part 5. $(5) \implies (1)$
$g \in C_{b}(S)$, 즉 $g$ 가 $S$ 에서 정의된 바운디드고 연속인 함수라고 하자. $A \in \mathcal{B}(S)$ 에 대해 $\nu$ 를 다음과 같이 정의하자. $$ \nu (A) := P \left( g^{-1} \left( A \right) \right) $$ $g$ 는 바운디드이므로 모든 $x \in S$ 에 대해 $a \le g(x) \le b$ 를 만족하는 $a$, $b$ 를 잡을 수 있다. 여기서 $\nu$ 는 그 정의에 따라 유한한 함수값을 가진다. 여기서 $$ D := \left\{ \alpha : \nu ( \left\{ \alpha \right\} ) = 0 \right\} $$ 라고 두면 $$ D^{c} = \left\{ \alpha : \nu ( \left\{ \alpha \right\} ) > 0 \right\} = \bigcup_{n=1}^{\infty} \left\{ \alpha : \nu ( \left\{ \alpha \right\} ) > {{1} \over {n}} \right\} $$ 를 생각해보자. 자연수 $n \in \mathbb{N}$ 이 픽스되면 $ \left\{ \alpha : \nu ( \left\{ \alpha \right\} ) > {{1} \over {n}} \right\}$ 는 $\nu ( \mathbb{R}) < \infty$ 이므로 유한 집합이어야한다. 만약 유한 집합이 아니라면 $\displaystyle \nu ( \left\{ \alpha \right\} ) > {{ 1 } \over { n }}$ 을 만족하는 $\alpha$ 가 무한히 많다는 의미이므로 $\nu ( \mathbb{R}) < \infty$ 에 위배된다. 이에 따라 $D^{c}$ 는 유한 집합들의 가산 합집합이고, 따라서 $\nu \left( \left\{ \alpha \right\} \right) > 0$ 을 만족시키는 $\alpha \in [a,b]$ 들은 많아도 카운터블하게 많이 존재한다.
이제 다음의 세 가지 조건을 만족하는 $t_{0} , \cdots , t_{m}$ 을 잡을 수 있다:
- (i): $a = t_{0} < t_{1} < \cdots < t_{m} = b$
- (ii): $\nu \left( \left\{ t_{i} \right\} \right) = 0$
- (iii): $t_{i} - t_{i-1} < \varepsilon$
이에 대해 $A_{i} = g^{-1} \left( [ t_{i-1} , t_{i} ) \right)$ 와 같이 잡으면 $A_{i} \in \mathcal{B}(S)$ 이고 $\displaystyle \bigcup_{i=1}^{m} A_{i} = S$ 이다. 한편 연속함수의 프리이미지는 열림과 닫힘을 보존하므로 $g^{-1} \left( ( t_{i-1}, t_{i}) \right)$ 는 $S$ 에서 열린 집합, $g^{-1} \left( [ t_{i-1}, t_{i}] \right)$ 는 $S$ 에서 닫힌 집합이다. 또한 $A_{i}$ 의 인테리어 $A_{i}^{\circ}$ 는 $A_{i}$ 의 가장 큰 열린 부분집합이고, 클로져 $\overline{A_{i}}$ 는 $A_{i}$ 의 가장 작은 닫힌 초집합이므로 $$ g^{-1} \left( ( t_{i-1}, t_{i}) \right) \subset A_{i}^{\circ} \subset A_{i} \subset \overline{A_{i}} \subset g^{-1} \left( [ t_{i-1}, t_{i}] \right) $$ 한편 조건 (ii)에서 $\nu \left( \left\{ t_{i} \right\} \right) = 0$ 이었으므로 $\nu \left( [t_{i-1} , t_{i}] \right) = \nu \left( (t_{i-1}, t_{i}) \right)$ 다시 말해 $$ P \left( A_{i}^{\circ} \right) = P \left( A_{i} \right) = P \left( \overline{A_{i}} \right) $$ 이고, 이는 곧 $P \left( \partial A_{i} \right) = 0$ 이므로 가정 $(5)$ 에 따라 $\displaystyle \lim_{n\to\infty} P_{n}(A_{i}) = P(A_{i})$ 다. $$ h(x) := \sum_{i=1}^{m} t_{i-1} 1_{A_{i}} (x) $$ 이제 새로운 함수 $h$ 를 위와 같이 정의하자. $h$ 는 $m$ 개의 유한한 함수값들을 가지는 단순 함수가 되며, 조건 (iii) 에서 $h(x) \le g(x) \le h(x) + \varepsilon$ 임을 알 수 있다. $$ \begin{align*} \left| P_{n}(g) - P(g) \right| =& \left| \int_{S} g dP_{n} - \int_{S} g dP \right| \\ =& \left| \int_{S} (g-h) dP_{n} + \int_{S} h dP_{n} - \int_{S} h dP + \int_{S} (h-g) dP \right| \\ \le & \left| \int_{S} (g-h) dP_{n} \right| + \left| \int_{S} h dP_{n} - \int_{S} h dP \right| + \left| \int_{S} (h-g) dP \right| \\ \le & \varepsilon + \left| \sum_{i=1}^{m} t_{i-1} \int_{S} 1_{A_{i}} P_{n} - \sum_{i=1}^{m} t_{i-1} \int_{S} 1_{A_{i}} P \right| + \varepsilon \\ \le & 2 \varepsilon + \left| \sum_{i=1}^{m} t_{i-1} \left[ P_{n}(A_{i}) - P(A_{i}) \right] \right| \end{align*} $$ 한편 위에서 $\displaystyle \lim_{n\to\infty} P_{n}(A_{i}) = P(A_{i})$ 이므로 $n \to \infty$ 일 때 $P_{n}(g) \to P(g)$ 다. $g$ 는 바운디드고 연속이므로 약한 수렴의 정의에 따라 $P_{n} \overset{W}{\to} P$ 다.
■