연속 사상 정리 증명 📂확률론

연속 사상 정리 증명

정리 ¹

다음은 연속 사상 정리의 측도론적 서술이다.

거리 공간 $\left( S , d \right)$ 와 $\left( S' , d’ \right)$ 에 대해 $g : S \to S'$ 가 $C_{g} \subset S$ 에서 연속이라고 하자. $S$ 의 확률 원소 $X$ 에 대해 $P \left( X \in C_{g} \right) = 1$ 이면 $X$ 로 수렴하는 확률 원소의 시퀀스 $\left\{ X_{n} \right\}_{n \in \mathbb{N}}$ 에 대해 다음이 성립한다. $X_{n} \overset{D}{\to} X \implies g \left( X_{n} \right) \overset{D}{\to} g(X) \\ X_{n} \overset{P}{\to} X \implies g \left( X_{n} \right) \overset{P}{\to} g(X) \\ X_{n} \overset{\text{a.s.}}{\to} X \implies g \left( X_{n} \right) \overset{\text{a.s.}}{\to} g(X)$

$C_{g} \subset S$ 는 함수 $g$ 가 연속인 점들의 집합을 나타낸다.
$\overset{P}{\to}$ , $\overset{D}{\to}$ , $\overset{\text{a.s.}}{\to}$ 는 각각 확률 수렴, 분포 수렴, 거의 확실히 수렴을 의미한다.

설명

연속 함수를 취해도 수렴성이 보장된다는 성질은 수학 전반에서 수렴을 어떻게 정의하더라도 흔히 볼 수 있는 현상이다. 다만 Continuous Mapping Theorem이라는 명칭은 보편적으로 확률론에서 쓰인다. 유명한 따름정리로는 학부 수리통계학 수준에서 스테이트먼트 정도로만 소개되는 슬러츠키 정리^{slutsky’s theorem}가 있다.

슬러츠키 정리²: 상수 $a,b$ 와 확률 변수 $A_{n}, B_{n} ,X_{n} , X$ 에 대해 $a_{n} \overset{P}{\to} a$ , $B_{n} \overset{P}{\to} b$ , $X_{n} \overset{D}{\to} X$ 면 $A_{n} + B_{n} X_{n} \overset{D}{\to} a + b X$

팩트 자체는 학부 수리통계학처럼 기초적인 과목에서도 된다고 가정하고 사용하지만, 배경지식 없이도 이해하기 쉬운 증명을 찾을 수는 없어서 부득이하게 측도론을 끌어온 증명을 소개하게 되었다. 만약 본인이 학부생이고 실해석에 대한 이해가 부족하다면 증명을 이해할 수 없는 게 정상이니 실망할 필요 없다. 그보다는 조금 더 어려운 수학을 배워야하는구나, 일단은 팩트로써 잘 쓰자 정도의 마음가짐이면 충분하다.

증명

분포 수렴

혼성 정리의 따름정리로써 얻을 수 있다.

■

확률 수렴

$\varepsilon > 0$ 를 픽스하고 임의의 $\delta > 0$ 에 대해 다음과 같은 집합 $C_{g}^{\delta} \subset C_{g}$ 를 정의하자. $C_{g}^{\delta}:= \left\{ x \in C_{g} \mid \exists y : y \in B \left( x;\delta \right) \land g(y) \notin B ' \left( g(x) ; \varepsilon \right) \right\}$ 이 집합은 반경 $\delta$ 내에 $g(y)$ 와 $g(x)$ 의 거리가 충분히 먼 $y$ 를 잡을 수 있으면서 $g$ 에서 연속인 점 $x$ 들을 모아두었다. 물론 반경 $\delta > 0$ 가 작아질수록 이러한 $y$ 가 반경 안에 존재할 수 있는 가능성은 줄어들고, 자명하게도 $\displaystyle \lim_{\delta \to 0} C_{g}^{\delta} = \emptyset$ 이다. 이제 $d’ \left( g(X) , g \left( X_{n} \right) \right) \ge \varepsilon$ 이라 가정해볼텐데, 그러려면 적어도 다음 세가지 중 하나는 참이어야한다:

(1): $d \left( X , X_{n} \right) > \delta$ : 애초에 $X$ 와 $X_{n}$ 가 너무 멀어서 $g$ 가 연속이든 말든 $g(X)$ 와 $g \left( X_{n} \right)$ 도 멀다.
(2): $X \in C_{g}^{\delta}$ : $X$ 에서 연속이긴 한데 $\delta$ 반경 안의 $X_{n}$ 에 대해서는 $g(X_{n})$ 과 $g (X)$ 의 거리가 멀다.
(3): $X \notin C_{g}$ : $X$ 에선 연속이 아니라서 $g(X)$ 와 $g \left( X_{n} \right)$ 가 멀다.

이를 확률을 이용해 수식으로 나타내보면 $P \left( d’ \left( g \left( X_{n} \right) , g(X) \right) > \varepsilon \right) \le P \left( d \left( X_{n} , X \right) \ge \delta \right) + P \left( X \in C_{g}^{\delta} \right) + P \left( X \notin C_{g} \right)$ 우변의 각 항은

(1): 전제에서 $X_{n} \overset{P}{\to} X$ 이므로 모든 $\delta >0$ 에 대해 $\lim_{n \to \infty} P \left( d \left( X_{n} , X \right) \ge \delta \right) = 0$
(2): 위에서 $\displaystyle \lim_{\delta \to 0} C_{g}^{\delta} = \emptyset$ 라고 했으므로 $\lim_{\delta \to 0} P \left( X \in C_{g}^{\delta} \right) = 0$
(3): 전제에서 $P \left( X \in C_{g} \right) = 1$ 이므로 $P \left( X \notin C_{g} \right) = P \left( X \in C_{g}^{c} \right) = 0$

정리하면 $\lim_{n \to \infty} P \left( d’ \left( g \left( X_{n} \right) , g (X) \right) > \varepsilon \right) = 0$

■

거의 확실히 수렴

$g$ 가 연속인 점 $\omega \in C_{g}$ 에 대해서는 $n \to \infty$ 일 때 $\lim_{n \to \infty} X_{n} (\omega) = X (\omega) \implies \lim_{n \to \infty} g \left( X_{n} (\omega) \right) = g \left( X (\omega) \right)$ 사건으로 보고 포함관계로 나타내보면 $\left[ \lim_{n \to \infty} X_{n} (\omega) = X (\omega) \right] \subset \left[ \lim_{n \to \infty} g \left( X_{n} (\omega) \right) = g \left( X (\omega) \right) \right]$ 전제에서 $X_{n} \overset{\text{a.s.}}{\to} X$ , 즉 $\displaystyle P \left( \lim_{n \to \infty } X_{n} = X , X \in C_{g} \right) = 1$ 이므로 $\begin{align*} P \left[ \lim_{n \to \infty} g \left( X_{n} (\omega) \right) = g \left( X (\omega) \right) \right] \ge & P \left[ \lim_{n \to \infty} g \left( X_{n} (\omega) \right) = g \left( X (\omega) \right) , X \in C_{g} \right] \\ \ge & P \left[ \lim_{n \to \infty} X_{n} (\omega) = X (\omega) , X \in C_{g} \right] \\ =& 1 \end{align*}$

■

https://en.wikipedia.org/wiki/Continuous_mapping_theorem ↩︎
Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p306. ↩︎