logo

측도론으로 정의되는 분포 수렴 📂확률론

측도론으로 정의되는 분포 수렴

정의

거리 공간 SS보렐 시그마 필드 S:=B(S)\mathcal{S}:= \mathcal{B}(S) 에 대해 가측 공간 (S,S)(S,\mathcal{S}) 을 정의하자.

확률 공간 (Ω,F,P)(\Omega, \mathcal{F}, P) 에서 정의된 확률 변수 XX확률 과정 {Xn}nN\left\{ X_{n} \right\}_{n \in \mathbb{N}}nn \to \infty 일 때 모든 fCb(S)f \in C_{b}(S) 에 대해 다음을 만족하면 {Xn}\left\{ X_{n} \right\}XX분포 수렴한다converge in distribution고 말하고 XnDXX_{n} \overset{D}{\to} X 와 같이 나타낸다. Ωf(Xn)dPΩf(X)dP \int_{\Omega} f(X_{n}) dP \to \int_{\Omega} f(X) dP


  • Cb(S)C_{b}(S) 는 다음과 같이 SS 에서 정의되는 유계 연속 함수들의 집합을 나타낸다. Cb(S):={f:SRf is bounded and continuous} C_{b}(S) := \left\{ f:S \to \mathbb{R} \mid f\text{ is bounded and continuous} \right\}

정리

  • [1]: (S,S)(S,\mathcal{S}) 에서 정의된 확률 측도시퀀스 {Pn}nN\left\{ P_{n} \right\}_{n \in \mathbb{N}} 가 모든 보렐 셋 BB(R)B \in \mathcal{B} \left( \mathbb{R} \right) 에 대해 Pn(X1(B)):=P(Xn1(B)) P_{n} \left( X^{-1} (B) \right) := P \left( X_{n}^{-1} (B) \right) 을 만족하도록 정의되어 있다면, 다음이 성립한다. XnDX    PnWP X_{n} \overset{D}{\to} X \iff P_{n} \overset{W}{\to} P
  • [2]: XnDXX_{n} \overset{D}{\to} X 와 모든 {Xn}\left\{ X_{n} \right\} 의 서브 시퀀스 {Xn}{Xn}\left\{ X_{n '} \right\} \subset \left\{ X_{n} \right\}XnDXX_{n ''} \overset{D}{\to} X 를 만족하는 {Xn}\left\{ X_{n '} \right\} 의 서브 시퀀스 {Xn}{Xn}\left\{ X_{n ''} \right\} \subset \left\{ X_{n '} \right\} 를 가지는 것은 동치다. 수식으로 다시 쓰면 다음과 같다. XnDX    {Xn}{Xn},{Xn}{Xn}:XnDX X_{n} \overset{D}{\to} X \iff \forall \left\{ X_{n '} \right\} \subset \left\{ X_{n} \right\}, \exists \left\{ X_{n ''} \right\} \subset \left\{ X_{n '} \right\} : X_{n ''} \overset{D}{\to} X
  • [3] 연속 사상 정리: 가측 함수 h:(S,S)(S,S)h : (S , \mathcal{S}) \to (S ' , \mathcal{S} ') 에 대해서 hh 가 연속인 점들의 집합 ChC_{h}, 다시 말해 Ch:={xS:h is continuous at x}C_{h} : = \left\{ x \in S : h \text{ is continuous at } x \right\} 을 정의하자. 만약 XnDXX_{n} \overset{D}{\to} X 이고 P(XCh)=1P(X \in C_{h}) = 1 이면 h(Xn)Dh(X)h(X_{n}) \overset{D}{\to} h(X) 다. 수식으로 다시 쓰면 다음과 같다. XnDXP(XCh)=1    h(Xn)Dh(X) X_{n} \overset{D}{\to} X \land P(X \in C_{h}) = 1 \implies h(X_{n}) \overset{D}{\to} h(X)

설명

  • [1]: 정리에서 소개한 것과 같이 정의된 PnP_{n}XnX_{n} 에서 유도된 확률 측도induced Probability measure라 부른다. 분명하게 알아야할 것은 XnDXX_{n} \overset{D}{\to} X 은 확률 ‘변수’의 수렴, PnWPP_{n} \overset{W}{\to} P확률 ‘측도’의 수렴로써 구분된다는 것이다.
  • [2]: 언뜻 이 정리는 무척 억지스러워보이지만, 상대적 컴팩트라는 개념과 함께 중요한 성질이 된다.
  • [3]: 연속 사상 정리continuous Mapping theorem는 사실 확률 수렴, 거의 확실히 수렴에 대해서도 일반화가 가능하다. 한편 hh 도 함수고 확률 변수 역시 함수라는 점에서 합성함수 hXh \circ X 가 자연스럽게 쓰일 수 있음을 생각할 수 있어야한다. ASA \in \mathcal{S} ' 에 대해 다음과 같은 수식이 말이 되는지 고민해보고 납득하는 과정이 필요하다. P(h(X)1(A))=P(Xh1(A)) P \left( h(X)^{-1} (A) \right) = P \left( X \in h^{-1}(A) \right) 모든 fCb(S)f \in C_{b}(S) 에 대해 분포가 같다는 노테이션으로 =D\overset{D}{=} 를 사용하기도 한다. 그 정의는 모든 ASA \in \mathcal{S} ' 와 연속함수 h:SSh:S \to S' 에 대해 다음과 같다. h(X)=Dh(Y)    defP(h(X)1(A))=P(h(Y)1(A)) h(X) \overset{D}{=} h(Y) \overset{\text{def}}{\iff} P \left( h(X)^{-1}(A) \right) = P \left( h(Y)^{-1}(A) \right) 다시 수렴의 표현을 생각해보면 다음과 같다. h(Xn)Dh(X)    P(h(Xn)1(A))P(h(X)1(A)) h\left( X_{n} \right) \overset{D}{\to} h(X) \iff P \left( h\left( X_{n} \right)^{-1}(A) \right) \to P \left( h(X)^{-1}(A) \right)

증명

[1]

모든 fCb(S)f \in C_{b}(S) 에 대해 PnWP    SfdPnSfdP    Ωf(Xn)dPΩf(X)dP    XnDX \begin{align*} P_{n} \overset{W}{\to} P \iff & \int_{S} f dP_{n} \to \int_{S} f dP \\ \iff & \int_{\Omega} f(X_{n}) dP \to \int_{\Omega} f(X) dP \\ \iff & X_{n} \overset{D}{\to} X \end{align*}

[2]

(    )(\implies) XnDXX_{n} \overset{D}{\to} X 가 성립하지 않는다면 Ωf(Xn)dPΩf(X)dP \int_{\Omega} f(X_{n}) dP \to \int_{\Omega} f(X) dP 가 성립하지 않는 fCb(S)f \in C_{b}(S) 가 존재한다고 가정해보자. 다시 말해, Ωf(Xn)dPΩf(X)dP>ε \left| \int_{\Omega} f(X_{n '}) dP - \int_{\Omega} f(X) dP \right| > \varepsilon 를 만족하는 ε>0\varepsilon > 0 과 서브 시퀀스의 인덱스 {n}\left\{ n' \right\} 가 존재한다고 가정하는 것이다. 그런데 이는 Ωf(Xn)dPΩf(X)dP \int_{\Omega} f(X_{n ''}) dP \to \int_{\Omega} f(X) dP 를 만족하는 서브 시퀀스의 인덱스의 서브 시퀀스 {n}\left\{ n'' \right\} 가 항상 존재하므로 모순이다.


(    )(\impliedby) {n}={n}\left\{ n'' \right\} = \left\{ n \right\} 이라고 두면 자명하게 성립한다.

[3]

PXP_{X}XX 에서 유도된 확률 측도, 즉 PX(A):=P(X1(A))=P(XA)P_{X}(A) := P \left( X^{-1}(A) \right) = P(X \in A) 이라고 하자. h1(B)h1(B)Chc \overline{h^{-1}(B)} \subset h^{-1}(B) \cup C_{h}^{c} SS' 에서 닫힌 모든 집합 BB 에 대해 위의 포함관계가 성립한다. 임의의 xh1(B)x \in \overline{h^{-1}(B)} 를 생각해보면, hh연속인 부분에 대해서는 닫힘을 보존해서 h1(B)h^{-1}(B) 이 포함하고 연속이 아닌 부분의 프리 이미지는 ChcC_{h}^{c} 가 포함하기 때문이다. 클로져 h1(B)\overline{h^{-1}(B)}SS 에서 닫힌 집합이므로 lim supnP(h(Xn)B)=lim supnP(Xnh1(B))=lim supnPX(h(Xn)1(B))=lim supnPX([Xn1h1](B))=lim supnPX(Xn1(h1(B)))=lim supnPn(h1(B))lim supnPn(h1(B)) \begin{align*} & \limsup_{n \to \infty} P \left( h ( X_{n} ) \in B \right) \\ =& \limsup_{n \to \infty} P \left( X_{n} \in h^{-1} (B) \right) \\ =& \limsup_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right) \\ =& \limsup_{n \to \infty} P_{X} \left( \left[ X_{n}^{-1} \circ h^{-1} \right] (B) \right) \\ =& \limsup_{n \to \infty} P_{X} \left( X_{n}^{-1} \left( h^{-1} (B) \right) \right) \\ =& \limsup_{n \to \infty} P_{n} \left( h^{-1} (B)\right) \\ \le & \limsup_{n \to \infty} P_{n} \left( \overline{h^{-1} (B)} \right) \end{align*}

혼성 정리: 공간 SS거리 공간 (S,ρ)( S , \rho) 이면서 가측 공간 (S,B(S))(S,\mathcal{B}(S)) 이라고 하자. 다음은 모두 동치다.

  • (1): PnWPP_{n} \overset{W}{\to} P
  • (2): 모든 바운디드, 균등연속함수 ff 에 대해 SfdPnSfdP\displaystyle \int_{S} f dP_{n} \to \int_{S}f d P
  • (3): 모든 클로즈드 셋 FF 에 대해 lim supnPn(F)P(F)\displaystyle \limsup_{n\to\infty} P_{n}(F) \le P(F)
  • (4): 모든 오픈 셋 GG 에 대해 P(G)lim infnPn(G)\displaystyle P(G) \le \liminf_{n\to\infty} P_{n}(G)
  • (5): P(A)=0P(\partial A) = 0 인 모든 AA 에 대해 limnPn(A)=P(A)\displaystyle \lim_{n\to\infty} P_{n}(A) = P(A)

[1]에 따라 XnDXX_{n} \overset{D}{\to} X 이면 PnWPXP_{n} \overset{W}{\to} P_{X} 이고, 혼성 정리의 (1)    (3)(1) \implies (3) 과 가정 PX(XChc)=0P_{X}(X \in C_{h}^{c}) = 0 에 의해 lim supnPX(h(Xn)1(B))lim supnPn(h1(B))PX(h1(B))PX(h1(B)Chc)PX(h1(B))+PX(Chc)PX(h1(B))PX(X1(h1(B)))PX((h(X))1(B)) \begin{align*} \limsup_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right) \le & \limsup_{n \to \infty} P_{n} \left( \overline{h^{-1} (B)} \right) \\ \le & P_{X} \left( \overline{h^{-1} (B)} \right) \\ \le & P_{X} \left( h^{-1} (B) \cup C_{h}^{c} \right) \\ \le & P _{X}\left( h^{-1} (B) \right) + P_{X} \left( C_{h}^{c} \right) \\ \le & P_{X} \left( h^{-1} (B) \right) \\ \le & P_{X} \left( X^{-1} \left( h^{-1} (B) \right) \right) \\ \le & P_{X} \left( \left( h(X) \right)^{-1} (B) \right) \end{align*} 같은 방법으로 PX((h(X))1(B))lim infnPX(h(Xn)1(B))\displaystyle P_{X} \left( \left( h(X) \right)^{-1} (B) \right) \le \liminf_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right) 임을 보이면 limnPX(h(Xn)1(B))=PX((h(X))1(B)) \lim_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right) = P_{X} \left( \left( h(X) \right)^{-1} (B) \right)

같이보기

리뉴얼

  • 23년 8월 19일, 류대식, 정리 [1] 스테이트먼트 오타 수정(Pn(A):=P(Xn1(A))P_{n} (A) := P \left( X_{n}^{-1} (A)\right)Pn(X1(B)):=P(Xn1(B))P_{n} \left( X^{-1} (B) \right) := P \left( X_{n}^{-1} (B)\right))