logo

수리통계학에서의 분포 수렴 📂수리통계학

수리통계학에서의 분포 수렴

정의 1

확률변수 $X$ 와 확률 변수의 시퀀스 $\left\{ X_{n} \right\}$ 가 다음을 만족하면 $n \to \infty$ 일 때 $X_{n}$ 이 $X$ 로 분포 수렴convergence in distribution한다고 말하고, $X_{n} \overset{D}{\to} X$ 와 같이 나타낸다. $$ \lim_{n \to \infty} F_{X_{n}} (x) = F_{X} (x) \qquad, \forall x \in C_{F_{X}} $$


  • $F_{X}$ 는 확률변수 $X$ 의 누적분포함수다.
  • $C_{F_{X}}$ 는 함수 $F_{X}$ 가 연속인 점들의 집합을 나타낸다.

설명

분포 수렴확률 수렴과 마찬가지로 분포의 센스에서 수렴을 정의한 개념이다. 각각의 $x \in C_{F_{X}}$ 에 대해 수렴한다는 것은 실로 해석학에서 말하는 함수의 점별 수렴과 비슷하며, 이러한 유사점은 균등 수렴하면 점별 수렴하듯 확률 수렴하면 분포 수렴한다는 팩트로도 이어진다.

주의해야할 것은 분포 수렴이라고 말은 해도 수식 $X_{n} \overset{D}{\to} X$ 에서 정확히 나타나듯 ‘분포 수렴’ 역시 ‘확률 변수의 수렴’을 논하고 싶다는 것이다. 분포 함수가 연속한 부분에서 점별로 수렴한다는 것은 정확히 확률 변수가 수렴하는 게 아니라 확률 변수가 가진 자산 중 하나인 분포로서 수렴한다는 말이다. 당연하지만 이는 확률 변수 자체가 수렴하는 것보다 훨씬 느슨한 전제가 된다. 분포의 관점에서 차이가 없다고 하더라도 확률 변수가 본질적으로 수렴하는 것은 아니다.

실제로 $X_{n} \overset{D}{\to} X$ 고 $Y_{n} \overset{D}{\to} Y$ 라고 $X_{n} + Y_{n}$ 이 $X + Y$ 로 분포수렴하는 것이 보장되지는 않는다. 확률 수렴과 달리 분포 수렴은 누적분포함수의 점별 수렴이라는 가벼운 조건이면 충분하기 때문에 이러한 상식적인 성질들조차 가지지 못하는 것이다.

정리

$X_{n} \overset{D}{\to} X$ 이라 하자.

  • [1] 연속 사상 정리: 연속 함수 $g$ 에 대해 $$ g\left( X_{n} \right) \overset{D}{\to} g (X) $$
  • [2]: 확률 수렴하면 분포 수렴한다. 즉, $$ X_{n} \overset{P}{\to} X \implies X_{n} \overset{D}{\to} X $$
  • [3]: 분포 수렴하면 확률 유계다.
  • [4] 슬러츠키 정리2: 상수 $a,b$ 와 확률 변수 $A_{n}, B_{n} ,X_{n} , X$ 에 대해 $a_{n} \overset{P}{\to} a $, $ B_{n} \overset{P}{\to} b $, $ X_{n} \overset{D}{\to} X $ 면 $$ A_{n} + B_{n} X_{n} \overset{D}{\to} a + b X $$

극한 분포

한편 $X_{n} \overset{D}{\to} X$ 이면 $X$ 의 분포를 $\left\{ X_{n} \right\}$ 의 점근asyptotic 혹은 극한limiting 분포라고도 한다. 편의상 $X$ 의 분포를 그대로 쓰기도 하는데, 예를 들어 $X \sim N(0,1)$ 이면 다음과 같이 나타내기도 한다3. $$ X_{n} \overset{D}{\to} N(0,1) $$

예시

[a] 이항분포의 극한분포로써 푸아송분포 유도: $X_{n} \sim B(n,p)$이라고 하자.

$\mu \approx np$ 이면 $$ X_{n} \overset{D}{\to} \text{Poi} (\mu) $$ [b] 이항분포의 극한분포로써 표준정규분포 유도: $X_i \sim B(1,p)$ 이고 $Y_n = X_1 + X_2 + \cdots + X_n$ 이라고 하면 $Y_n \sim B(n,p)$ 이고 $$ { { Y_n - np } \over {\sqrt{ np(1-p) } } }\overset{D}{\to} N(0,1) $$ [c] 푸아송분포의 극한분포로써 표준정규분포 유도: $X_{n} \sim \text{Poi} \left( n \right)$ 이고 $\displaystyle Y_{n} := {{ X_{n} - n } \over { \sqrt{n} }}$ 이면 $$ Y_{n} \overset{D}{\to} N(0,1) $$ [d] 스튜던트 t-분포의 극한분포로써 표준정규분포 유도: $T_n \sim t(n)$ 이면 $$ T_n \ \overset{D}{\to} N(0,1) $$

극한 분포가 필요한 이유

이러한 점근 분포들에서 분포 수렴은 결국 확률 변수의 수렴이라고 부르기엔 부족하다는 것을 알 수 있다. 예로써 이항 분포에서 충분히 큰 분포 $n$ 이 주어져서 정규 분포로 근사할 수 있을지라도, 그 확률 변수 자체의 본질까지 정규 분포를 흉내낼 수는 없다. 아무리 $n$ 이 커도 이항 분포는 이항 분포고, 정규 분포는 정규 분포다. 그러나 분포가 비슷하기 때문에 겉으로 보기에는 구분할 수 없을 뿐이다.

그럼에도 분포 수렴을 생각하는 이유는 그 구분할 수 없을 정도면 충분하고, 더 이상 조건에서 타협할 수 없을 때가 있기 때문이다. 앞서 언급했듯 죽었다 깨어나도 이산확률분포는 연속확률분포가 될 수 없는데, 분포 수렴이라는 약한 수렴의 개념이라도 도입해서 당장 이산확률 분포를 연속확률분포처럼 쓸 수 있다면 굳이 고려하지 않을 이유가 없다.

증명

[1][4]

[2]

[3]

[a]

[b]

[c]

[d]

엄밀한 정의


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p208. ↩︎

  2. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p306. ↩︎

  3. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p300. ↩︎