이항분포의 극한분포로써 표준정규분포 유도
정리
드 무아브르-라플라스 정리
$X_i \sim B(1,p)$ 이고 $Y_n = X_1 + X_2 + \cdots + X_n$ 이라고 하면 $Y_n \sim B(n,p)$ 이고 $$ { { Y_n - np } \over {\sqrt{ np(1-p) } } }\overset{D}{\to} N(0,1) $$
- $N \left( \mu , \sigma^{2} \right)$ 는 평균이 $\mu$ 고 분산이 $\sigma^{2}$ 인 정규 분포다.
- $B(n,p)$ 은 시행 $n$ 번에 확률 $p$ 인 이항 분포다.
- $\overset{D}{\to}$ 는 분포 수렴을 의미한다.
설명
이 정리는 드 무아브르-라플라스 정리de Moivre–Laplace theorem라고도 불리며, 중심극한정리의 특수한 예로써 널리 알려져있다.
통계를 처음 접할때부터 이항분포의 표본이 커지면 정규분포에 근사함을 배워왔다. 경험적으로도 당연하고 증명 과정이 큰 의미를 갖지는 않으나, 수식적으로 와닿지 않는 분포 수렴을 구체적으로 파악하기에 좋은 예다.
유도
$$ { { Y_n - np } \over {\sqrt{ np(1-p) } } } = \sqrt{n} { { \overline{X_n} - p } \over { \sqrt{p(1-p)} } } $$ $X_i \sim B(1,p)$ 이므로 $E(X_i ) = p$ 이고 $\operatorname{Var}(X_i ) = p(1-p)$ 이다. 그리고 중심극한정리에 의해 $$ \sqrt{n} { { \overline{X_n} - p } \over { \sqrt{p(1-p)} } } \overset{D}{\to} N(0,1) $$
■