二項分布の極限分布としての標準正規分布の導出
定理
ド・モアブル-ラプラス定理
$X_i \sim B(1,p)$ であり、かつ $Y_n = X_1 + X_2 + \cdots + X_n$ であれば、$Y_n \sim B(n,p)$ となり $$ { { Y_n - np } \over {\sqrt{ np(1-p) } } }\overset{D}{\to} N(0,1) $$
- $N \left( \mu , \sigma^{2} \right)$ は平均が $\mu$ で分散が $\sigma^{2}$ の正規分布だ。
- $B(n,p)$ は試行 $n$ 回で確率 $p$ の二項分布だ。
- $\overset{D}{\to}$ は分布収束を意味する。
説明
この定理は ド・モアブル-ラプラス定理de Moivre–Laplace theoremとしても知られ、中心極限定理の特別な例として広く知られている。
統計を初めて学ぶときから、二項分布の標本が大きくなると正規分布に近づくことが学ばれてきた。経験的にも明らかであり、証明の過程はそれほど大きな意味を持たないが、公式だけでは直感的に理解しづらい分布収束を具体的に把握するのに適している例である。
導出
$$ { { Y_n - np } \over {\sqrt{ np(1-p) } } } = \sqrt{n} { { \overline{X_n} - p } \over { \sqrt{p(1-p)} } } $$ $X_i \sim B(1,p)$ であるから、$E(X_i ) = p$ そして $\operatorname{Var}(X_i ) = p(1-p)$ である。そして、中心極限定理により、 $$ \sqrt{n} { { \overline{X_n} - p } \over { \sqrt{p(1-p)} } } \overset{D}{\to} N(0,1) $$
■