二項分布

定義 ¹

pmf10 pmf20

$n \in \mathbb{N}$ と $p \in [0,1]$ に対して以下の確率質量関数を有する離散確率分布 $\text{Bin}(n,p)$ を 二項分布^{binomial distribution}と呼ぶ。 $$ p(x) = \binom{n}{x} p^{x} (1-p)^{n-x} \qquad , x = 0 , 1, \cdots n $$

基本性質

積率母関数

[1]: $$m(t) = \left[ (1-p) + pe^{t} \right]^{n} \qquad , t \in \mathbb{R}$$

平均と分散

[2]: もし $X \sim \text{Bin}(n,p)$ ならば $$ \begin{align*} E(X) =& np \\ \Var(X) =& np(1-p) \end{align*} $$

定理

二項分布の極限分布としてのポアソン分布導出

[a]: $X_{n} \sim B(n,p)$ とする。もし $\mu \approx np$ ならば $$ X_{n} \overset{D}{\to} \text{Poi} (\mu) $$

二項分布の極限分布としての標準正規分布導出

[b]: もし $X_i \sim B(1,p)$ で $Y_n = X_1 + X_2 + \cdots + X_n$ ならば $Y_n \sim B(n,p)$ で $$ { { Y_n - np } \over {\sqrt{ np(1-p) } } }\overset{D}{\to} N(0,1) $$

説明

ベルヌーイ分布

二項分布は、人が最も簡単に考えられるベルヌーイ試行^{bernoulli experiment}から始まる。ベルヌーイ試行は、確率 $0 \le p \le 1$ で成功するか失敗するかの2つの結果しかなく、これを $n$ 回で一般化したものが二項分布である。逆に、ベルヌーイ分布は二項分布が $n=1$ の時の特別なケースである。

多項分布

さらに、成功か失敗かの2つのケースではなく $k$ の場合に一般化することで、多変量分布 $M (n; p_{1} , \cdots , p_{k})$ を多項分布^{multinomial distribution}と呼ぶ。その確率質量関数は次のように与えられる。 $$ p(x_{1} , \cdots , x_{k}) = {{ n! } \over { x_{1} ! \cdots x_{k}! }} p_{1}^{x_{1}} \cdots p_{k}^{x_{k}} $$

証明

[1]

$$ \begin{align*} M(t) =& \sum_{x=0}^{n} e^{tx} p(x) \\ =& \sum_{x=0}^{n} e^{tx} \binom{n}{x} p^{x} (1-p)^{n-x} \\ =& \sum_{x=0}^{n} \binom{n}{x} \left( pe^{t} \right)^{x} (1-p)^{n-x} \end{align*} $$ 二項定理によると $$ \sum_{x=0}^{n} \binom{n}{x} \left( pe^{t} \right)^{x} (1-p)^{n-x} = \left[ pe^{t} + (1-p) \right]^{n} $$

■

[2]

戦略: 教科課程のように数式的トリックを使って導出することもできるが、積率母関数も求めてあるので数理統計学の理論を使って簡単に導出してみよう。

$M$ の導関数は $$ M ' (t) = n \left[ (1-p) + pe^{t} \right]^{n-1} \left( pe^{t} \right) $$ 積率母関数の定義から $ E(X) = M ' (0):$ であるため $$ \mu := E(X) = M ' (0) = np $$ $M$ の二階導関数は $$ M '' (t) = n \left[ (1-p) + pe^{t} \right]^{n-1} \left( pe^{t} \right) + n(n-1) \left[ (1-p) + pe^{t} \right]^{n-2} \left( pe^{t} \right)^{2} $$ $M '' (0) = np + n(n-1)p^{2}$ であるため $$ \begin{align*} \Var(X) =& E \left( X^{2} \right) - \mu^{2} \\ =& M '' (0) - (np)^{2} \\ =& np + n(n-1)p^{2} - n^{2}p^{2} \\ =& np(1-p) \end{align*} $$

■

[a]

積率生成関数で近似する。

■

[b]

中心極限定理のように近似する。

■

コード

次はJuliaのコードで、二項分布の確率質量関数をGIFで表示するものである。

@time using LaTeXStrings
@time using Distributions
@time using Plots

cd(@__DIR__)

x = 0:20
P = collect(0.0:0.01:1.0); append!(P, reverse(P))

animation = @animate for p ∈ P
    scatter(x, pdf.(Binomial(10, p), x),
     color = :black, markerstrokecolor = :black,
     label = "n = 10, p = $(rpad(p, 4, '0'))", size = (400,300))
    xlims!(0,20); ylims!(0,0.5); title!(L"\mathrm{pmf\,of\,Bin}(10, p)")
end
gif(animation, "pmf10.gif")

animation = @animate for p ∈ P
    scatter(x, pdf.(Binomial(20, p), x),
     color = :black, markerstrokecolor = :black,
     label = "n = 20, p = $(rpad(p, 4, '0'))", size = (400,300))
    xlims!(0,20); ylims!(0,0.5); title!(L"\mathrm{pmf\,of\,Bin}(20, p)")
end
gif(animation, "pmf20.gif")

Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p142. ↩︎