logo

二項分布の平均と分散 📂確率分布論

二項分布の平均と分散

公式

XBin(n,p)\displaystyle X \sim \text{Bin} (n,p)E(X)=npVar(X)=npq E(X)=np \\ \Var(X)=npq


  • ここで、q:=1pq : = 1-p です。

導出

戦略:組み合わせを直接解きます。式は少し汚いけど、高校レベルで十分に消化できる。一度は自分でやってみるべきだ。数理統計学に触れると、[もっと短く簡単な方法で]証明できるようになる。(../1480) 平均でも分散でも、以下のような二項分布の確率質量関数から始めます。

二項分布の定義nNn \in \mathbb{N}p[0,1]p \in [0,1] に対して、以下のような確率質量関数を持つ離散確率分布 Bin(n,p)\text{Bin}(n,p)二項分布と呼ぶ。 p(x)=(nx)px(1p)nx,x=0,1,,n p(x) = \binom{n}{x} p^{x} (1-p)^{n-x} \qquad , x= 0, 1 , \cdots , n

平均

二項分布 Bin(n,p)\text{Bin} (n,p) の確率質量関数は p(k)=nCkpk(1p)nkp( k ) = { _n {C} _k } p^{ k } (1-p)^{n-k} だから E(X)=k=0nknCkpkqnk E(X)=\sum _{ k=0 }^{ n }{ k{ _n {C} _k }{ p ^ k }{ q ^ { n - k } } } k=0\displaystyle k=0 の時 knCkpkqnk=0k{ _n {C} _k }{ p ^ k }{ q ^ { n - k } }=0 だから E(X)=k=1nknCkpkqnk=k=1nkn!(nk)!k!pkqnk=npk=1n(n1)!(nk)!(k1)!pk1qnk \begin{align*} E(X) =& \sum _{ k=1 }^{ n }{ k{ _n {C} _k }{ p ^ k }{ q ^ { n - k } } } \\ =& \sum _{ k=1 }^{ n }{ k\frac { n! }{ (n-k)!k! }{ p ^ k }{ q ^ { n - k } } } \\ =& np\sum _{ k=1 }^{ n }{ \frac { (n-1)! }{ (n-k)!(k-1)! }{ p ^ { k - 1 } }{ q ^ { n - k } } } \end{align*} この時 (n1)=m,(k1)=s(n-1)=m, (k-1)=s とすると E(X)=nps=0mm!(ms)!s!psqms=np1=np \begin{align*} E(X) =& np\sum _{ s=0 }^{ m }{ \frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } } \\ =& np\cdot 1 \\ =& np \end{align*}

分散

分散の性質からVar(X)=E(X2)E(X)2=E(X2)(np)2\Var (X)=E({ X ^ 2 })- { {E(X)} }^{ 2 } = E(X^{ 2 })- { (np) }^{ 2 } E(X2)=k=1nk2n!(nk)!k!pkqnk=npk=1nk(n1)!(nk)!(k1)!pk1qnk \begin{align*} E({ X ^ 2 }) =& \sum _{ k=1 }^{ n }{ { k }^{ 2 } \frac { n! }{ (n-k)!k! }{ p ^ k }{ q ^ { n - k } } } \\ =& np\sum _{ k=1 }^{ n }{ k\frac { (n-1)! }{ (n-k)!(k-1)! }{ p ^ { k - 1 } }{ q ^ { n - k } } } \end{align*} (n1)=m,(k1)=s\displaystyle (n-1)=m, (k-1)=s とすると E(X2)=nps=0m(s+1)m!(ms)!s!psqms=np(s=0msm!(ms)!s!psqms+s=0mm!(ms)!s!psqms)=np(s=0msm!(ms)!s!psqms+1) \begin{align*} E({ X ^ 2 }) =& np\sum _{ s=0 }^{ m }{ (s+1)\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } } \\ =& np\left( \sum _{ s=0 }^{ m }{ s\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } }+\sum _{ s=0 }^{ m }{ \frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } } \right) \\ =& np\left( \sum _{ s=0 }^{ m }{ s\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } }+ 1 \right) \end{align*} SBin(m,p)S \sim \text{Bin} (m,p) の期待値は s=0msm!(ms)!s!psqms=mp\displaystyle \sum _{ s=0 }^{ m }{ s\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } }=mp だから E(X2)=np(mp+1)=np(n1)p+1=np(npp+1)=np(np+q)=(np)2+npq \begin{align*} E({ X ^ 2 }) =& np(mp+1) \\ =& np{(n-1)p+1} \\ =& np(np-p+1) \\ =& np(np+q) \\ =& { (np) ^ 2 }+npq \end{align*} 従って Var(X)=E(X2)(np)2=(np)2+npq(np)2=npq \begin{align*} \Var (X) =& E(X^{ 2 })-{ (np) ^ 2 } \\ =& { (np) ^ 2 }+npq-{ (np) ^ 2 } \\ =& npq \end{align*}