二項分布の平均と分散
📂確率分布論二項分布の平均と分散
公式
X∼Bin(n,p) 面
E(X)=npVar(X)=npq
- ここで、q:=1−p です。
導出
戦略:組み合わせを直接解きます。式は少し汚いけど、高校レベルで十分に消化できる。一度は自分でやってみるべきだ。数理統計学に触れると、[もっと短く簡単な方法で]証明できるようになる。(../1480) 平均でも分散でも、以下のような二項分布の確率質量関数から始めます。
二項分布の定義:n∈N とp∈[0,1] に対して、以下のような確率質量関数を持つ離散確率分布 Bin(n,p) を二項分布と呼ぶ。
p(x)=(xn)px(1−p)n−x,x=0,1,⋯,n
平均
二項分布 Bin(n,p) の確率質量関数は p(k)=nCkpk(1−p)n−k だから
E(X)=k=0∑nknCkpkqn−k
k=0 の時 knCkpkqn−k=0 だから
E(X)===k=1∑nknCkpkqn−kk=1∑nk(n−k)!k!n!pkqn−knpk=1∑n(n−k)!(k−1)!(n−1)!pk−1qn−k
この時 (n−1)=m,(k−1)=s とすると
E(X)===nps=0∑m(m−s)!s!m!psqm−snp⋅1np
■
分散
分散の性質から、Var(X)=E(X2)−E(X)2=E(X2)−(np)2
E(X2)==k=1∑nk2(n−k)!k!n!pkqn−knpk=1∑nk(n−k)!(k−1)!(n−1)!pk−1qn−k
(n−1)=m,(k−1)=s とすると
E(X2)===nps=0∑m(s+1)(m−s)!s!m!psqm−snp(s=0∑ms(m−s)!s!m!psqm−s+s=0∑m(m−s)!s!m!psqm−s)np(s=0∑ms(m−s)!s!m!psqm−s+1)
S∼Bin(m,p) の期待値は s=0∑ms(m−s)!s!m!psqm−s=mp だから
E(X2)=====np(mp+1)np(n−1)p+1np(np−p+1)np(np+q)(np)2+npq
従って
Var(X)===E(X2)−(np)2(np)2+npq−(np)2npq
■