logo

幾何分布の平均と分散 📂確率分布論

幾何分布の平均と分散

公式

XGeo(p)X \sim \text{Geo} (p) 面積 E(X)=1pVar(X)=1pp2 E(X) = {{ 1 } \over { p }} \\ \Var(X) = {{ 1-p } \over { p^{2} }}

導出

幾何分布の平均と分散は、思うほど簡単には求められない。このポストでは、有益ながらも面白い二つの証明を紹介する。

幾何分布の定義p(0,1]p \in (0,1]によれば、以下のような確率質量関数を持つ離散確率分布を幾何分布という。 p(x)=p(1p)x1,x=1,2,3, p(x) = p (1 - p)^{x-1} \qquad , x = 1 , 2, 3, \cdots

第一の方法

戦略:等比級数の公式と微分を使う。

平均

E(X)=x=1xp(1p)x1 E(X)=\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-1 } } f(p):=x=0(1p)x\displaystyle f(p): =\sum _{ x=0 }^{ \infty }{ { (1-p) }^{ x } } とおくと f(p)=11(1p)=1p f(p)=\frac { 1 }{ 1-(1-p) }=\frac { 1 }{ p } ppに対して微分すると、等比級数の公式により f(p)=1p2 f '(p)=-\frac { 1 }{ { p }^{ 2 } } 一方で、等比級数をそのまま微分すると f(p)=x=1x(1p)x1 f ' (p)=\sum _{ x=1 }^{ \infty }{ {-x { (1-p) }^{ x-1 } } } であり、 1p2=x=1x(1p)x1    1p=px=1x(1p)x1    1p=x=1xp(1p)x1=E(X) \begin{align*} & -\frac { 1 }{ { p }^{ 2 } }=-\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-1 } } \\ \implies& \frac { 1 }{ p }=p\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-1 } } \\ \implies& \frac { 1 }{ p }=\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-1 } }=E(X) \end{align*} 従ってE(X)=1p\displaystyle E(X)=\frac { 1 }{ p }

分散

V(X)=E(X2)E(X)2=x=1x2p(1p)x11p2 V(X)=E({ X }^{ 2 })-{ {E(X)} }^{ 2 }=\sum _{ x=1 }^{ \infty }{ { x^ 2} { p { (1-p) }^{ x-1 } }-\frac { 1 }{ { p }^{ 2 } } } 従ってE(X2)=x=1x2p(1p)x1\displaystyle E({ X }^{ 2 })=\sum _{ x=1 }^{ \infty }{ { x^2 }{ p { (1-p) }^{ x-1 } } }を求めれば良い。

同様にf(p):=x=0(1p)x\displaystyle f(p) :=\sum _{ x=0 }^{ \infty }{ { (1-p) }^{ x } }とおくと f(p)=11(1p)=1pf(p)=1p2f(p)=2p3 f(p)=\frac { 1 }{ 1-(1-p) }=\frac { 1 }{ p } \\ f '(p) = - \frac { 1 }{ p^{2} } \\ f ''(p)=\frac { 2 }{ { p }^{ 3 } } 一方で、f(p)=x=1x(x1)(1p)x2\displaystyle f ''(p)=\sum _{ x=1 }^{ \infty }{ x(x-1) { (1-p) }^{ x-2 } }でもあるので 2p3=x=1x(x1)(1p)x2    2p3=x=1x2(1p)x2x=1x(1p)x2    p2p3=px=1x2(1p)x2px=1x(1p)x2    2p2=x=1x2p(1p)x2x=1xp(1p)x2    2p2=11px=1x2p(1p)x111px=1xp(1p)x1    2(1p)p2=E(X2)1p    E(X2)=2pp2 \begin{align*} & \frac { 2 }{ { p }^{ 3 } }=\sum _{ x=1 }^{ \infty }{ x(x-1) { (1-p) }^{ x-2 } } \\ \implies& \frac { 2 }{ { p }^{ 3 } }=\sum _{ x=1 }^{ \infty }{ { x^2 } { { (1-p) }^{ x-2 } }-\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-2 } } } \\ \implies& p\frac { 2 }{ { p }^{ 3 } }=p\sum _{ x=1 }^{ \infty }{ { x^2 } { { (1-p) }^{ x-2 } }-p\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-2 } } } \\ \implies& \frac { 2 }{ { p }^{ 2 } }=\sum _{ x=1 }^{ \infty }{ { x^2 } { p { (1-p) }^{ x-2 } }-\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-2 } } } \\ \implies& \frac { 2 }{ { p }^{ 2 } }=\frac { 1 }{ 1-p }\sum _{ x=1 }^{ \infty }{ { x^2 } { p { (1-p) }^{ x-1 } }-\frac { 1 }{ 1-p }\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-1 } } } \\ \implies& \frac { 2(1-p) }{ { p }^{ 2 } }=E({ X }^{ 2 })-\frac { 1 }{ p } \\ \implies& E({ X }^{ 2 })=\frac { 2-p }{ { p }^{ 2 } } \end{align*} 従ってV(X)=1pp2\displaystyle V(X)=\frac { 1-p }{ { p }^{ 2 } }

第二の方法

戦略:幾何分布の無記憶性を用いる。複雑な式を避けて言葉で済ます感じだが、人によってはむしろ難しく感じるかもしれない。

平均

E(X)=1P( 첫번째 시행에서 성공 )+E(Y+1)P(첫번째 시행에서 실패) E(X)=1 \cdot P(\text{ 첫번째 시행에서 성공 })+E(Y+1)\cdot P( \text{첫번째 시행에서 실패}) 期待値の定義により、初回が成功する確率とその時の試行回数11、初回が失敗する確率とこの場合の期待値E(Y+1)E(Y+1)の積を加えたものが期待値E(X)E(X)になる。もちろん、ここで登場したYYXXと同じようにGeo(p)\text{Geo} (p)に従う。初回が成功しても失敗しても、幾何分布は無記憶性を持つので、始めからやり直し、YY11を別に加える調整を行ったのである。再び綺麗に書くと次のようになる。 E(X)=1p+E(Y+1)(1p) E(X)=1\cdot p+E(Y+1)\cdot (1-p) しかし、E(Y+1)E(Y+1)E(Y+1)=E(Y)+E(1)=E(Y)+1E(Y+1)=E(Y)+E(1)=E(Y)+1で表せるし、XGeo(p)X \sim \text{Geo} (p)でありYGeo(p)Y \sim \text{Geo} (p)なので E(Y)=E(X) E(Y)=E(X) E(X)=p+E(X)+1(1p)\displaystyle E(X)=p+{E(X)+1}(1-p)E(X)E(X)に対して整理すると E(X)=1p E(X)=\frac { 1 }{ p }

分散

E(X2)=1p+E((Y+1)2)(1p)=p+E(X2)+2E(X)+1(1p)=p+E(X2)+2E(X)+1pE(X2)2pE(X)p \begin{align*} E({ X }^{ 2 }) =& 1\cdot p+E({ (Y+1) }^{ 2 })\cdot (1-p) \\ &=p+{E({ X }^{ 2 })+2E(X)+1}(1-p) \\ &=p+E({ X }^{ 2 })+2E(X)+1-pE({ X }^{ 2 })-2pE(X)-p \end{align*} 綺麗に整理すると 0=2E(X)+1pE(X2)2pE(X) 0=2E(X)+1-pE({ X }^{ 2 })-2pE(X) 22次のモーメントを二項展開すると pE(X2)=2(1p)E(X)+1=2(1p)1p+1=2pp \begin{align*} pE({ X }^{ 2 }) =& 2(1-p)E(X)+1 \\ &=2(1-p)\frac { 1 }{ p }+1 \\ =& \frac { 2-p }{ p } \end{align*} 両辺をppで割ると E(X2)=2pp2 E({ X }^{ 2 })=\frac { 2-p }{ { p }^{ 2 } } 従ってV(X)=1pp2\displaystyle V(X)=\frac { 1-p }{ { p }^{ 2 } }