logo

기하 분포의 평균과 분산 📂확률분포론

기하 분포의 평균과 분산

공식

XGeo(p)X \sim \text{Geo} (p)E(X)=1pVar(X)=1pp2 E(X) = {{ 1 } \over { p }} \\ \operatorname{Var}(X) = {{ 1-p } \over { p^{2} }}

유도

기하 분포의 평균과 분산은 생각보다 쉽게 구해지지 않는다. 본 포스트에서는 유익하면서도 재미있는 두가지 증명을 소개한다.

기하 분포의 정의p(0,1]p \in (0,1] 에 대해 다음과 같은 확률 질량 함수를 가지는 이산 확률 분포 Geo(p)\text{Geo}(p)기하 분포라고 한다. p(x)=p(1p)x1,x=1,2,3, p(x) = p (1 - p)^{x-1} \qquad , x = 1 , 2, 3, \cdots

첫번째 방법

전략: 등비 급수의 공식과 미분을 사용한다.

평균

E(X)=x=1xp(1p)x1 E(X)=\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-1 } } f(p):=x=0(1p)x\displaystyle f(p): =\sum _{ x=0 }^{ \infty }{ { (1-p) }^{ x } } 라 하면 f(p)=11(1p)=1p f(p)=\frac { 1 }{ 1-(1-p) }=\frac { 1 }{ p } pp 에 대해 미분하면 등비 급수 공식에 따라 f(p)=1p2 f '(p)=-\frac { 1 }{ { p }^{ 2 } } 한편 등비 급수를 그대로 미분하면 f(p)=x=1x(1p)x1 f ' (p)=\sum _{ x=1 }^{ \infty }{ {-x { (1-p) }^{ x-1 } } } 이기도 하므로 1p2=x=1x(1p)x1    1p=px=1x(1p)x1    1p=x=1xp(1p)x1=E(X) \begin{align*} & -\frac { 1 }{ { p }^{ 2 } }=-\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-1 } } \\ \implies& \frac { 1 }{ p }=p\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-1 } } \\ \implies& \frac { 1 }{ p }=\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-1 } }=E(X) \end{align*} 따라서 E(X)=1p\displaystyle E(X)=\frac { 1 }{ p }

분산

V(X)=E(X2)E(X)2=x=1x2p(1p)x11p2 V(X)=E({ X }^{ 2 })-{ {E(X)} }^{ 2 }=\sum _{ x=1 }^{ \infty }{ { x^ 2} { p { (1-p) }^{ x-1 } }-\frac { 1 }{ { p }^{ 2 } } } 따라서 E(X2)=x=1x2p(1p)x1\displaystyle E({ X }^{ 2 })=\sum _{ x=1 }^{ \infty }{ { x^2 }{ p { (1-p) }^{ x-1 } } } 만 구하면 된다.

마찬가지로 f(p):=x=0(1p)x\displaystyle f(p) :=\sum _{ x=0 }^{ \infty }{ { (1-p) }^{ x } }라 하면 f(p)=11(1p)=1pf(p)=1p2f(p)=2p3 f(p)=\frac { 1 }{ 1-(1-p) }=\frac { 1 }{ p } \\ f '(p) = - \frac { 1 }{ p^{2} } \\ f ''(p)=\frac { 2 }{ { p }^{ 3 } } 한편 f(p)=x=1x(x1)(1p)x2\displaystyle f ''(p)=\sum _{ x=1 }^{ \infty }{ x(x-1) { (1-p) }^{ x-2 } } 이기도 하므로 2p3=x=1x(x1)(1p)x2    2p3=x=1x2(1p)x2x=1x(1p)x2    p2p3=px=1x2(1p)x2px=1x(1p)x2    2p2=x=1x2p(1p)x2x=1xp(1p)x2    2p2=11px=1x2p(1p)x111px=1xp(1p)x1    2(1p)p2=E(X2)1p    E(X2)=2pp2 \begin{align*} & \frac { 2 }{ { p }^{ 3 } }=\sum _{ x=1 }^{ \infty }{ x(x-1) { (1-p) }^{ x-2 } } \\ \implies& \frac { 2 }{ { p }^{ 3 } }=\sum _{ x=1 }^{ \infty }{ { x^2 } { { (1-p) }^{ x-2 } }-\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-2 } } } \\ \implies& p\frac { 2 }{ { p }^{ 3 } }=p\sum _{ x=1 }^{ \infty }{ { x^2 } { { (1-p) }^{ x-2 } }-p\sum _{ x=1 }^{ \infty }{ x { (1-p) }^{ x-2 } } } \\ \implies& \frac { 2 }{ { p }^{ 2 } }=\sum _{ x=1 }^{ \infty }{ { x^2 } { p { (1-p) }^{ x-2 } }-\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-2 } } } \\ \implies& \frac { 2 }{ { p }^{ 2 } }=\frac { 1 }{ 1-p }\sum _{ x=1 }^{ \infty }{ { x^2 } { p { (1-p) }^{ x-1 } }-\frac { 1 }{ 1-p }\sum _{ x=1 }^{ \infty }{ xp { (1-p) }^{ x-1 } } } \\ \implies& \frac { 2(1-p) }{ { p }^{ 2 } }=E({ X }^{ 2 })-\frac { 1 }{ p } \\ \implies& E({ X }^{ 2 })=\frac { 2-p }{ { p }^{ 2 } } \end{align*} 따라서 V(X)=1pp2\displaystyle V(X)=\frac { 1-p }{ { p }^{ 2 } }

두번째 방법

전략: 기하 분포의 무기억성을 쓴다. 어떻게 보면 복잡한 수식을 피하고 말로 때우는 느낌이지만, 사람에 따라서는 오히려 어렵게 느낄 수도 있다.

평균

E(X)=1P( 첫번째 시행에서 성공 )+E(Y+1)P(첫번째 시행에서 실패) E(X)=1 \cdot P(\text{ 첫번째 시행에서 성공 })+E(Y+1)\cdot P( \text{첫번째 시행에서 실패}) 기댓값의 정의에 따라 첫번째 시행이 성공한 확률과 그 때의 시행횟수인 11, 첫번째 시행이 실패할 확률과 이 경우의 기댓값인 E(Y+1)E(Y+1) 의 곱을 더한 것이 기댓값 E(X)E(X) 가 된다. 물론 여기서 등장한 YYXX 와 마찬가지로 Geo(p)\text{Geo} (p) 를 따른다. 첫 번째에 성공했든 말든 기하 분포는 무기억성을 가지므로 처음부터 시작하고, YY11 을 따로 더해주는 보정을 거친 것이다. 다시 깔끔하게 적으면 다음과 같다. E(X)=1p+E(Y+1)(1p) E(X)=1\cdot p+E(Y+1)\cdot (1-p) 그런데 E(Y+1)E(Y+1)E(Y+1)=E(Y)+E(1)=E(Y)+1E(Y+1)=E(Y)+E(1)=E(Y)+1 으로 나타낼 수 있고, XGeo(p)X \sim \text{Geo} (p) 이고 YGeo(p)Y \sim \text{Geo} (p) 이므로 E(Y)=E(X) E(Y)=E(X) E(X)=p+E(X)+1(1p)\displaystyle E(X)=p+{E(X)+1}(1-p)E(X)E(X) 에 대해서 정리하면 E(X)=1p E(X)=\frac { 1 }{ p }

분산

E(X2)=1p+E((Y+1)2)(1p)=p+E(X2)+2E(X)+1(1p)=p+E(X2)+2E(X)+1pE(X2)2pE(X)p \begin{align*} E({ X }^{ 2 }) =& 1\cdot p+E({ (Y+1) }^{ 2 })\cdot (1-p) \\ &=p+{E({ X }^{ 2 })+2E(X)+1}(1-p) \\ &=p+E({ X }^{ 2 })+2E(X)+1-pE({ X }^{ 2 })-2pE(X)-p \end{align*} 깔끔하게 정리하면 0=2E(X)+1pE(X2)2pE(X) 0=2E(X)+1-pE({ X }^{ 2 })-2pE(X) 22차 적률을 이항하면 pE(X2)=2(1p)E(X)+1=2(1p)1p+1=2pp \begin{align*} pE({ X }^{ 2 }) =& 2(1-p)E(X)+1 \\ &=2(1-p)\frac { 1 }{ p }+1 \\ =& \frac { 2-p }{ p } \end{align*} 양변을 pp 로 나누면 E(X2)=2pp2 E({ X }^{ 2 })=\frac { 2-p }{ { p }^{ 2 } } 따라서 V(X)=1pp2\displaystyle V(X)=\frac { 1-p }{ { p }^{ 2 } }