음이항 분포의 평균과 분산
공식
$X \sim \text{NB}(r, p)$ 면 $$ E(X) = {{ r (1-p) } \over { p }} \\ \operatorname{Var}(X) = {{ r (1-p) } \over { p^{2} }} $$
증명
전략: 음이항 분포가 기하 분포의 일반화라는 점을 이용한다.
- [b] 기하분포의 일반화: $Y = X_{1} + \cdots + X_{r}$ 이고 $X_{i} \overset{\text{iid}}{\sim} \text{Geo}(p)$ 면 $Y \sim \text{NB}(r,p)$
이 때 기하 분포의 정의는 음이항 분포와 마찬가지로 그 서포트가 $\mathcal{S} = \left\{ 0 , 1 , 2, \cdots \right\}$ 와 같이 되도록 둔다.
기하 분포의 평균과 분산: $X \sim \text{Geo} (p)$ 면 $$ E(X) = {{ 1-p } \over { p }} \\ \operatorname{Var}(X) = {{ 1-p } \over { p^{2} }} $$
평균
$Y=X_1+X_2+\cdots+X_r$ 이므로 $$ \begin{align*} E(Y) =& E(X_1)+E(X_2)+\cdots+E(X_r) \\ =& \sum_{i=1}^{r} E(X_i) \\ =& { {r(1-p)} \over p } \end{align*} $$ $Y \sim \text{NB} (r,p)$ 이므로 $\displaystyle E(Y) = { {r(1-p)} \over p }$
■
분산
$Y=X_1+X_2+\cdots+X_r$ 이고 $X_1, X_2, \cdots , X_r$ 이 상호 독립이므로 공분산은 $0$ 이다. $$ \begin{align*} Var(Y) =& Var(X_1)+Var(X_2)+\cdots+Var(X_r) \\ =& \sum_{i=1}^{r} Var(X_i) \\ =& \frac { r(1-p) }{ { p }^{ 2 } } \end{align*} $$ $Y \sim \text{NB} (r,p)$ 이므로 $\displaystyle Var(Y) = \frac { r(1-p) }{ { p }^{ 2 } }$
■