이항 분포의 평균과 분산

이항 분포의 평균과 분산

공식

$\displaystyle X \sim \text{Bin} (n,p)$ 면 $$ E(X)=np \\ \text{Var}(X)=npq $$


유도

전략: 조합을 직접 풀어헤친다. 식이 다소 더럽긴 하지만 고등학교 과정에서 충분히 소화할 수 있다. 한번쯤은 직접 해보도록 하자. 수리통계학을 접하면 조금 더 짧고 간단한 방법으로 증명할 수 있게 된다. 평균이든 분산이든 다음과 같은 이항 분포의 확률 질량 함수에서 시작한다.

이항 분포의 정의: $n \in \mathbb{N}$ 과 $p \in [0,1]$ 에 대해 다음과 같은 확률 질량 함수를 가지는 이산 확률 분포 $\text{Bin}(n,p)$ 를 이항 분포라고 한다. $$ p(x) = \binom{n}{x} p^{x} (1-p)^{n-x} \qquad , x= 0, 1 , \cdots , n $$

평균

이항 분포 $\text{Bin} (n,p)$ 의 확률 질량 함수는 $p( k ) = { _n {C} _k } p^{ k } (1-p)^{n-k}$ 이므로 $$ \displaystyle E(X)=\sum _{ k=0 }^{ n }{ k{ _n {C} _k }{ p ^ k }{ q ^ { n - k } } } $$ $\displaystyle k=0$ 일 때 $k{ _n {C} _k }{ p ^ k }{ q ^ { n - k } }=0$ 이므로 $$ \begin{align*} E(X) =& \sum _{ k=1 }^{ n }{ k{ _n {C} _k }{ p ^ k }{ q ^ { n - k } } } \\ =& \sum _{ k=1 }^{ n }{ k\frac { n! }{ (n-k)!k! }{ p ^ k }{ q ^ { n - k } } } \\ =& np\sum _{ k=1 }^{ n }{ \frac { (n-1)! }{ (n-k)!(k-1)! }{ p ^ { k - 1 } }{ q ^ { n - k } } } \end{align*} $$ 이때 $(n-1)=m, (k-1)=s$ 이라 하면 $$ \begin{align*} E(X) =& np\sum _{ s=0 }^{ m }{ \frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } } \\ =& np\cdot 1 \\ =& np \end{align*} $$

분산

분산의 성질에서 $\text{Var} (X)=E({ X ^ 2 })- { {E(X)} }^{ 2 } = E(X^{ 2 })- { (np) }^{ 2 }$ $$ \begin{align*} E({ X ^ 2 }) =& \sum _{ k=1 }^{ n }{ { k }^{ 2 } \frac { n! }{ (n-k)!k! }{ p ^ k }{ q ^ { n - k } } } \\ =& np\sum _{ k=1 }^{ n }{ k\frac { (n-1)! }{ (n-k)!(k-1)! }{ p ^ { k - 1 } }{ q ^ { n - k } } } \end{align*} $$ $\displaystyle (n-1)=m, (k-1)=s$ 이라 하면 $$ \begin{align*} E({ X ^ 2 }) =& np\sum _{ s=0 }^{ m }{ (s+1)\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } } \\ =& np\left( \sum _{ s=0 }^{ m }{ s\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } }+\sum _{ s=0 }^{ m }{ \frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } } \right) \\ =& np\left( \sum _{ s=0 }^{ m }{ s\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } }+ 1 \right) \end{align*} $$ $S \sim \text{Bin} (m,p)$ 의 기댓값은 $\displaystyle \sum _{ s=0 }^{ m }{ s\frac { m! }{ (m-s)!s! }{ p ^ s }{ q ^ { m - s } } }=mp$ 이므로 $$ \begin{align*} E({ X ^ 2 }) =& np(mp+1) \\ =& np{(n-1)p+1} \\ =& np(np-p+1) \\ =& np(np+q) \\ =& { (np) ^ 2 }+npq \end{align*} $$ 따라서 $$ \begin{align*} \text{Var} (X) =& E(X^{ 2 })-{ (np) ^ 2 } \\ =& { (np) ^ 2 }+npq-{ (np) ^ 2 } \\ =& npq \end{align*} $$

댓글