이항 분포의 평균과 분산
📂확률분포론이항 분포의 평균과 분산
공식
X∼Bin(n,p) 면
E(X)=npVar(X)=npq
- 여기서 q:=1−p 다.
유도
전략: 조합을 직접 풀어헤친다. 식이 다소 더럽긴 하지만 고등학교 과정에서 충분히 소화할 수 있다. 한번쯤은 직접 해보도록 하자. 수리통계학을 접하면 조금 더 짧고 간단한 방법으로 증명할 수 있게 된다. 평균이든 분산이든 다음과 같은 이항 분포의 확률 질량 함수에서 시작한다.
이항 분포의 정의: n∈N 과 p∈[0,1] 에 대해 다음과 같은 확률 질량 함수를 가지는 이산 확률 분포 Bin(n,p) 를 이항 분포라고 한다.
p(x)=(xn)px(1−p)n−x,x=0,1,⋯,n
평균
이항 분포 Bin(n,p) 의 확률 질량 함수는 p(k)=nCkpk(1−p)n−k 이므로
E(X)=k=0∑nknCkpkqn−k
k=0 일 때 knCkpkqn−k=0 이므로
E(X)===k=1∑nknCkpkqn−kk=1∑nk(n−k)!k!n!pkqn−knpk=1∑n(n−k)!(k−1)!(n−1)!pk−1qn−k
이때 (n−1)=m,(k−1)=s 이라 하면
E(X)===nps=0∑m(m−s)!s!m!psqm−snp⋅1np
■
분산
분산의 성질에서 Var(X)=E(X2)−E(X)2=E(X2)−(np)2
E(X2)==k=1∑nk2(n−k)!k!n!pkqn−knpk=1∑nk(n−k)!(k−1)!(n−1)!pk−1qn−k
(n−1)=m,(k−1)=s 이라 하면
E(X2)===nps=0∑m(s+1)(m−s)!s!m!psqm−snp(s=0∑ms(m−s)!s!m!psqm−s+s=0∑m(m−s)!s!m!psqm−s)np(s=0∑ms(m−s)!s!m!psqm−s+1)
S∼Bin(m,p) 의 기댓값은 s=0∑ms(m−s)!s!m!psqm−s=mp 이므로
E(X2)=====np(mp+1)np(n−1)p+1np(np−p+1)np(np+q)(np)2+npq
따라서
Var(X)===E(X2)−(np)2(np)2+npq−(np)2npq
■