합동분산의 정의
📂수리통계학합동분산의 정의
빌드업
분포가 X∼(μ,σ2) 인 모집단에서 상호독립으로 뽑은 n개의 샘플들이 실제로는 m가지의 모집단 (μ1,σ12),⋯,(μm,σm2) 에서 n1,⋯,nm개씩 뽑힌 랜덤샘플들을 모아놓았다고 하자.
{X1}n1∼iid⋮{Xm}nm∼iid(μ1,σ12)(μm,σm2)
물론 전체 표본의 수는 n=∑i=1mni 이다. 한편 각각의 모집단에서는 iid를 가정해서 그 순서를 따지는 게 의미가 없으므로 Xk 와 같이 k 인덱스를 쓰면 모집단 전체에서 {Xk}k=1n∼(μ,σ2) 라 보고, i 인덱스를 쓰면 i번째 집단의 확률변수 Xi∼iid(μi,σi2) 라 나타내자. 이제 우리는 원래 큰 모집단의 모평균 μ 와 σ2 를 각각 모합동평균population pooled mean, 모합동분산population pooled variance이라 부를 것이다. 이 포스트의 궁극적인 목표는 단순히 ‘합동분산의 정의’를 살펴보는 게 아니라 그 불편추정량인 표본합동분산 Sp2 를 유도하는 것이다. 의외로 인터넷 상에서는 제대로된 증명을 해놓은 게시해둔 곳이 없으니, 당장 필요하지 않더라도 여기서 볼 수 있다는 사실을 기억해두도록 하자.
모합동평균
우선은 모합동평균과 항동분산이 각각의 모평균과 모분산들로 나타날 수 있는지 먼저 살펴보도록 하자. 평균과 분산의 정의에 따라, 모합동평균은
nμ====n1μ+⋯nmμk=1∑nEXki=1∑mniEXin1μ1+⋯nmμm
를 만족시키므로
μ=n1+⋯+nmn1μ1+⋯nmμm
와 같이 각 집단의 모평균들이 그 표본의 수를 가중치를 가지는 가중평균으로 나타난다.
모합동분산
모합동분산 역시 iid는 아니지만 Xk 들은 상호독립으로 샘플링되었으므로 독립일 때 분산의 선형성에 따라
nσ2======n1σ2+⋯nmσ2k=1∑nE(Xk−μ)2Ek=1∑n(Xk−μ)2Ei=1∑mniXi2−2Ei=1∑mniXiμi+i=1∑mniμi2Ei=1∑mni(Xi−μi)2n1σ12+⋯nmσm2
를 만족시키므로
σ=n1+⋯+nmn1σ12+⋯nmσm2
와 같이 각 집단의 모분산들이 그 표본의 수를 가중치로 가지는 가중평균으로 나타난다. 이제 표본이 등분산성homoscedasticity을 가지는 경우, 즉 모평균만 다르고 σ=σ1=⋯=σm 를 가정할 수 있을 때 불편추정량인 표본합동분산 Sp2 를 알아보자.
공식
표본합동분산
{X1}n1∼iid⋮{Xm}nm∼iid(μ1,σ2)(μm,σ2)
표본합동분산sample pooled variance Sp2 은 각 표본분산 S12,⋯,Sm2 들이 그 자유도를 가중치로 가지는 가중평균으로 나타난다.
Sp2:=(n1−1)+⋯+(nm−1)(n1−1)S12+⋯+(nm−1)Sm2=∑i=1m(ni−1)∑i=1m(ni−1)Si2
이렇게 정의된 표본합동분산 Sp2 는 모합동분산 σ2 의 불편추정량이다.
ESp2=σ2
유도
연립방정식
S12=Sm2=n1−11j=1∑n1(X1−X1)2⋮nm−11j=1∑nm(Xm−Xm)2
에서 다음을 얻는다. 여기서 j=1,⋯,ni 는 단순히 ni 을 반복하기 위한 인덱스로, 편의상 Xij1 와 Xij2 를 따로 쓰지는 않겠지만 이들이 독립이라는 점은 기억해야한다.
===i=1∑m(ni−1)Si2i=1∑mj=1∑nm(Xi−Xi)2i=1∑mj=1∑nm[(Xi−μi)+(μi−Xi)]2i=1∑mj=1∑nm[(Xi−μi)2−2(Xi−μi)(Xi−μi)+(Xi−μi)2]
이제 양변에 기대값을 취하기 전에 각 항에 대한 기대값이 어떻게 되는지 살펴보자.
공분산의 성질: 평균이 각각 μX, μY 인 확률 변수 X, Y 에 대해 Cov(X,Y):=E[(X−μX)(Y−μY)] 을 X 와 Y 의 공분산covariance이라고 정의한다. 공분산은 아래의 성질들을 가진다.
- [1]: Var(X)=Cov(X,X)
- [4]: Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)
- [5]: Cov(aX+b,cY+d)=acCov(X,Y)
가장 첫 항은 자명하게도 E(Xi−μi)2=σi2 다. Xi=∑jXi/ni 이고 iid, 즉 독립으로 뽑힌 Xij1⊥Xij2 이므로 일반성을 잃지 않고 어떤 j0∈{1,⋯,nm} 에 대해
=====E(Xi−μi)(Xi−μi)Cov(Xi,Xi)Cov(Xi,niXi)+j=j0∑Cov(Xij,niXij0)ni1Cov(Xi,Xi)+0ni1VarXini1σi2
이고 표본평균의 표준오차 공식에 따라
E(Xi−μi)2=ni1σi2
이므로 등분산성 σ=σ1=⋯=σm 을 가정하면
=====Ei=1∑m(ni−1)Si2i=1∑mj=1∑nmσi2−2i=1∑mj=1∑nmni1σi2+i=1∑mj=1∑nmni1σi2nσ2−i=1∑mσi2nσ2−mσ2(n−m)σ2i=1∑m(ni−1)σ2
이므로 최종적으로 다음을 얻는다.
ESp2=E∑i=1m(ni−1)∑i=1m(ni−1)Si2=σ2
■