혼합 분포
📂수리통계학혼합 분포
도입
아래 그림과 같은 확률밀도함수를 갖는 확률분포를 근사하고 싶다고 하자.

확률분포를 근사하는 기본적인 방법 중 하나는 근사하고자 하는 분포와 가장 닮은 정규분포를 찾는 것이다. 하지만 다음의 그림이 보여주듯이, 우리가 근사하고자하는 분포는 봉이 세 개이므로 정규분포로 이를 적절히 근사하는 것은 어려워보인다.

여기서 이렇게 생각해볼 수 있다. 정규분포는 하나의 봉을 갖고 있고, 우리가 근사하고자 하는 분포는 세 개의 봉을 갖고 있다. 그렇다면 세 개의 정규분포를 더하여 근사하고자 하는 분포를 근사할 수 있지 않을까? 이것이 바로 혼합 분포의 아이디어이다. 실제로 위의 확률밀도함수는 다음과 같다.
p(x)=21N(5,1)+41N(−4,1)+41N(0,1.5)

정의
쉬운 정의
확률분포들의 선형결합을 혼합 분포mixture distribution라고 한다.
엄밀한 정의
k개의 확률분포의 확률밀도함수가 각각 f1,…,fk라 하자. 혼합 계수mixing coefficient π1,…,πk에 대해서 다음의 확률밀도함수 f가 따르는 분포를 혼합분포mixture distribution라고 한다.
f(x)=π1f1(x)+⋯+πkfk(x)=i=1∑kπifi(x)(1)
설명
한편 f가 확률밀도함수가 되기 위해서는 πi들은 모두 더했을 때 1이 되어야 한다는 조건이 필요하다. 간단히 보이자면, (1)의 양변을 적분하면 다음을 얻는다.
∫f(x)dx=∫(i=1∑kπifi(x))dx=i=1∑kπi∫fi(x)dx=i=1∑kπi=1
⟹i=1∑kπi=1
또한 fi≥0이므로 각각의 πi는 πi∈[0,1]을 만족해야 한다.
한편 πi는 자연스럽게 확률, 가중치 등으로도 불릴 수 있다. 확률에 대한 해석은 문서 아래의 책임값 단원을 참고하자.
혼합 계수 | 혼합 확률 | 가중치 |
---|
mixing coefficients | mixing probabilites | weights |
πi | pi | wi |
i=1∑kπi=1 | i=1∑kpi=1 | i=1∑kwi=1 |
0≤πi≤1 | 0≤pi≤1 | 0≤wi≤1 |
누적분포함수
확률밀도함수 f에 대응되는 확률변수가 X라고 하면, X의 누적분포함수 FX는 다음과 같다.
FX(x)=i=1∑kπkFi(x)
이때 Fi는 fi에 대응되는는 누적분포함수이다.
기댓값
각각의 fi에 대응되는 확률변수를 Xi라 하자. Xi들의 평균이 μi=E[Xi]라 하자. X의 기댓값은 다음과 같다.
E[X]=∫xf(x)dx=∫xi=1∑kπifi(x)dx=i=1∑kπi∫xfi(x)dx=i=1∑kπiμi=μ
다시 말해 μ=E[X]는 μi들의 가중평균이다.
분산
X의 분산은 다음과 같다.
Var(X)=∫(x−μ)2f(x)dx=∫(x−μ)2i=1∑kπifi(x)dx=i=1∑kπi∫(x−μ)2fi(x)dx=i=1∑kπi∫[(x−μi)+(μi−μ)]2fi(x)dx=i=1∑kπi[∫(x−μi)2fi(x)dx+2(μi−μ)∫(x−μi)fi(x)dx+∫(μi−μ)2fi(x)dx]=i=1∑kπi∫(x−μi)2fi(x)dx+i=1∑kπi(μi−μ)2∫fi(x)dx
마지막 등호는 교차항에서 ∫(x−μi)fi(x)dx=0이 되므로 성립한다. 수식을 마저 정리하면 다음과 같다.
Var(X)=i=1∑kπiσi2+i=1∑kπi(μi−μ)2
이때 σi2는 Xi의 분산이다.
책임값
i=1∑kπi=1πi≥0∀i
πi가 만족해야하는 성질이 확률의 그것과 같기 때문에 이를 확률로 해석할 수 있고, 이 경우엔 혼합 확률mixing probability라 한다. f(i)=πi를 i번째 성분이 뽑힐 사전 확률밀도로 본다면, fi(x)를 다음과 같이 i가 주어졌을 때의 조건부 확률밀도로 볼 수 있다.
fi(x)=f(x∣i)
그러면 사후 확률밀도 f(i∣x)는 베이즈 정리에 따라 다음과 같으며 γi를 책임값responsibility이라고 한다.
γi(x)=f(i∣x)=j=1∑kf(j)f(x∣j)f(i)f(x∣i)=f(x)f(i)f(x∣i)