카테고리 분포
📂확률분포론카테고리 분포
정의
k(≥2)개의 범주가 있는 샘플공간 Ω={1,2,…,k}과 확률벡터 p=(p1,…,pk)가 주어졌을 때, 다음과 같은 확률질량함수를 가지는 이산확률분포를 카테고리 분포Categorical distribution라고 한다.
p(x=i)=pi,x∈{1,2,…,k}
설명
k개의 각 범주가 발생할 확률을 p=(p1,…,pk)로 표현한다. 따라서, p는 다음 조건을 만족해야 한다.
i=1∑kpi=1,pi≥0
베르누이 분포를 "동전 한 번 던지기"로 비유하면, 카테고리 분포는 "주사위 한 번 던지기"로 비유할 수 있다.
Ω={
,
,
,
,
,
}
p=(61,61,61,61,61,61)
다음과 같은 표기법이 쓰인다.
Cat(k;p1,…,pk)=Cat(k;p)
베르누이 분포에서 범주를 k로 일반화한 것으로 볼 수 있다. 여기서 시행횟수까지 n번으로 일반화하면 다항분포가 된다.
확률질량함수는 다음과 같이 쓸 수도 있다.
p(j)=i=1∏kpiδji=i=1∑kδjipi,j∈{1,2,…,k}
δji는 크로네커 델타이다.
한편 샘플 공간은 유클리드 공간의 표준기저로 볼 수 있고, 그러면 실현은 각각 원-핫 벡터로 볼 수 있다. 이 경우에는 다음을 만족하는 랜덤벡터 x=(x1,…,xk)와 확률질량함수에 대해 카테고리 분포를 Cat(x;p)와 같이 표기할 수 있다.
xi∈{0,1},i=1∑kxi=1
p(x)=p(x1,…,xk)=i=1∏kpixi