カテゴリ分布
📂確率分布論カテゴリ分布
定義
k(≥2)個のカテゴリーがあるサンプル空間Ω={1,2,…,k}と確率ベクトルp=(p1,…,pk)が与えられたとき、次のような確率質量関数を持つ離散確率分布をカテゴリ分布Categorical distributionと呼ぶ。
p(x=i)=pi,x∈{1,2,…,k}
説明
k個の各カテゴリーが発生する確率をp=(p1,…,pk)で表現する。したがって、pは次の条件を満たさなければならない。
i=1∑kpi=1,pi≥0
ベルヌーイ分布を「コインを一度投げる」と例えるならば、カテゴリ分布は「サイコロを一度投げる」と例えることができる。
Ω={
,
,
,
,
,
}
p=(61,61,61,61,61,61)
次のような表記法が用いられる。
Cat(k;p1,…,pk)=Cat(k;p)
ベルヌーイ分布からカテゴリーをkに一般化したものと見ることができる。ここで試行回数までn回に一般化すると多項分布になる。
確率質量関数は次のように書くこともできる。
p(j)=i=1∏kpiδji=i=1∑kδjipi,j∈{1,2,…,k}
δjiはクロネッカーのデルタである。
一方、サンプル空間はユークリッド空間の標準基底と見ることができ、その場合、実現はそれぞれワンホットベクトルとみなせる。この場合、次を満たすランダムベクトルx=(x1,…,xk)と確率質量関数に対してカテゴリ分布をCat(x;p)のように表記できる。
xi∈{0,1},i=1∑kxi=1
p(x)=p(x1,…,xk)=i=1∏kpixi