logo

カテゴリ分布 📂確率分布論

カテゴリ分布

定義1

k(2)k (\ge 2)個のカテゴリーがあるサンプル空間Ω={1,2,,k}\Omega = \left\{ 1, 2, \dots, k \right\}と確率ベクトルp=(p1,,pk)\mathbf{p} = (p_{1}, \dots, p_{k})が与えられたとき、次のような確率質量関数を持つ離散確率分布カテゴリ分布Categorical distributionと呼ぶ。

p(x=i)=pi,x{1,2,,k} p(x = i) = p_{i}, \qquad x \in \left\{ 1, 2, \dots, k \right\}

説明

kk個の各カテゴリーが発生する確率をp=(p1,,pk)\mathbf{p} = (p_{1}, \dots, p_{k})で表現する。したがって、p\mathbf{p}は次の条件を満たさなければならない。

i=1kpi=1,pi0 \sum_{i=1}^{k} p_{i} = 1, \qquad p_{i} \ge 0

ベルヌーイ分布を「コインを一度投げる」と例えるならば、カテゴリ分布は「サイコロを一度投げる」と例えることができる。

Ω={\Omega = \Big\{ ,,,,, \includegraphics[height=2em]{https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FrbQJE%2FbtsMXyblpbo%2FZMTO1PeHbafLH3g97P0q41%2Fimg.png}, \includegraphics[height=2em]{https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FxAbA3%2FbtsMW8KMCtK%2FodmS8gakkTAp7dP2Lk6JO0%2Fimg.png}, \includegraphics[height=2em]{https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcgXAjB%2FbtsMYNLR5E3%2FIED729aUwdNa093xix0sz1%2Fimg.png}, \includegraphics[height=2em]{https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdITnZE%2FbtsMX1qB6Eo%2FLh1bDQ0SkBl4k0PVHtjZDK%2Fimg.png}, \includegraphics[height=2em]{https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FnR6Ka%2FbtsMW7kMTqC%2FM4VQF9U2wgbCfcRKfE1KdK%2Fimg.png}, \includegraphics[height=2em]{https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fcsx5aP%2FbtsMXPKIgHh%2FbnXAmN8iHjFOwzhyjtcdTK%2Fimg.png} }\Big\}

p=(16,16,16,16,16,16) \mathbf{p} = \left( \dfrac{1}{6}, \dfrac{1}{6}, \dfrac{1}{6}, \dfrac{1}{6}, \dfrac{1}{6}, \dfrac{1}{6} \right)

次のような表記法が用いられる。

Cat(k;p1,,pk)=Cat(k;p) \operatorname{Cat}(k; p_{1}, \dots, p_{k}) = \operatorname{Cat}(k; \mathbf{p})

ベルヌーイ分布からカテゴリーをkkに一般化したものと見ることができる。ここで試行回数までnn回に一般化すると多項分布になる。

カテゴリー 試行回数
11nn
22ベルヌーイ分布二項分布
kkカテゴリ分布多項分布

確率質量関数は次のように書くこともできる。

p(j)=i=1kpiδji=i=1kδjipi,j{1,2,,k} p(j) = \prod\limits_{i=1}^{k} p_{i}^{\delta_{ji}} = \sum\limits_{i=1}^{k} \delta_{ji} p_{i}, \qquad j \in \left\{ 1, 2, \dots, k \right\}

δji\delta_{ji}クロネッカーのデルタである。

一方、サンプル空間はユークリッド空間の標準基底と見ることができ、その場合、実現はそれぞれワンホットベクトルとみなせる。この場合、次を満たすランダムベクトルx=(x1,,xk)\mathbf{x} = (x_{1}, \dots, x_{k})と確率質量関数に対してカテゴリ分布をCat(x;p)\operatorname{Cat}(\mathbf{x}; \mathbf{p})のように表記できる。

xi{0,1},i=1kxi=1 x_{i} \in \left\{ 0, 1 \right\}, \qquad \sum_{i=1}^{k} x_{i} = 1

p(x)=p(x1,,xk)=i=1kpixi p(\mathbf{x}) = p(x_{1}, \dots, x_{k}) = \prod\limits_{i=1}^{k} p_{i}^{x_{i}}