二変量フォンミーゼス分布
定義 1
ある行列$A \in \mathbb{R}^{2 \times 2}$に対する平均方向mean Direction$\mu, \nu \in \mathbb{R}$と集中concentration$\kappa_{1}, \kappa_{2} > 0$を有する連続確率分布$\text{vM}^{2} \left( \mu , \nu , \kappa_{1} , \kappa_{2} \right)$が、次に比例する確率密度関数を持つ場合、それを二変量フォンミーゼス分布bivariate von Mises distributionと呼ぶ。 $$ \exp \left[ \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) + \begin{bmatrix} \cos \left( \theta - \mu \right) & \sin \left( \theta - \mu \right) \end{bmatrix} A \begin{bmatrix} \cos \left( \phi - \nu \right) \\ \sin \left( \phi - \nu \right) \end{bmatrix} \right] $$ これを$A = \begin{bmatrix} \alpha & 0 \\ 0 & \beta \end{bmatrix}$の時に限定して単純化すると $$ \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &+ \alpha \cos \left( \theta - \mu \right) \cos \left( \phi - \nu \right) \\ &+ \beta \sin \left( \theta - \mu \right) \sin \left( \phi - \nu \right) \end{align*} \right] $$ 実用的な目的では、さらにパラメータを減らした以下のモデルが有名である。
サインモデル
$\alpha = 0$と$\beta = \lambda$で置いた場合、次の確率密度関数を持つ二変量フォンミーゼス分布を短くサインモデルsine modelと呼ぶ。 $$ f_{s} \left( \theta , \phi \right) := c \left( \kappa_{1} , \kappa_{2} \right) \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &+ \lambda \sin \left( \theta - \mu \right) \sin \left( \phi - \nu \right) \end{align*} \right] \qquad , \left( \theta , \phi \right) \in \left[ 0, 2 \pi \right]^{2} $$ ここで$c \left( \kappa_{1} , \kappa_{2} \right)$は次のように与えられる正規化定数である。 $$ c \left( \kappa_{1} , \kappa_{2} \right) := 4 \pi^{2} \sum_{m=1}^{\infty} \binom{2m}{m} \left( {{ \lambda^{2} } \over { 4 \kappa_{1} \kappa_{2} }} \right)^{m} I_{m} \left( \kappa_{1} \right) I_{m} \left( \kappa_{2} \right) $$
コサインモデル
$\alpha = \beta = - \kappa_{3}$を置き、$\min \left\{ \kappa_{1} , \kappa_{2} \right\} \ge \kappa_{3} \ge 0$を満たす場合、次の確率密度関数を持つ二変量フォンミーゼス分布を短くコサインモデルcosine modelと呼ぶ。 $$ f_{c} \left( \theta , \phi \right) := c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right) \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &- \kappa_{3} \cos \left( \theta - \mu - \phi + \nu \right) \end{align*} \right] \qquad , \left( \theta , \phi \right) \in \left[ 0, 2 \pi \right]^{2} $$ ここで$c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right)$は次のように与えられる正規化定数である。 $$ c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right) := 4 \pi^{2} \left[ I_{0} \left( \kappa_{1} \right) I_{0} \left( \kappa_{2} \right) I_{0} \left( \kappa_{3} \right) + 2 \sum_{p=1}^{\infty} I_{p} \left( \kappa_{1} \right) I_{p} \left( \kappa_{2} \right) I_{p} \left( \kappa_{3} \right) \right] $$
- $I_{\nu}$は$\nu$階の第一種変形ベッセル関数であり、このような複雑な関数が使われる理由については、方向統計学に第一種変形ベッセル関数が登場する理由のポストを参照してください。
説明 2
フォンミーゼス分布が単位円$S^{1}$での正規分布であるならば、二変量フォンミーゼス分布は、上記の図のようにトーラス$S^{1} \times S^{1}$での正規分布と見なすことができる。
ドーナツを研究して何をしようというのかと思うかもしれませんが、実際には、たんぱく質の分子構造やそれらがどのような角度で結合しているかなど、生物情報学のような分野の応用で同様のモチーフを見つけることができます。
Mardia. (2007). Bivariate von Mises densities for angular data with applications to protein bioinformatics. https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.575.3846 ↩︎
Boomsma. (2008). A generative, probabilistic model of local protein structure. https://doi.org/10.1073/pnas.0801715105 ↩︎