logo

二変量フォンミーゼス分布 📂確率分布論

二変量フォンミーゼス分布

定義 1

ある行列$A \in \mathbb{R}^{2 \times 2}$に対する平均方向mean Direction$\mu, \nu \in \mathbb{R}$と集中concentration$\kappa_{1}, \kappa_{2} > 0$を有する連続確率分布$\text{vM}^{2} \left( \mu , \nu , \kappa_{1} , \kappa_{2} \right)$が、次に比例する確率密度関数を持つ場合、それを二変量フォンミーゼス分布bivariate von Mises distributionと呼ぶ。 $$ \exp \left[ \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) + \begin{bmatrix} \cos \left( \theta - \mu \right) & \sin \left( \theta - \mu \right) \end{bmatrix} A \begin{bmatrix} \cos \left( \phi - \nu \right) \\ \sin \left( \phi - \nu \right) \end{bmatrix} \right] $$ これを$A = \begin{bmatrix} \alpha & 0 \\ 0 & \beta \end{bmatrix}$の時に限定して単純化すると $$ \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &+ \alpha \cos \left( \theta - \mu \right) \cos \left( \phi - \nu \right) \\ &+ \beta \sin \left( \theta - \mu \right) \sin \left( \phi - \nu \right) \end{align*} \right] $$ 実用的な目的では、さらにパラメータを減らした以下のモデルが有名である。

サインモデル

$\alpha = 0$と$\beta = \lambda$で置いた場合、次の確率密度関数を持つ二変量フォンミーゼス分布を短くサインモデルsine modelと呼ぶ。 $$ f_{s} \left( \theta , \phi \right) := c \left( \kappa_{1} , \kappa_{2} \right) \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &+ \lambda \sin \left( \theta - \mu \right) \sin \left( \phi - \nu \right) \end{align*} \right] \qquad , \left( \theta , \phi \right) \in \left[ 0, 2 \pi \right]^{2} $$ ここで$c \left( \kappa_{1} , \kappa_{2} \right)$は次のように与えられる正規化定数である。 $$ c \left( \kappa_{1} , \kappa_{2} \right) := 4 \pi^{2} \sum_{m=1}^{\infty} \binom{2m}{m} \left( {{ \lambda^{2} } \over { 4 \kappa_{1} \kappa_{2} }} \right)^{m} I_{m} \left( \kappa_{1} \right) I_{m} \left( \kappa_{2} \right) $$

コサインモデル

$\alpha = \beta = - \kappa_{3}$を置き、$\min \left\{ \kappa_{1} , \kappa_{2} \right\} \ge \kappa_{3} \ge 0$を満たす場合、次の確率密度関数を持つ二変量フォンミーゼス分布を短くコサインモデルcosine modelと呼ぶ。 $$ f_{c} \left( \theta , \phi \right) := c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right) \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &- \kappa_{3} \cos \left( \theta - \mu - \phi + \nu \right) \end{align*} \right] \qquad , \left( \theta , \phi \right) \in \left[ 0, 2 \pi \right]^{2} $$ ここで$c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right)$は次のように与えられる正規化定数である。 $$ c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right) := 4 \pi^{2} \left[ I_{0} \left( \kappa_{1} \right) I_{0} \left( \kappa_{2} \right) I_{0} \left( \kappa_{3} \right) + 2 \sum_{p=1}^{\infty} I_{p} \left( \kappa_{1} \right) I_{p} \left( \kappa_{2} \right) I_{p} \left( \kappa_{3} \right) \right] $$


説明 2

zpq0160802340008.jpeg

フォンミーゼス分布単位円$S^{1}$での正規分布であるならば、二変量フォンミーゼス分布は、上記の図のようにトーラス$S^{1} \times S^{1}$での正規分布と見なすことができる。

ドーナツを研究して何をしようというのかと思うかもしれませんが、実際には、たんぱく質の分子構造やそれらがどのような角度で結合しているかなど、生物情報学のような分野の応用で同様のモチーフを見つけることができます。

zpq0160802340001.jpeg zpq0160802340006.jpeg zpq0160802340003.jpeg


  1. Mardia. (2007). Bivariate von Mises densities for angular data with applications to protein bioinformatics. https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.575.3846 ↩︎

  2. Boomsma. (2008). A generative, probabilistic model of local protein structure. https://doi.org/10.1073/pnas.0801715105 ↩︎