logo

二変量フォンミーゼス分布 📂確率分布論

二変量フォンミーゼス分布

定義 1

ある行列AR2×2A \in \mathbb{R}^{2 \times 2}に対する平均方向mean Directionμ,νR\mu, \nu \in \mathbb{R}集中concentrationκ1,κ2>0\kappa_{1}, \kappa_{2} > 0を有する連続確率分布vM2(μ,ν,κ1,κ2)\text{vM}^{2} \left( \mu , \nu , \kappa_{1} , \kappa_{2} \right)が、次に比例する確率密度関数を持つ場合、それを二変量フォンミーゼス分布bivariate von Mises distributionと呼ぶ。 exp[κ1cos(θμ)+κ2cos(ϕν)+[cos(θμ)sin(θμ)]A[cos(ϕν)sin(ϕν)]] \exp \left[ \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) + \begin{bmatrix} \cos \left( \theta - \mu \right) & \sin \left( \theta - \mu \right) \end{bmatrix} A \begin{bmatrix} \cos \left( \phi - \nu \right) \\ \sin \left( \phi - \nu \right) \end{bmatrix} \right] これをA=[α00β]A = \begin{bmatrix} \alpha & 0 \\ 0 & \beta \end{bmatrix}の時に限定して単純化すると exp[κ1cos(θμ)+κ2cos(ϕν)+αcos(θμ)cos(ϕν)+βsin(θμ)sin(ϕν)] \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &+ \alpha \cos \left( \theta - \mu \right) \cos \left( \phi - \nu \right) \\ &+ \beta \sin \left( \theta - \mu \right) \sin \left( \phi - \nu \right) \end{align*} \right] 実用的な目的では、さらにパラメータを減らした以下のモデルが有名である。

サインモデル

α=0\alpha = 0β=λ\beta = \lambdaで置いた場合、次の確率密度関数を持つ二変量フォンミーゼス分布を短くサインモデルsine modelと呼ぶ。 fs(θ,ϕ):=c(κ1,κ2)exp[κ1cos(θμ)+κ2cos(ϕν)+λsin(θμ)sin(ϕν)],(θ,ϕ)[0,2π]2 f_{s} \left( \theta , \phi \right) := c \left( \kappa_{1} , \kappa_{2} \right) \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &+ \lambda \sin \left( \theta - \mu \right) \sin \left( \phi - \nu \right) \end{align*} \right] \qquad , \left( \theta , \phi \right) \in \left[ 0, 2 \pi \right]^{2} ここでc(κ1,κ2)c \left( \kappa_{1} , \kappa_{2} \right)は次のように与えられる正規化定数である。 c(κ1,κ2):=4π2m=1(2mm)(λ24κ1κ2)mIm(κ1)Im(κ2) c \left( \kappa_{1} , \kappa_{2} \right) := 4 \pi^{2} \sum_{m=1}^{\infty} \binom{2m}{m} \left( {{ \lambda^{2} } \over { 4 \kappa_{1} \kappa_{2} }} \right)^{m} I_{m} \left( \kappa_{1} \right) I_{m} \left( \kappa_{2} \right)

コサインモデル

α=β=κ3\alpha = \beta = - \kappa_{3}を置き、min{κ1,κ2}κ30\min \left\{ \kappa_{1} , \kappa_{2} \right\} \ge \kappa_{3} \ge 0を満たす場合、次の確率密度関数を持つ二変量フォンミーゼス分布を短くコサインモデルcosine modelと呼ぶ。 fc(θ,ϕ):=c(κ1,κ2,κ3)exp[κ1cos(θμ)+κ2cos(ϕν)κ3cos(θμϕ+ν)],(θ,ϕ)[0,2π]2 f_{c} \left( \theta , \phi \right) := c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right) \exp \left[ \begin{align*} & \kappa_{1} \cos \left( \theta - \mu \right) + \kappa_{2} \cos \left( \phi - \nu \right) \\ &- \kappa_{3} \cos \left( \theta - \mu - \phi + \nu \right) \end{align*} \right] \qquad , \left( \theta , \phi \right) \in \left[ 0, 2 \pi \right]^{2} ここでc(κ1,κ2,κ3)c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right)は次のように与えられる正規化定数である。 c(κ1,κ2,κ3):=4π2[I0(κ1)I0(κ2)I0(κ3)+2p=1Ip(κ1)Ip(κ2)Ip(κ3)] c \left( \kappa_{1} , \kappa_{2} , \kappa_{3} \right) := 4 \pi^{2} \left[ I_{0} \left( \kappa_{1} \right) I_{0} \left( \kappa_{2} \right) I_{0} \left( \kappa_{3} \right) + 2 \sum_{p=1}^{\infty} I_{p} \left( \kappa_{1} \right) I_{p} \left( \kappa_{2} \right) I_{p} \left( \kappa_{3} \right) \right]


説明 2

zpq0160802340008.jpeg

フォンミーゼス分布単位円S1S^{1}での正規分布であるならば、二変量フォンミーゼス分布は、上記の図のようにトーラスS1×S1S^{1} \times S^{1}での正規分布と見なすことができる。

ドーナツを研究して何をしようというのかと思うかもしれませんが、実際には、たんぱく質の分子構造やそれらがどのような角度で結合しているかなど、生物情報学のような分野の応用で同様のモチーフを見つけることができます。

zpq0160802340001.jpeg zpq0160802340006.jpeg zpq0160802340003.jpeg


  1. Mardia. (2007). Bivariate von Mises densities for angular data with applications to protein bioinformatics. https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.575.3846 ↩︎

  2. Boomsma. (2008). A generative, probabilistic model of local protein structure. https://doi.org/10.1073/pnas.0801715105 ↩︎