켄트 분포
정의 1
집중concentration $\kappa > 0$ 과 $\beta \in \mathbb{R}$, 평균mean $\gamma_{1} \in S^{p-1}$, 장축major Axis $\gamma_{2} \in S^{p-1}$, 단축minor Axis $\gamma_{3} \in S^{p-1}$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 다변량분포 $\text{FB}_{5} \left( \left( \gamma_{1} , \gamma_{2} , \gamma_{3} \right) , \kappa , \beta \right)$ 를 켄트 분포kent distribution라 한다. $$ f \left( \mathbf{x} \right) = {{ 1 } \over { c \left( \kappa , \nu \right) }} \exp \left( \kappa \gamma^{T} \mathbf{x} + \beta \left[ \left( \gamma_{2}^{T} \mathbf{x} \right)^{2} - \left( \gamma_{3}^{T} \mathbf{x} \right)^{2} \right] \right) \qquad , \mathbf{x} \in S^{p-1} $$
특히 $0 \le \beta < \kappa / 2$ 일 때 이 분포는 구면에서 계란형ovalness이고, $c \left( \kappa , \nu \right) > 0$ 는 다음과 같이 $\int_{S^{p-1}} f(\mathbf{x}) d \mathbf{x} = 1$ 이 되게끔 하는 노멀라이징 컨스턴트normalizing Constant다. $$ c \left( \kappa , \beta \right) = 2 \pi \sum_{j=0}^{\infty} {{ \Gamma \left( j + {{ 1 } \over { 2 }} \right) } \over { \Gamma \left( j+1 \right) }} \beta^{2j} \left( {{ 2 } \over { \kappa }} \right)^{2j + {{ 1 } \over { 2 }}} I_{2j + {{ 1 } \over { 2 }}} \left( \kappa \right) $$
- $S^{p-1} \subset \mathbb{R}^{p}$ 는 유닛 스피어다.
- $\gamma ^{T}$ 는 벡터 $\gamma$ 에 트랜스포즈를 취한 것이다.
- $\Gamma$ 는 감마함수다.
- $I_{\nu}$ 는 $\nu$차 변형 제1종 베셀 함수로써, 이러한 복잡한 함수가 쓰이는 이유는 변형 제1종 베셀 함수가 방향 통계학에 등장하는 이유 포스트를 참고하라.
설명
켄트 분포는 구면에서 타원형의 등고선contour를 그리는 다변량정규분포, 즉 자명하지 않은 공분산행렬이 주어진 것 같은 기하적 의미를 가진다. 언뜻 생각하기엔 그냥 평면에서 타원을 그려놓고 원으로 옮기면 그만일 것 같지만, 정의에서 소개된 것처럼 복잡한 수식으로 모델링하지 않으면 구면 위에서는 왜곡이 일어난다.
분포의 모수에서 정의되는 이심률eccentricity $2 \beta / \kappa$ 은 등고선이 얼마나 원과 다른지를 나타낸다.
Kasarapu. (2015). Modelling of directional data using Kent distributions. https://doi.org/10.48550/arXiv.1506.08105 ↩︎