변형 제1종 베셀 함수가 방향 통계학에 등장하는 이유
빌드업
변형 베셀 함수
$$ J_{\nu}(x) = \sum \limits_{n=0}^{\infty} \frac{(-1)^{n} }{\Gamma (n+1) \Gamma (n+\nu+1)} \left(\frac{x}{2} \right)^{2n+\nu} $$
제1종 베셀 함수 $J_{\nu}$ 에 대해 다음과 같이 정의된 $I_{\nu}$ 를 변형 제1종 베셀함수라 한다1.
$$ \begin{align*} I_{\nu} (z) :=& i^{-\nu} J_{\nu} \left( iz \right) \\ =& \left( {{ z } \over { 2 }} \right)^{\nu} \sum_{k=0}^{\infty} {{ {{ z } \over { 2 }}^{2k} } \over { k! \Gamma \left( \nu + k + 1 \right) }} \\ =& {{ \left( {{ z } \over { 2 }} \right)^{\nu} } \over { \sqrt{\pi} \Gamma \left( \nu + {{ 1 } \over { 2 }} \right) }} \int_{-1}^{1} e^{zt} \left( 1 - t^{2} \right)^{\nu - {{ 1 } \over { 2 }}} dt \end{align*} $$
방향 통계
한편 방향 통계학statistical은 일반적인 유클리드 공간이 아닌 어떤 매니폴드에서의 확률 분포와 통계적 추론 등을 연구하는 분야다. 이를테면 지구와 같은 구면을 대표하는 스피어와 $2 \pi$-모듈로가 반영된 토러스 등에 놓인 데이터를 다루는데, 당장 공간정보통계학(구면)을 비롯해 분자 사이의 각도(토러스)에 응용될 수 있는 등 그 미래가 밝은 분과다. 그런데 여기서 등장하는 분포들은 어쩜 하나같이 다음처럼 기괴한 확률밀도함수들을 가진다. $$ f_{p} \left( \mathbf{x} ; \mu , \kappa \right) := \left( {{ \kappa } \over { 2 }} \right)^{p/2 - 1} {{ 1 } \over { \Gamma \left( p/2 \right) I_{p/2 - 1} \left( \kappa \right) }} \exp \left( \kappa \mu^{T} \mathbf{x} \right) \qquad , \mathbf{x} \in S^{p-1} $$ 여기서 앞에 있는 복잡한 인수는 $\int_{S^{p-1}} f d \mathbf{x} = 1$ 이 되게끔 정규화normalize해주는 상수로써, 수정된 제1종 베셀함수 $I_{\nu}$ 를 포함하고 있다. 이렇게 복잡한 함수가 쓰이는 이유는 간단하다.
해답
제1종 베셀 함수의 유도: $\nu \in \mathbb{R}$에 대해서, 아래와 같은 꼴의 미분방정식을 $\nu$차 베셀 방정식이라 한다. $$ \begin{align*} && x^{2} y^{\prime \prime} +xy^{\prime}+(x^{2}-\nu^{2})y &= 0 \\ \text{or} && y^{\prime \prime}+\frac{1}{x} y^{\prime} + \left( 1-\frac{\nu^{2}}{x^{2}} \right)y &= 0 \end{align*} $$ 베셀 방정식은 파동방정식을 구면좌표계에서 풀 때 등장하는 미분방정식이다. 계수는 상수가 아니고 독립 변수 $x$에 의존한다. 프로베니우스 메소드로 해를 구할 수 있고, 급수해는 다음과 같다. $$ \begin{align*} J_{\nu}(x) &= \sum \limits_{n=0}^{\infty} \frac{(-1)^{n} }{\Gamma (n+1) \Gamma (n+\nu+1)} \left(\frac{x}{2} \right)^{2n+\nu} \\ J_{-\nu}(x) & =\sum \limits_{n=0}^{\infty}\frac{(-1)^{n}}{\Gamma (n+1)\Gamma (n-\nu+1)} \left( \frac{x}{2} \right)^{2n-\nu} \end{align*} $$
베셀 함수가 어떻게 유도되는지를 살펴보면 미분방정식 중 하나인 베셀 방정식이니 그 해니 뭐니하는 어려운 표현이 등장한다. 그러나 위 인용에서 방향 통계학에 중요한 문장은 오직 하나다.
“베셀 방정식은 파동방정식을 구면좌표계에서 풀 때 등장하는 미분방정식이다.”
수리물리에서는 파동방정식이 어쩌고 하지만 우리에게 필요한 것은 오로지 $\int_{S^{p-1}} f d \mathbf{x} = 1$ 뿐이다. 문제는 보통의 유클리드 공간과 달리 구면 위에서의 확률밀도함수값은 ‘중심에서 멀리 떨어지면서 $0$에 가까워지는’ 현상 자체가 없어서 적분 자체가 쉽지 않다는 것이다. 정규분포의 확률밀도함수가 원 $S^{1}$ 을 감으면서 덮고 있는 모양을 상상해보자.
위 그림에서 $\tau = 1$ 일 때를 살펴보면, 정규분포의 무한히 긴 꼬리는 무한히 $S^{1}$ 을 돌며 무한히 $0$ 이 아닌 두께를 더해가고 있다2. 이것은 원주율의 두 배인 $2 \pi$ 를 주기로 계속해서 반복되며, 이것이 바로 ‘구면 상에서의 파동’과 같은 모양을 가지고 있기 때문에 베셀 함수가 쓰일 수 있는 것이다.
Sungkyu Jung. “Geodesic projection of the von Mises–Fisher distribution for projection pursuit of directional data.” Electron. J. Statist. 15 (1) 984 - 1033, 2021. https://doi.org/10.1214/21-EJS1807 ↩︎
Straub, J. (2017). Bayesian Inference with the von-Mises-Fisher Distribution in 3D. https://www.semanticscholar.org/paper/Bayesian-Inference-with-the-von-Mises-Fisher-in-3-D-Straub/26d5bb31153df418388b6eb242b2d8842c039c2d#extracted ↩︎