한편 방향 통계학statistical은 일반적인 유클리드 공간이 아닌 어떤 매니폴드에서의 확률 분포와 통계적 추론 등을 연구하는 분야다. 이를테면 지구와 같은 구면을 대표하는 스피어와 2π-모듈로가 반영된 토러스 등에 놓인 데이터를 다루는데, 당장 공간정보통계학(구면)을 비롯해 분자 사이의 각도(토러스)에 응용될 수 있는 등 그 미래가 밝은 분과다. 그런데 여기서 등장하는 분포들은 어쩜 하나같이 다음처럼 기괴한 확률밀도함수들을 가진다.
fp(x;μ,κ):=(2κ)p/2−1Γ(p/2)Ip/2−1(κ)1exp(κμTx),x∈Sp−1
여기서 앞에 있는 복잡한 인수는 ∫Sp−1fdx=1 이 되게끔 정규화normalize해주는 상수로써, 수정된 제1종 베셀함수Iν 를 포함하고 있다. 이렇게 복잡한 함수가 쓰이는 이유는 간단하다.
해답
제1종 베셀 함수의 유도: ν∈R에 대해서, 아래와 같은 꼴의 미분방정식을 ν차 베셀 방정식이라 한다.
orx2y′′+xy′+(x2−ν2)yy′′+x1y′+(1−x2ν2)y=0=0베셀 방정식은 파동방정식을 구면좌표계에서 풀 때 등장하는 미분방정식이다. 계수는 상수가 아니고 독립 변수 x에 의존한다. 프로베니우스 메소드로 해를 구할 수 있고, 급수해는 다음과 같다.
Jν(x)J−ν(x)=n=0∑∞Γ(n+1)Γ(n+ν+1)(−1)n(2x)2n+ν=n=0∑∞Γ(n+1)Γ(n−ν+1)(−1)n(2x)2n−ν
베셀 함수가 어떻게 유도되는지를 살펴보면 미분방정식 중 하나인 베셀 방정식이니 그 해니 뭐니하는 어려운 표현이 등장한다. 그러나 위 인용에서 방향 통계학에 중요한 문장은 오직 하나다.
“베셀 방정식은 파동방정식을 구면좌표계에서 풀 때 등장하는 미분방정식이다.”
수리물리에서는 파동방정식이 어쩌고 하지만 우리에게 필요한 것은 오로지 ∫Sp−1fdx=1 뿐이다. 문제는 보통의 유클리드 공간과 달리 구면 위에서의 확률밀도함수값은 ‘중심에서 멀리 떨어지면서 0에 가까워지는’ 현상 자체가 없어서 적분 자체가 쉽지 않다는 것이다. 정규분포의 확률밀도함수가 원 S1 을 감으면서 덮고 있는 모양을 상상해보자.
위 그림에서 τ=1 일 때를 살펴보면, 정규분포의 무한히 긴 꼬리는 무한히 S1 을 돌며 무한히 0 이 아닌 두께를 더해가고 있다2. 이것은 원주율의 두 배인 2π 를 주기로 계속해서 반복되며, 이것이 바로 ‘구면 상에서의 파동’과 같은 모양을 가지고 있기 때문에 베셀 함수가 쓰일 수 있는 것이다.
Sungkyu Jung. “Geodesic projection of the von Mises–Fisher distribution for projection pursuit of directional data.” Electron. J. Statist. 15 (1) 984 - 1033, 2021. https://doi.org/10.1214/21-EJS1807↩︎