평균 방향mean Directionμ∈R 과 집중concentrationκ>0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속확률분포vM(μ,κ) 를 폰 미제스 분포von Mises distribution라 한다.
f(x)=2πI0(κ)1exp(κcos(x−μ)),x∈R(mod2π)
폰 미제스 분포는 방향 통계학directional Statistics에서 접할 수 있는 가장 간단한 분포로써, 원 S1 위에서 샘플링되는 데이터를 표현한다. 원형정규분포circular Normal distribution 혹은 티호노프 분포tikhonov distribution라 불리기도 하는 모양이다.
수식에서 지수함수exp 에서 샘플링될 확률은 ∞ 에 가까울수록 높고 −∞ 에 가까울수록 낮아지며, 이는 cos(x−μ) 에 의해 자연스럽게 결정된다. x≈μ, 즉 평균 방향에 가까운 곳은 cos≈1 이 되어 많이 뽑히고 반대방향의 경우 아주 낮은 확률을 가지게 된다.
집중 κ 는 κ=1/σ2 와 같이 산포도의 반대되는 느낌으로써, 높을수록 평균 방향의 확률이 높아지게 된다.
폰 미제스 분포의 일반화로는 차원을 올린 폰 미제스-피셔 분포, 토러스로 확장한 이변량 폰 미제스 분포, 8개의 모수를 사용하는 폰 미제스-빙햄 분포fisher-Bingham distribution2, 거기서 다섯 개의 모수만 사용하는 켄트 분포 등이 알려져 있다.
정리
다음은 폰 미제스 분포가 왜 원형정규분포로 불리는 것이 타당한지에 대한 정리다. κ 가 충분히 크다는 가정은 그만큼 μ 에 가깝게 확률이 쏠려있는 것이고, S1 을 넓게 쓰지 않고 μ 근방에서만 뽑기 때문에 그 접선 상의 정규분포와 거의 유사해지는 것이다. 다른 표현으로는 LAN(Local Asymptotic Normality)이라고도 한다.
원형정규분포
충분히 큰 κ=σ−2 에 대해 f(x) 는 정규분포의 확률밀도함수에 근사한다.
f(x)≈σ2π1exp[2σ2−(x−μ)2]
한편 π=3.141592⋯ 는 κ=1 이라고 쳐도 표준정규분포의 z0.99=2.58⋯ 보다 훨씬 크기 때문에 κ 가 충분히 크다는 가정하에서는 I0(κ) 역시
2πI0(κ)==≈===∫−ππexp(κcos(x−μ))dx∫−ππexp(κcost)dt∫−∞∞exp(κ−2σ2t2)dteκ∫−∞∞exp(−2σ2t2)dtσ2πeκ∫−∞∞σ2π1exp(−2σ2t2)dtσ2πeκ
이므로 다음의 근사식을 얻는다.
f(x)≈σ2π1exp[2σ2−(x−μ)2]