logo

감긴 분포 📂확률분포론

감긴 분포

도입1

실수 $\mathbb{R}$ 위의 확률변수 $X$가 있다고 하자. $X$의 값은 실수 전체에서 가능하지만, 실제로 그 의미에서 주기성을 갖는다고 하자. 예를 들어 각도의 값 자체는 어느 값이라도 가능하지만, $0^{\circ} = 360^{\circ} = 720^{\circ} = \cdots$의 주기성을 갖는다. (여기서 확률값이 아니라 확률 변수가 주기성을 갖는다는 점에 유의하자.) 이를 잘 표현하기 위해 도메인이 제한된 확률변수를 새로이 $\Theta$라 두면 아래와 같다.

$$ \theta = x \pmod{2\pi} \tag{1} $$

직관적으로 이는 실수공간 $\mathbb{R}$을 단위 원에 둘둘 감싸는 것과 같다. 무한히 긴 테이프에 확률밀도함수를 그려놓고, 그 것을 원통에 마는 것이다.

$\Theta$에서 $\theta$가 샘플링되었다면, $X$에서는 $\theta + 2\pi k$ ($k \in \mathbb{Z}$) 중에 하나가 샘플링된 것이다. 즉 $\Theta$에 대한 확률을 $P_{w}$라고 하면, $\Theta$가 $0$부터 $\theta$ 사이에서 샘플링될 확률은, 모든 $k$에 대해서 $X$가 $2\pi k$에서 $\theta + 2\pi k$ 사이에서 샘플링될 확률의 합과 같다. 수식으로 표현하면 다음과 같다.

$$ P_{w}([0, \theta]) = \sum_{k \in \mathbb{Z}} P([2\pi k, \theta + 2\pi k]) $$

여기서 $P$는 $X$에 대한 확률이다. 따라서 $\Theta$의 누적분포함수 $F_{w}$는, $X$의 누적분포함수 $F$에 대하여 다음과 같이 표현된다.

$$ F_{w}(\theta) = \sum_{k \in \mathbb{Z}} F(\theta + 2\pi k) - F(2\pi k) $$

그러면 확률밀도함수는 아래와 같다.

$$ f_{w}(\theta) = \sum_{k \in \mathbb{Z}} f(\theta + 2\pi k) $$

정의

실수 $\mathbb{R}$ 위의 확률변수 $X$에 대해서, $\Theta = X (\bmod 2\pi)$로 정의되는 확률변수 $\Theta$가 따르는 분포를 $X$의 감긴 분포wrapped distribution라고 한다. 감긴 분포의 확률밀도함수 $f_{w}$는 $X$의 확률밀도함수 $f$에 대하여 다음과 같이 표현된다.

$$ f_{w}(\theta) = \sum_{k \in \mathbb{Z}} f(\theta + 2\pi k) $$

설명

감긴분포를 시각적으로 나타내면 아래 움짤과 같다.

성질

(a) 매핑 $x \mapsto x_{w} = x (\bmod{2\pi})$에 대해서 다음이 성립한다. $$ (x + y)_{w} = x_{w} + y_{w} $$


  1. Kanti V. Mardia and Peter E. Jupp. Directional Statistics, p47-49. ↩︎