logo

퍼시스턴트 모듈 📂위상데이터분석

퍼시스턴트 모듈

정의 1

20220710_132230.png

$R$ 이 이라고 하고 확장된 정수 집합 $\mathbb{Z}$을 $\overline{\mathbb{Z}} := \mathbb{Z} \cup \left\{ \pm \infty \right\}$ 이라 하자.

  1. 다음과 같이 체인컴플렉스 $\mathsf{C}_{\ast}^{i}$ 들 사이의 체인 맵chain map $f^{i} : \mathsf{C}_{\ast}^{i} \to \mathsf{C}_{\ast}^{i+1}$ 가 주어져 있을 때, $\mathcal{C} := \left\{ \left( \mathsf{C}_{\ast}^{i} , \partial_{i} , f^{i} \right) : i \ge 0 \right\}$ 을 퍼시스턴트 컴플렉스persistent Complex라 한다. $$ \mathsf{C}_{\ast}^{0} \overset{f^{0}}{\longrightarrow} \mathsf{C}_{\ast}^{1} \overset{f^{1}}{\longrightarrow} \mathsf{C}_{\ast}^{2} \overset{f^{2}}{\longrightarrow} \cdots $$
  2. $R$-모듈 $M^{i}$ 사이의 호모몰피즘 $\varphi^{i} : M^{i} \to M^{i+1}$ 가 주어져 있을 때, $\mathcal{M} := \left\{ \left( M^{i} , \varphi^{i} \right) : i \ge 0 \right\}$ 를 퍼시스턴트 모듈persistent Module이라 한다.
  3. 퍼시스턴트 컴플렉스 $\mathcal{C}$ 혹은 퍼시스턴트 모듈 $\mathcal{M}$ 의 각 컴포넌트 $\mathsf{C}_{\ast}^{i}$ 혹은 $M^{i}$ 들이 유한생성$R$-모듈이고 어떤 $m \in \mathbb{Z}$ 에 대해 모든 $f^{i}$ 혹은 $\varphi^{i}$ 이 $i \ge m$ 일 때 아이소멀피즘이면 $\mathcal{C}$ 혹은 $\mathcal{M}$ 이 유한 타입finite Type이라고 한다.
  4. $0 \le i \le j \in \overline{Z}$ 를 만족하는 구간 $(i,j)$ 를 $\mathcal{P}$-인터벌p-interval이라 한다.

설명

이게 뭔 병신같은 정의야?

위의 정의는 조모로디안zomorodian의 논문에서 발췌한 것으로, 보다시피 세 정의끼리 아무 상관이 없다. 필자가 그의 논문을 읽으면서 가장 난처했던게 이 부분이었다. 분명 이러한 정의가 잇달아 소개되므로 이들은 어떤 관련이 있어야할텐데, 아무리 봐도 그냥 정의들간에 관계가 없다. 퍼시스턴트 컴플렉스의 경우 퍼시스턴트persistent랑 전혀 상관이 없고, $\mathcal{P}$-인터벌에는 $\mathcal{P}$ 가 나오지도 않는다. 심지어 퍼시스턴트 모듈은 ‘모듈’이 아니라 ‘모듈의 패밀리’인데 그냥 모듈이라고 불리고 있다.

20220710_143709.png

여기서 이들 자체만의 의미에 집착하면 순도 100%의 정신병자가 된다.2 그 어떤 누군가가 나에게 ‘그거 실제로 아무 관계가 없다’고 한마디만 해줬더라면 더 많은 시간을 아끼고 수월하게 공부했을 것이다. 정의는 그냥 정의대로 받아들이고 정말 중요한 논의로 넘어가보자.

위상데이터분석

기본적으로 위상데이터분석topological Data Analysis에서는 필터드 컴플렉스에서 어떤 위상적 성질이 어떻게 지속성persistency를 가지는지에 관심을 가진다. 가령 비에토리스-립스 컴플렉스에서 반경 $\varepsilon > 0$ 을 증가 시키면서 여러개의 컴플렉스를 나열하는 식으로 필터드 컴플렉스를 이룬다면, 그에 따른 변화가 바로 $f^{i}$ 로 나타나게 되는 것이다. $\partial_{p}$ 은 필터드 컴플렉스와 관계없이 각각의 컴플렉스에 수반되어야하는 바운더리 맵이므로 이 맥락에선 신경꺼도 된다. 이는 직관적인 TDA의 과정을 수학적인 표현으로 옮겨놓은 것에 해당하며, 퍼시스턴트 모듈은 그 퍼시스턴트 컴플렉스들 중에 특히 우리가 다루기 쉬운 조건을 만족시키게끔 $\mathsf{C}_{\ast}^{i} = M^{i}$ 이며 $f^{i} = \varphi^{i}$ 인 경우를 상정하는 것이다. 이러한 맥락을 파악하고 읽어보면 저러한 정의의 소개도 별로 이상할 게 없다. 문제는 이렇게 좋은 조건을 준 퍼시스턴트 모듈 $\mathcal{M}$ 이라는 것도 여전히 다루기 까다롭다는건데, 여기서 혜성처럼 등급 모듈이 등장한다.

$\mathcal{M}$ 이 $R$ 상에서의 퍼시스턴트 모듈이라고 할 때, $R[t]$ 상에서 $$ \alpha \left( \mathcal{M} \right) := \bigoplus_{i=0}^{\infty} M^{i} $$ 이 되게끔 그룹액션 $$ t \cdot \left( m^{0} , m^{1} , m^{2} , \cdots \right) = \left( 0, \varphi^{0} \left( m^{0} \right) , \varphi^{1} \left( m^{1} \right) , \varphi^{2} \left( m^{2} \right) , \cdots \right) $$ 을 줄 수 있다. 쉽게 말해, $t$ 가 작용한다거나 곱해진다는 말은 $M^{i}$ 에서 $M^{i+1}$ 으로 원소를 진급시킨다는 말이다. 이러한 대응관계correspondence $\alpha$ 는 다음의 정리에 따라 퍼시스턴트 모듈의 문제를 등급 모듈의 문제로 옮겨준다.

가환대수학의 아틴-리스 이론artin-Rees Thoery in Commutative Algebra: 대응관계 $\alpha$ 는 $R$ 상에서의 유한 타입 퍼시스턴트 호몰로지의 카테고리와 $R[t]$ 상에서의 유한 생성 표준등급 모듈의 카테고리 사이의 카테고리 동치를 정의한다.

등급모듈은 말만 조금 복잡할 뿐 우리가 학부시절에 자주 다뤄왔던 다항식환에 지나지 않을 수 있고, 어쩌면 그보다 더 간단한 형태일지도 모른다. 여기까지의 빌드업들을 받아들일 수 있다면, 이제는 추상성에 절어있던 위상대수를 지나 호몰로지라는 것을 계산하는 알고리즘의 영역으로 나아갈 준비가 된 것이다. $$ Q (i,j) := \sum^{i} F[t] / \left( t^{j-i} \right) $$ 우리는 필드 $F$ 에 대해 등급환이자 PID인 $F[t]$ 를 $\mathcal{P}$-인터벌들의 집합 $\mathcal{S}$ 에 위와 같은 전단사 $Q$ 로 연관지을 것이다. 직관적인 예를 상상해보자면, 우리의 데이터가 $\varepsilon_{5} = 0.6$ 부터 $\varepsilon_{12} = 1.5$ 까지 $1$번째 베티 수가 $\beta_{1} = 2$ 였다고 한다면 어떤 방법을 통해 $$ Q (5,12) = \sum^{i} F[t] / \left( t^{12-5} \right) $$ 와 같은 관계를 찾은 것이며 베티 수로 설명되는 위상적 성질이 지속된 기간은 $1.5 - 0.6 = 0.9$ 이다. 명시적이지는 않지만, 이러한 스토리를 듣고보면 왜 퍼시스턴트 컴플렉스 등에 퍼시스턴트persistent라는 표현이 붙었는지 조금이나마 공감할 수 있게 된다.


  1. Zomorodian. (2005). Computing Persistent Homology: ch3 ↩︎

  2. 김케장. (2016). 포스트 급식충 https://kimkero.tistory.com/1211 ↩︎