logo

골턴-왓슨 프로세스 📂확률론

골턴-왓슨 프로세스

정의 1

기초재생산률basic Reproductive rate $m = EX < \infty$ 인 확률변수 $X$ 가 주어져 있다고 하자. 브랜칭 프로세스의 $n$ 번째 세대generation의 $i$번째 파티클particle의 자손progency을 $X_{n,i}$ 라고 나타낸다면, 랜덤샘플 $\left\{ X_{n,i} : (n,i) \in \mathbb{N}^{2} \right\} \overset{\text{iid}}{\sim} X$ 에 대해 다음과 같이 나타나는 확률과정골턴-왓슨 프로세스galton-Watson process라 한다. $$ Z_{n+1} = \sum_{i=1}^{Z_{n}} X_{n,i} $$ $X$ 의 모평균 $m$ 이 $m=1$ 이면 크리티컬critical, $m > 1$ 이면 슈퍼크리티컬supercritical, $m > 1$ 이면 서브크리티컬subcritical이라 한다. 모든 파티클이 사라지는 경우, 즉 $Z_{n} = 0$ 이면 이를 멸종extinction이라고 부른다.

멸종 정리 1

$Z_{0} = N \in \mathbb{N}$ 이라 하고 확률생성함수 $f_{X}(s) = E s^{X} = \sum_{k=0}^{\infty} s^{k} P \left( X = k \right)$ 을 생각해보자.

  • 만약 슈퍼크리티컬이 아니면 궁극적으로 멸종ultimate Extinction한다. 다시 말해, 다음이 성립한다. $$ \lim_{n \to \infty} P \left( Z_{n} = 0 \right) = 0 $$
  • 만약 슈퍼크리티컬이면 $f(q) = q$ 를 만족하는 $q \in (0,1)$ 가 유일하게 존재하며, 멸종 확률은 다음과 같다. $$ \lim_{n \to \infty} P \left( Z_{n} = 0 \right) = q^{N} $$

설명

골턴-왓슨 프로세스는 수식적으로 가장 깔끔하면서, 역사상 가장 오래되었고, 가장 간단하며, 가장 유명한 브랜칭 프로세스기도 하다. 왓슨과 골턴은 특정 성surname의 확산에 대한 연구에서 처음으로 브랜칭 프로세스를 고안하고 응용했다.

정의에서 소개된 골턴-왓슨 프로세싱은 사실 심플simple한 경우만을 말하고 있다. 다시 말해 인구집단이 $X$ 로 한정되어 있는데, 이 종류를 늘리고 확률변수랜덤벡터로 바꿈으로써 멀티플 골턴-왓슨 프로세스로 일반화된다. 이를 통해 성별, 연령을 고려하거나 비결정론적인 SIR 모델 등을 구축할 수 있다.

멸종 정리에서 슈퍼크리티컬인 경우의 수식은 프리퀀티스트적으로 생각했을 때, 충분히 큰 $n$ 에 대해 $Z_{n}$ 의 실현 $z_{n}$ 을 얻어보면 대략 전체에서 $q^{N}\%$ 만큼이 멸종하고 나머지는 멸종하지 않은 것으로 간주할 수 있다. 물론 슈퍼크리티컬이 아니면 모두 결국에는 멸종한다. 가령 $q^{N} = 0.002$ 라면 $1000$ 번 시뮬레이션에서 두 번 정도 멸종한다고 기대할 수 있는 것이다.


  1. Kimmel, Axelrod. (2006). Branching Processes in Biology: p35. ↩︎ ↩︎