베이불 분포
정의
스케일scale 파라미터 $\lambda > 0$ 와 쉐이프shape 파라미터 $k > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 확률분포를 베이불 분포weibull distribution라 한다. $$ f(x) = {{ k } \over { \lambda }} \left( {{ x } \over { \lambda }} \right)^{k-1} e^{-(x/\lambda)^{k}} \qquad , x \ge 0 $$
정리
설명
베이불 분포는 확률 밀도 함수의 수식적 표현에서 알 수 있듯 지수 분포의 일반화로 보는 시각이 가장 보편적이다. 그 응용은 무척 다양하지만 가장 대표적인 것은 지수 분포와 비슷하게 생존 분석이며, 시간에 관계없이 실패율failure rate가 일정한 지수 분포에서와 달리 $k$ 에 따라 바뀌는 것으로 볼 수 있다:
- $k<1$ 면 실패율이 시간이 흐름에 따라 점점 더 작아지는 것으로 본다.
- 영유아 사망infant Mortality과 같이 일정 시기를 지나면서 급격하게 떨어지는 현상을 잘 설명할 수 있다고 한다.
- $k=1$ 면 실패율이 시간이 흐르는 것에 무관한 상수, 즉 지수 분포다.
- $k>1$ 면 실패율이 시간이 흐름에 따라 점점 더 증가하는 것으로 본다.
- 감염병 연구, 특히 바이러스의 잠복기나 회복기간 등을 추정하는 논문 등에서 자주 등장한다.
세 모수 일반화 1
스케일scale 파라미터 $\alpha > 0$ 와 로케이션location 파라미터 $\beta > 0$ 와 쉐이프shape 파라미터 $\gamma > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 확률분포를 세 모수 베이불 분포three-parameter Weibull distribution라 한다. $$ f(x) = {{ \gamma } \over { \alpha }} \left( {{ x-\beta } \over { \alpha }} \right)^{\gamma-1} e^{- \left( (x - \beta) / \alpha \right)^{\gamma}} \qquad , x \ge \beta $$ 만약 $X \sim \text{Weibull} (\alpha, \beta, \gamma)$ 면 그 평균과 분산은 다음과 같다. $$ \begin{align*} E(X) =& \alpha \Gamma \left( 1 + {{ 1 } \over { \gamma }} \right) + \beta \\ \operatorname{Var} (X) =& \alpha^{2} \left[ \Gamma \left(1 + {{ 2 } \over { \gamma }} \right) - \left( \Gamma \left( 1 + {{ 1 } \over { \gamma }} \right)^{2} \right) \right] \end{align*} $$ 물론 두 모수에 대해 $X \sim \text{Weibull} (\lambda, k)$ 면 다음과 같다. $$ \begin{align*} E(X) =& \lambda \Gamma \left( 1 + {{ 1 } \over { k }} \right) \\ \operatorname{Var} (X) =& \lambda^{2} \left[ \Gamma \left(1 + {{ 2 } \over { k }} \right) - \left( \Gamma \left( 1 + {{ 1 } \over { k }} \right)^{2} \right) \right] \end{align*} $$
- 여기서 $\Gamma$ 는 감마 함수다.
Miller. (2006). A Derivation of the Pythagorean Won-Loss Formula in Baseball. https://arxiv.org/abs/math/0509698v4 ↩︎