ワイブル分布
定義
スケールパラメータ$\lambda > 0$とシェイプパラメータ$k > 0$に関して、以下の確率密度関数を持つ確率分布をワイブル分布weibull distributionという。 $$ f(x) = {{ k } \over { \lambda }} \left( {{ x } \over { \lambda }} \right)^{k-1} e^{-(x/\lambda)^{k}} \qquad , x \ge 0 $$
定理
説明
確率密度関数の数式的表現からもわかるように、ワイブル分布は最も一般的に見られる指数分布の一般化と見ることができる。その応用は非常に多岐にわたるが、最も代表的なものは指数分布と同様の生存分析であり、ただし指数分布のように失敗率failure rateが一定ではなく、$k$によって変化すると見ることができる:
- $k<1$の場合、失敗率が時間とともに徐々に小さくなると見る。
- 特定の期間を過ぎると急激に低下する現象、例えば乳児死亡率をよく説明できるとされる。
- $k=1$の場合、失敗率が時間の経過とともに一定、つまり指数分布だ。
- $k>1$の場合、失敗率が時間とともに徐々に増加すると見る。
- 特にウイルスの潜伏期間や回復期間を推定する研究論文で頻繁に登場する。
三パラメータの一般化 1
スケールパラメータ$\alpha > 0$、ロケーションパラメータ$\beta > 0$、シェイプパラメータ$\gamma > 0$に関して、以下の確率密度関数を持つ確率分布を三パラメータワイブル分布three-parameter Weibull distributionという。 $$ f(x) = {{ \gamma } \over { \alpha }} \left( {{ x-\beta } \over { \alpha }} \right)^{\gamma-1} e^{- \left( (x - \beta) / \alpha \right)^{\gamma}} \qquad , x \ge \beta $$ もし$X \sim \text{Weibull} (\alpha, \beta, \gamma)$ならば、その平均と分散は以下の通りである。 $$ \begin{align*} E(X) =& \alpha \Gamma \left( 1 + {{ 1 } \over { \gamma }} \right) + \beta \\ \operatorname{Var} (X) =& \alpha^{2} \left[ \Gamma \left(1 + {{ 2 } \over { \gamma }} \right) - \left( \Gamma \left( 1 + {{ 1 } \over { \gamma }} \right)^{2} \right) \right] \end{align*} $$ もちろん、二つのパラメータに関して$X \sim \text{Weibull} (\lambda, k)$ならば、次のようになる。 $$ \begin{align*} E(X) =& \lambda \Gamma \left( 1 + {{ 1 } \over { k }} \right) \\ \operatorname{Var} (X) =& \lambda^{2} \left[ \Gamma \left(1 + {{ 2 } \over { k }} \right) - \left( \Gamma \left( 1 + {{ 1 } \over { k }} \right)^{2} \right) \right] \end{align*} $$
- ここで、$\Gamma$はガンマ関数だ。
Miller. (2006). A Derivation of the Pythagorean Won-Loss Formula in Baseball. https://arxiv.org/abs/math/0509698v4 ↩︎