logo

パレート分布 📂確率分布論

パレート分布

定義 1

pdf.gif

スケールパラメータx0>0x_{0} > 0とシェイプパラメータα>0\alpha > 0の場合、以下の確率関数をパレート分布パワー法則、またはスケールフリー分布という。

  1. 連続型:定数x0p(x)dx=1\displaystyle \int_{x_{0}}^{\infty} p(x) dx = 1を満たすための定数CCについて p(x)=Cxα,x>x0 p(x) = C x^{-\alpha} \qquad , x > x_{0}
  2. 離散型:リーマンのゼータ関数ζ\zetaについて pk=1ζ(α)kα,kN p_{k} = {{ 1 } \over { \zeta (\alpha) }} k^{-\alpha} \qquad , k \in \mathbb{N}

基本的な性質

  • [1] モーメント生成関数:パレート分布のモーメント生成関数は存在しない。
  • [2] 平均と分散:XPareto(x0,α)X \sim \text{Pareto} \left( x_{0}, \alpha \right)の場合 E(X)=α1α2x0,α>2Var(X)=(α1)(α2)2(α3)x02,α>3 \begin{align*} E (X) =& {{ \alpha - 1 } \over { \alpha - 2 }} x_{0} & , \alpha > 2 \\ \Var (X) =& {{ (\alpha - 1) } \over { \left( \alpha -2 \right)^{2} (\alpha - 3) }} x_{0}^{2} & , \alpha > 3 \end{align*}

定理

  • [a] スケールフリー性:パレート分布は唯一のスケールフリー分布だ。つまり、すべてのbbについてある定数α\alphaが存在し、次が成立する。 p(bx)=g(b)p(x)    p(x)=p(1)xα p(bx) = g(b) p(x) \implies p(x) = p(1) x^{-\alpha}
  • [b] kk次のモーメント0<k<α10 < k < \alpha - 1の場合、kk次のモーメントが存在し EXk=α1α1kx0k E X^{k} = {{ \alpha - 1 } \over { \alpha - 1 - k }} x_{0}^{k}

説明

パレート分布はこの実際の世界に蔓延っている不平等を説明する代表的な分布で、次の概念と非常に密接な関係がある。

確率密度関数の形を見ると、シェイプα\alphaが大きいほど不平等が激しくなることが直感的に理解できる。経済的に言えば、富裕層はお金が無限にあり、貧しい人がたくさんいるということだ。

パレート分布がスケールフリー性を持つという話は、文字通りスケールがないということだ。例えば、ポアソン分布に従う2つの確率変数のパラメータがλ1=10\lambda_{1} = 10λ2=1000\lambda_{2} = 1000であれば、見る場所によって大きな違いがあるが、パレート分布はどこを見ても本質的に違いがないということだ。数学的にはbbがどのような値で与えられても結論が同じであることに相当する。

証明

[1]

確率変数のモーメント生成関数が存在することは、すべてのkNk \in \mathbb{N}に対してkk次のモーメントが存在することを意味する。しかし、定理[2]で示されたように、パレート分布11次のモーメントはα>1\alpha > 1の場合にのみ存在するので、モーメント生成関数は存在しえない。

[2]

戦略:モーメントの公式[b]を利用する。


EX1=α1α11x01=α1α2x01 \begin{align*} EX^{1} =& {{ \alpha - 1 } \over { \alpha - 1 - 1 }} x_{0}^{1} \\ =& {{ \alpha - 1 } \over { \alpha - 2 }} x_{0}^{1} \end{align*} であり、EX2=α1α3x02\displaystyle EX^{2} = {{ \alpha - 1 } \over { \alpha - 3 }} x_{0}^{2}なので VarX=α1α3x02[α1α2x01]2=[1α3α1(α2)2](α1)x02=[α24α+4α2+4α3](α1)(α3)(α2)2x02=(α1)(α2)2(α3)x02 \begin{align*} \Var X =& {{ \alpha - 1 } \over { \alpha - 3 }} x_{0}^{2} - \left[ {{ \alpha - 1 } \over { \alpha - 2 }} x_{0}^{1} \right]^{2} \\ =& \left[ {{ 1 } \over { \alpha - 3 }} - {{ \alpha - 1 } \over { \left( \alpha - 2 \right)^{2} }} \right] (\alpha - 1) x_{0}^{2} \\ =& \left[ \alpha^{2} - 4 \alpha + 4 - \alpha^{2} + 4 \alpha - 3 \right] {{ (\alpha - 1) } \over { (\alpha - 3) \left( \alpha -2 \right)^{2} }} x_{0}^{2} \\ =& {{ (\alpha - 1) } \over { \left( \alpha -2 \right)^{2} (\alpha - 3) }} x_{0}^{2} \end{align*}

[a]

すべてのbbに対してある関数ggが存在し p(bx)=g(b)p(x) p(bx) = g(b) p(x) が成立すると仮定する。x=1x = 1を代入してみるとp(b)=g(b)p(1)p(b) = g(b) p(1)であるため、g(b)=p(b)/p(1)g(b) = p(b) / p(1)であり p(bx)=p(b)p(x)p(1) p(bx) = {{ p(b) p(x) } \over { p(1) }} bbに対して微分してみると xp(bx)=p(b)p(x)p(1) x p '(bx) = {{ p ' (b) p(x) } \over { p(1) }} b=1b=1を代入してみると対数関数の微分法を用いたトリックにより2 xp(x)=p(1)p(x)p(1)    p(x)p(x)=p(1)p(1)1x    dlogp(x)dx=p(1)p(1)1x    dlogp(x)=p(1)p(1)1xdx \begin{align*} & x p '(x) = {{ p ' (1) p(x) } \over { p(1) }} \\ \implies & {{ p '(x) } \over { p(x) }} = {{ p '(1) } \over { p(1) }} \cdot {{ 1 } \over { x }} \\ \implies & {{ d \log p(x) } \over { dx }} = {{ p '(1) } \over { p(1) }} \cdot {{ 1 } \over { x }} \\ \implies & d \log p(x) = {{ p '(1) } \over { p(1) }} {{ 1 } \over { x }} dx \end{align*} これは、ある定数constant\text{constant}に対する単純な分離可能な1階微分方程式で、次を得る。 logp(x)=p(1)p(1)logx+constant \log p(x) = {{ p '(1) } \over { p(1) }} \log x + \text{constant} x=1x = 1を代入してみるとconstant=logp(1)\text{constant} = \log p(1)であることがわかる。α:=p(1)p(1)\displaystyle \alpha := - {{ p '(1) } \over { p(1) }}と定義すると、求めていた次の式を得る。 logp(x)=αlogx+logp(1)    logp(x)=logxα+logp(1)    logp(x)=logxαp(1)    p(x)=p(1)xα \begin{align*} & \log p(x) = - \alpha \log x + \log p(1) \\ \implies & \log p(x) = \log x^{-\alpha} + \log p(1) \\ \implies & \log p(x) = \log x^{-\alpha} p(1) \\ \implies & p(x) = p(1) x^{-\alpha} \end{align*}

[b]

0<α10 < \alpha -1であるので、x0Cxαdx=1\displaystyle \int_{x_{0}}^{\infty} C x^{-\alpha} dx = 1からC=(α1)x0α1C = \left( \alpha - 1 \right) x_{0}^{\alpha - 1}を得る。したがって、 EXk=x0xkCxαdx=Cx0xkαdx=(α1)x0α1[1kα+1xkα+1]x0=(α1)x0α1(01kα+1x0kα+1)=α1α1kx0k \begin{align*} E X^{k} =& \int_{x_{0}}^{\infty} x^{k} C x^{-\alpha} dx \\ =& C \int_{x_{0}}^{\infty} x^{k-\alpha} dx \\ =& \left( \alpha - 1 \right) x_{0}^{\alpha - 1} \left[ {{ 1 } \over { k - \alpha + 1 }} x^{k - \alpha + 1} \right]_{x_{0}}^{\infty} \\ =& \left( \alpha - 1 \right) x_{0}^{\alpha - 1} \left( 0 - {{ 1 } \over { k - \alpha + 1 }} x_{0}^{k - \alpha + 1} \right) \\ =& {{ \alpha - 1 } \over { \alpha - 1 - k }} x_{0}^{k} \end{align*}

可視化

次に、パレート分布の確率密度関数をGIFで表示するJuliaのコードです。

@time using LaTeXStrings
@time using Distributions
@time using Plots

cd(@__DIR__)

x = 1:0.1:10
A = collect(0.5:0.01:3.5); append!(A, reverse(A))

animation = @animate for α ∈ A
    plot(x, pdf.(Pareto(α), x),
     color = :black,
     label = "α = $(round(α, digits = 2))", size = (400,300))
    xlims!(0,5); ylims!(0,4); title!(L"\mathrm{pdf\,of\,Pareto}(\alpha)")
end
gif(animation, "pdf.gif")

  1. Newman. (2005). パワー則、パレート分布とジップの法則. https://doi.org/10.1080/00107510500052444 ↩︎

  2. https://math.stackexchange.com/a/391311 ↩︎