logo

数理統計学における歪度 📂数理統計学

数理統計学における歪度

定義

  1. 確率変数XXの平均がμ\muで、分散がσ2\sigma^2だとする時、次のように定義されたγ1\gamma_{1}XX歪度skewnessという。 γ1:=E(Xμ)3σ3 \gamma_{1} := {{ E \left( X - \mu \right)^3 } \over { \sigma^3 }}
  2. データ{Xi}in\left\{ X_{i} \right\}_{i}^{n}の標本平均がX\overline{X}で、標本分散がσ^2\widehat{\sigma}^2だとする時、標本歪度g1g_{1}は次のように求まる。 g1:=i=1n(XX)3nσ^3 g_{1} := \sum_{i=1}^{n} {{ \left( X - \overline{X} \right)^3 } \over { n \widehat{\sigma}^3 }}

説明

歪度は3次モーメントで求まり、確率変数の分布関数がどのように偏っているかの尺度だ。正ならば右側に大きい値が多いことを意味し、負ならば左側に大きい値が多いことを意味する。

N.png

正規分布は歪度が00であり、実際に10001000個のサンプルを取って確認しても00に近く求まることが分かる。計算自体はマイナスが出たけど、実際にヒストグラムを見ても左側に極端な値が集まっている。

Pois.png

上のヒストグラムはポアソン分布Pois(5)\text{Pois}(5)10001000個のサンプルを取って描いたものだ。実際にプラスで計算されたのは、それだけ極端な値が右側に多かったからだ。

set.seed(150421)
win.graph(6,4)
x<-rnorm(1000)
hist(x,main=paste0("N(0,1)의 왜도 : ",round(skewness(x),4)))
win.graph(6,4)
y<-rpois(1000,lambda=5)
hist(y,main=paste0("Pois(5)의 왜도 : ",round(skewness(y),4)))