数理統計学における歪度
定義
- 確率変数の平均がで、分散がだとする時、次のように定義されたをの歪度skewnessという。
- データの標本平均がで、標本分散がだとする時、標本歪度は次のように求まる。
説明
歪度は3次モーメントで求まり、確率変数の分布関数がどのように偏っているかの尺度だ。正ならば右側に大きい値が多いことを意味し、負ならば左側に大きい値が多いことを意味する。
正規分布は歪度がであり、実際に個のサンプルを取って確認してもに近く求まることが分かる。計算自体はマイナスが出たけど、実際にヒストグラムを見ても左側に極端な値が集まっている。
上のヒストグラムはポアソン分布で個のサンプルを取って描いたものだ。実際にプラスで計算されたのは、それだけ極端な値が右側に多かったからだ。
set.seed(150421)
win.graph(6,4)
x<-rnorm(1000)
hist(x,main=paste0("N(0,1)의 왜도 : ",round(skewness(x),4)))
win.graph(6,4)
y<-rpois(1000,lambda=5)
hist(y,main=paste0("Pois(5)의 왜도 : ",round(skewness(y),4)))