logo

数理統計学における歪度 📂数理統計学

数理統計学における歪度

定義

  1. 確率変数$X$の平均が$\mu$で、分散が$\sigma^2$だとする時、次のように定義された$\gamma_{1}$を$X$の歪度skewnessという。 $$ \gamma_{1} := {{ E \left( X - \mu \right)^3 } \over { \sigma^3 }} $$
  2. データ$\left\{ X_{i} \right\}_{i}^{n}$の標本平均が$\overline{X}$で、標本分散が$\widehat{\sigma}^2$だとする時、標本歪度$g_{1}$は次のように求まる。 $$ g_{1} := \sum_{i=1}^{n} {{ \left( X - \overline{X} \right)^3 } \over { n \widehat{\sigma}^3 }} $$

説明

歪度は3次モーメントで求まり、確率変数の分布関数がどのように偏っているかの尺度だ。正ならば右側に大きい値が多いことを意味し、負ならば左側に大きい値が多いことを意味する。

N.png

正規分布は歪度が$0$であり、実際に$1000$個のサンプルを取って確認しても$0$に近く求まることが分かる。計算自体はマイナスが出たけど、実際にヒストグラムを見ても左側に極端な値が集まっている。

Pois.png

上のヒストグラムはポアソン分布$\text{Pois}(5)$で$1000$個のサンプルを取って描いたものだ。実際にプラスで計算されたのは、それだけ極端な値が右側に多かったからだ。

set.seed(150421)
win.graph(6,4)
x<-rnorm(1000)
hist(x,main=paste0("N(0,1)의 왜도 : ",round(skewness(x),4)))
win.graph(6,4)
y<-rpois(1000,lambda=5)
hist(y,main=paste0("Pois(5)의 왜도 : ",round(skewness(y),4)))