logo

数理統計学における尖度 📂数理統計学

数理統計学における尖度

尖度

  1. 確率変数 XX の平均が μ\mu、分散が σ2\sigma^2の場合、以下のように定義される XX尖度kurtosisは、 γ2:=E(Xμ)4σ4 \gamma_{2} := {{ E \left( X - \mu \right)^4 } \over { \sigma^4 }}
  2. データ {Xi}in\left\{ X_{i} \right\}_{i}^{n} の標本平均が X\overline{X}、標本分散が σ^2\widehat{\sigma}^2 の場合、標本尖度 g2g_{2}は以下のように求められる。 g2:=i=1n(XX)4nσ^4 g_{2} := \sum_{i=1}^{n} {{ \left( X - \overline{X} \right)^4 } \over { n \widehat{\sigma}^4 }}

正規分布基準

正規分布は、パラメータに関係なく尖度が 33であり、これを基準としている。バイアスはあるが、(γ23)\left( \gamma_{2} - 3 \right)(g23)\left( g_{2} - 3 \right)を使うこともある。尖度をこのように定義すると、確率分布データが正規分布よりも太い尾か細い尾かを直感的に判断できる。

説明

尖度は4次のモーメントに基づいて計算され、確率変数の分布関数がどれだけ尖っているかを測る尺度だ。正規分布基準で正ならば鈍く、負ならば尖っている。

N.png

上のスクリーンショットは、正規分布 N(0,1)N(0,1) の確率密度関数を描き、10001000 個のサンプルを取って計算したものだ。正規分布のモーメント尖度は00であり、実際にも 00に近い値で計算された。

cauchy.png

上のスクリーンショットは、コーシー分布 C(0,1)C(0,1)の確率密度関数を描き、10001000個のサンプルを取って計算したものだ。コーシー分布は平均も尖度も存在しないが、標本尖度はなんと 992992に近い値で計算された。正規分布の確率密度関数と比較すると、両側の尾がともに太く、上記の説明と一致することがわかる。

尖度は尾に関する尺度だ

尖度kurtosisの語源は、ギリシャ語のκυρτόςで、曲がったcurvedやアーチ型archingを意味し、尖度という訳も一見ピークの尖りを指すように見えるが、後の研究や直感から見てもその実際の値は「分布の尾がどれだけ太いか」により近い。

コード

説明に使われた図を作成するRコードだ。

set.seed(150421)
win.graph(6,4)
x<-rnorm(1000)
plot(dnorm,xlim=c(-3,3),ylim=c(0,0.4),
     main=paste0("N(0,1)의 첨도 : ",round(kurtosis(x),4)))
abline(h=0)
win.graph(6,4)
y<-rcauchy(1000)
plot(dcauchy,xlim=c(-3,3),ylim=c(0,0.4),
     main=paste0("C(0,1)의 첨도 : ",round(kurtosis(y),4)))
abline(h=0)