logo

数理統計学における尖度 📂数理統計学

数理統計学における尖度

尖度

  1. 確率変数 $X$ の平均が $\mu$、分散が $\sigma^2$の場合、以下のように定義される $X$の尖度kurtosisは、 $$ \gamma_{2} := {{ E \left( X - \mu \right)^4 } \over { \sigma^4 }} $$
  2. データ $\left\{ X_{i} \right\}_{i}^{n}$ の標本平均が $\overline{X}$、標本分散が $\widehat{\sigma}^2$ の場合、標本尖度 $g_{2}$は以下のように求められる。 $$ g_{2} := \sum_{i=1}^{n} {{ \left( X - \overline{X} \right)^4 } \over { n \widehat{\sigma}^4 }} $$

正規分布基準

正規分布は、パラメータに関係なく尖度が $3$であり、これを基準としている。バイアスはあるが、$\left( \gamma_{2} - 3 \right)$や $\left( g_{2} - 3 \right)$を使うこともある。尖度をこのように定義すると、確率分布データが正規分布よりも太い尾か細い尾かを直感的に判断できる。

説明

尖度は4次のモーメントに基づいて計算され、確率変数の分布関数がどれだけ尖っているかを測る尺度だ。正規分布基準で正ならば鈍く、負ならば尖っている。

N.png

上のスクリーンショットは、正規分布 $N(0,1)$ の確率密度関数を描き、$1000$ 個のサンプルを取って計算したものだ。正規分布のモーメント尖度は$0$であり、実際にも $0$に近い値で計算された。

cauchy.png

上のスクリーンショットは、コーシー分布 $C(0,1)$の確率密度関数を描き、$1000$個のサンプルを取って計算したものだ。コーシー分布は平均も尖度も存在しないが、標本尖度はなんと $992$に近い値で計算された。正規分布の確率密度関数と比較すると、両側の尾がともに太く、上記の説明と一致することがわかる。

尖度は尾に関する尺度だ

尖度kurtosisの語源は、ギリシャ語のκυρτόςで、曲がったcurvedやアーチ型archingを意味し、尖度という訳も一見ピークの尖りを指すように見えるが、後の研究や直感から見てもその実際の値は「分布の尾がどれだけ太いか」により近い。

コード

説明に使われた図を作成するRコードだ。

set.seed(150421)
win.graph(6,4)
x<-rnorm(1000)
plot(dnorm,xlim=c(-3,3),ylim=c(0,0.4),
     main=paste0("N(0,1)의 첨도 : ",round(kurtosis(x),4)))
abline(h=0)
win.graph(6,4)
y<-rcauchy(1000)
plot(dcauchy,xlim=c(-3,3),ylim=c(0,0.4),
     main=paste0("C(0,1)의 첨도 : ",round(kurtosis(y),4)))
abline(h=0)