数理統計学における尖度
尖度
- 確率変数 の平均が 、分散が の場合、以下のように定義される の尖度kurtosisは、
- データ の標本平均が 、標本分散が の場合、標本尖度 は以下のように求められる。
正規分布基準
正規分布は、パラメータに関係なく尖度が であり、これを基準としている。バイアスはあるが、や を使うこともある。尖度をこのように定義すると、確率分布やデータが正規分布よりも太い尾か細い尾かを直感的に判断できる。
説明
尖度は4次のモーメントに基づいて計算され、確率変数の分布関数がどれだけ尖っているかを測る尺度だ。正規分布基準で正ならば鈍く、負ならば尖っている。
上のスクリーンショットは、正規分布 の確率密度関数を描き、 個のサンプルを取って計算したものだ。正規分布のモーメント尖度はであり、実際にも に近い値で計算された。
上のスクリーンショットは、コーシー分布 の確率密度関数を描き、個のサンプルを取って計算したものだ。コーシー分布は平均も尖度も存在しないが、標本尖度はなんと に近い値で計算された。正規分布の確率密度関数と比較すると、両側の尾がともに太く、上記の説明と一致することがわかる。
尖度は尾に関する尺度だ
尖度kurtosisの語源は、ギリシャ語のκυρτόςで、曲がったcurvedやアーチ型archingを意味し、尖度という訳も一見ピークの尖りを指すように見えるが、後の研究や直感から見てもその実際の値は「分布の尾がどれだけ太いか」により近い。
コード
説明に使われた図を作成するRコードだ。
set.seed(150421)
win.graph(6,4)
x<-rnorm(1000)
plot(dnorm,xlim=c(-3,3),ylim=c(0,0.4),
main=paste0("N(0,1)의 첨도 : ",round(kurtosis(x),4)))
abline(h=0)
win.graph(6,4)
y<-rcauchy(1000)
plot(dcauchy,xlim=c(-3,3),ylim=c(0,0.4),
main=paste0("C(0,1)의 첨도 : ",round(kurtosis(y),4)))
abline(h=0)