ハルケ・ベラ検定
仮説検定
量的データ $\left\{ x_{i} \right\}_{i = 1}^{n}$ が与えられたとする。
- $H_{0}$: データ$\left\{ x_{i} \right\}_{i = 1}^{n}$は正規分布に従う。
- $H_{1}$: データ$\left\{ x_{i} \right\}_{i = 1}^{n}$は正規分布に従わない。
説明
ジャーク-ベラ検定は、正規性を検定するために使用される仮説検定で、通常、正規性の存在を示すために使用される。帰無仮説が採用されることが「分析者の意図」と一致する珍しいケースなので、仮説を正確に理解している必要がある。
シャピロ-ウィルク検定との違いは、歪度と尖度を使用して検定する点のみである。正規分布は、母歪度と母尖度が共に$0$であり、標本歪度$g_{1}$と標本尖度$g_{2}$に基づく検定統計量$JB$は、自由度$2$のカイ二乗分布に従う。
$$
JB := {{n g_{1}^2} \over {6}} + {{n g_{2}^2} \over {24}} \sim \chi^{2} (2)
$$
とはいえ、正規性検定だから、何を使っても特に差はないが、ジャーク-ベラ検定は、外れ値に敏感な歪度を使用するため、シャピロ-ウィルク検定に比べて外れ値を除去した際に正規分布であることがより多く示される。その理由からだと断言はできないが、通常は、回帰分析より時系列分析で正規性を証明するために使用される。実際に、Rではtseries
パッケージのjarque.bera.test()
関数でジャーク-ベラ検定を行う。
コード
実習
以下の二つのランダムサンプルを作成して、実際にジャーク-ベラ検定をやってみよう。
N
は正規分布から出たデータで、geo
は幾何分布から出たデータだ。
検定結果は正確に予想通りに現れる。
全体コード
以下はRの例コードだ。
library(tseries)
set.seed(150421)
N<-rnorm(100)
win.graph(4,4); hist(N)
jarque.bera.test(N)
geo<-rgeom(100,0.5)
win.graph(4,4); hist(geo)
jarque.bera.test(geo)