logo

ダービン・ワトソン検定 📂統計的検定

ダービン・ワトソン検定

仮説検定

回帰分析を行った後、残差 $\left\{ e_{t} \right\}_{t=1}^{n}$ が与えられたとし、これを $e_{t} := \rho e_{t-1} + \nu_{t}$ の形で表す。

  • $H_{0}$: $\rho = 0$ つまり、残差の間に自己相関性はない。
  • $H_{1}$: $\rho \ne 0$ つまり、残差の間に自己相関性がある。

説明

経験的解釈

ダービン・ワトソン検定は、回帰分析後の残差の独立性を確認するために使用される検定であり、残差の間に自己相関性があるかどうかを判断する。検定統計量は $$ d := {{ \sum_{t=2}^{n} \left( e_{t} - e_{t-1} \right)^2 } \over {\sum_{t=1}^{n} e_{t}^{2} }} $$ のように計算され、常に $0 \le d \le 4$ を満たしている。 $d$ の値は次のように解釈される:

  • $d \approx 0$ : 残差は正の相関関係を持つ。
  • $d \approx 2$ : 残差は相関関係を持たない。
  • $d \approx 4$ : 残差は負の相関関係を持つ。

もちろん、検定を行う際には、有意水準 $\alpha$ が与えられ、下限 $d_{L , \alpha}$ と上限 $d_{U , \alpha}$ を計算して比較される。

注意事項

ダービン・ワトソン検定は見た目よりも使用が難しいテストで、注意事項は以下の通りである:

  1. $e_{t}$ と $e_{t-1}$ の相関関係のみを把握するが、$e_{t}$ と $e_{t-k}$ については分からない。複数の時差 $k$ を確認するには、一般化されたダービン・ワトソン検定を使用する必要がある。
  2. 残差の間に自己相関性がある場合、独立ではないが、自己相関性がないと独立とは限らない。
  3. ほとんど必要ない。ダービン・ワトソン検定が信頼できないわけではないが、1と2のような欠点があるため、正確であっても分析を正当化するのにあまり役に立たない。
  4. ARIMAモデルの残差には適用できない。したがって、自己相関関数またはリュング-ボックス検定を使用する必要がある。

これらの欠点があるにもかかわらず、テスト自体は使いやすく手軽なので、まだ多くの教科書で紹介されているし、使われている。欠点を簡潔にまとめると「使ってもいいけど、あまり信じないで」ということになる。特に、統計にまだ慣れていない学習者にとってはさらにそうだ。使用することはいいが、その目的と限界を正確に理解して使う必要がある。単にダービン・ワトソン検定を通過したからといって、簡単に独立性を証明できるわけではない。

コード

実習

Rでは、lmtestパッケージのdwtest()関数を使用して、ダービン・ワトソン検定を簡単に行うことができる。

Rplot.png

一見すると、残差は独立しているが、以下のように検定すると、実際に自己相関性がないことが確認できる。

20190730\_111316.png

全コード

library(lmtest)
 
out<-lm(waiting~eruptions,data=faithful)
win.graph(6,3); plot(rstudent(out),main="residuals")
dwtest(out)