logo

時系列分析における変換 📂統計的分析

時系列分析における変換

ビルドアップ

時系列では、時間が経つにつれて分散が大きくなる場合、それに伴う「ペナルティ」を与えて分散を一定にし、定常性を得るために変換が必要である。ルート$\sqrt{}$やログ$\log$は、値が大きいほど減少する量が多いためよく使用される。当然だが、分散が減少する場合は、データの傾向がある点に収束するという意味になるので、変換する前に時系列分析は不要である。

テスト 1

ボックス・カックス変換: $$g(x) := \begin{cases} \displaystyle {{ x^{\lambda} - 1 } \over { \lambda }} & , \lambda \ne 0 \\ \log x & , \lambda = 0 \end{cases}$$

見た目だけで変換を取るべきか、どんな変換を取るべきか自信が持てないときは、通常ボックス・カックス変換の仮説検定を使用し、逆になぜこれ以上の変換を取る必要がないのかを正当化するのにも使える。

実践

組み込みデータUKgasを読み込んでみよう。

20190303\_121926.png

UKgas.png

UKgasはイギリスのガス消費量を四半期ごとに記録したデータであり、見ての通り、年が経つにつれて変動がさらに激しくなることが分かる。分散が一定でない場合、スムーズな分析が難しい。したがって、ログのような変換を行い、データを扱いやすくすることが必要だ。

20190303\_121915.png

logUKgas.png

変換を取ると、完璧ではないが、明らかに分散が一定になったことが分かる。

コード

以下は例示コードである。

UKgas
win.graph(4,4); plot(UKgas,main='UKgas')
log(UKgas)
win.graph(4,4); plot(log(UKgas),main='log(UKgas)')

一緒に見よう


  1. Cryer. (2008). Time Series Analysis: With Applications in R(2nd Edition): p101. ↩︎