分数次ARIMAモデル (FARIMA)
モデル 1 2
ハースト指数を $H$ のように表す。ホワイトノイズ $e_{t}$ と バックシフト演算子 $B$ そして 差分階数level of differencing $d = H - 1/2$ に対して $$ \left( 1 - \sum_{i=1}^{p} \phi_{i} B^{i} \right) \left( 1 - B \right)^{d} Y_{t} = \left( 1 + \sum_{i=1}^{q} \theta_{i} B^{i} \right) e_{t} $$ のように定義される $\left\{ Y_{t} \right\}_{t \in \mathbb{N}}$ を $\left( p , d , q \right)$階の 分数階ARIMAモデルFractional ARIMA Model $\text{FARIMA} \left( p , d , q \right)$ と呼ぶ。
説明
ARIMAモデル: $$ \nabla^{d} Y_{t} := \sum_{i = 1}^{p} \phi_{i} \nabla^{d} Y_{t-i} + e_{t} - \sum_{i = 1}^{q} \theta_{i} e_{t-i} $$
二項級数: $$ \begin{align*} (1 + x )^{\alpha} =& \sum_{k=0}^{\infty} \binom{\alpha}{k} x^{k} \\ =& 1 + \alpha x + \dfrac{\alpha (\alpha-1)}{2!}x^{2} + \dfrac{\alpha (\alpha-1)(\alpha-2)}{3!}x^{3} + \cdots \end{align*} $$
分数階ARIMAモデルはそれ自体でARIMAモデルの一般化であり、$\nabla^{d} = \left( 1 - B \right)^{d}$ が 実数 $d \in \mathbb{R}$ に対して形式的な 級数展開 を適用する。 $$ \left( 1 - B \right)^{d} = 1 - d B + {\frac{ d (d-1) }{ 2! }} B^{2} - {\frac{ d (d-1) (d-2) }{ 3! }} B^{3} + \cdots $$
自己回帰過程 $\text{AR}(p)$ のパラメータ $p$ は $d$ による無限級数を近似するために決定され、定常性のための差分が問題となる場合に突破口となり得る。
当然と言えば当然だが、モデルの実際の実装は式が示すように、事実上多くの自己回帰項を含むことになる。分数階ARIMAモデルの利点は長期依存性に強いと言われるが、実際に長い時系列データを扱えばそうならざるを得ない。もちろん欠点はそれだけ計算量が増えることで、副次的にはモデルの解釈が難しくなる点だ。
Hosking, J. R. M. (1981). Fractional Differencing. Biometrika, 68(1), 165–176. https://doi.org/10.2307/2335817 ↩︎
Yantai Shu, Zhigang Jin, Lianfang Zhang, Lei Wang and O. W. W. Yang, “Traffic prediction using FARIMA models,” 1999 IEEE International Conference on Communications (Cat. No. 99CH36311), Vancouver, BC, 1999, pp. 891-895 vol.2, doi: https://doi.org/10.1109/ICC.1999.765402 ↩︎
