状態空間モデル：(1)基本概念 - 統計学入門一歩先へ

はじめに

時系列的に変化するような現象に対する統計手法として、状態空間モデルと呼ばれる方法がある。状態空間モデルは広く応用可能な柔軟な方法であり、規則性のない複雑な構造の時系列データに対しても用いることができるとされている。今回はモデルの基本概念を整理していく。

状態空間モデル

簡単に言うと、時間にともなって変化する現象の背後には観測不可能な「状態」があるものとし、実際に観測されるデータはその状態の不正確な観測値（誤差、あるいはノイズが乗ったもの）と考えるのが状態空間モデルの発想である。
このモデルでは、
(1)状態の時系列がマルコフ連鎖であるとし、前の時間の状態に依存して現在の状態が決定されることを表現する。つまり、状態の時系列ベクトルを $\theta_t (t = 0, 1, ...)$ とすると、時点 $t$ の条件付き確率密度は

$\displaystyle p(\theta_t | \theta_{1:t-1}) = p(\theta_t | \theta_{t-1})$

と表され、時点 $t$ の状態に関して、時点 $t-1$ までのすべての状態によってもたらされる情報と、時点 $t-1$ だけによってもたらされる情報とは全く同じとなる。
さらに、
(2)実際に観測される値のベクトル $y_t (t = 1, 2, ...)$ については、状態の時点 $t$ までの時系列 $(\theta_t)$ を条件つけると各 $y_t$ は独立で、かつ各 $y_t$ は同じ時点の状態 $\theta_t$ だけに依存するものとする。
(1)(2)の仮定より、状態空間モデルは初期状態の確率密度 $p(\theta_0)$ 、および状態と観測値それぞれの条件付き確率密度 $p(\theta_t|\theta_{t-1})$ 、 $p(y_t|\theta_t)$ によって完全に特定される。つまり、任意の時点 $t$ に対して、状態と観測値の同時確率密度は上記3種類の確率密度の積に分解できる。

$\displaystyle p(\theta_{0:t}, y_{1:t}) = p(\theta_0) \prod_{j=1}^{t} p(\theta_j|\theta_{j-1}) p(y_j|\theta_j)$

状態空間モデルは、観測値 $y_t$ に関する「観測方程式」と、状態 $\theta_t$ に関する「状態方程式」の2種類の方程式で表現できる。

$\displaystyle y_t = h_t(\theta_t, v_t), \\ \theta_t = g_t(\theta_{t-1}, w_t).$

ただし、 $v_t, w_t$ は何らかの確率分布に従う誤差であり、 $h_t, g_t$ は任意の関数である。また初期状態 $\theta_0$ にも何らかの確率分布を定める。このようにかなり柔軟な設定が可能なモデルであるが、正規分布かつ線形関数を用いたものは「動的線形モデル」として区別して呼ばれることがある。