状態空間モデル:(1)基本概念

はじめに

時系列的に変化するような現象に対する統計手法として、状態空間モデルと呼ばれる方法がある。状態空間モデルは広く応用可能な柔軟な方法であり、規則性のない複雑な構造の時系列データに対しても用いることができるとされている。今回はモデルの基本概念を整理していく。

状態空間モデル

簡単に言うと、時間にともなって変化する現象の背後には観測不可能な「状態」があるものとし、実際に観測されるデータはその状態の不正確な観測値(誤差、あるいはノイズが乗ったもの)と考えるのが状態空間モデルの発想である。
このモデルでは、
(1)状態の時系列がマルコフ連鎖であるとし、前の時間の状態に依存して現在の状態が決定されることを表現する。つまり、状態の時系列ベクトルを \theta_t (t = 0, 1, ...)とすると、時点 tの条件付き確率密度は

 \displaystyle
p(\theta_t | \theta_{1:t-1}) = p(\theta_t | \theta_{t-1})
と表され、時点 tの状態に関して、時点 t-1までのすべての状態によってもたらされる情報と、時点 t-1だけによってもたらされる情報とは全く同じとなる。
さらに、
(2)実際に観測される値のベクトル y_t (t = 1, 2, ...)については、状態の時点 tまでの時系列 (\theta_t)を条件つけると各 y_tは独立で、かつ各 y_tは同じ時点の状態 \theta_tだけに依存するものとする。
(1)(2)の仮定より、状態空間モデルは初期状態の確率密度 p(\theta_0)、および状態と観測値それぞれの条件付き確率密度 p(\theta_t|\theta_{t-1}) p(y_t|\theta_t)によって完全に特定される。つまり、任意の時点 tに対して、状態と観測値の同時確率密度は上記3種類の確率密度の積に分解できる。
 \displaystyle
p(\theta_{0:t}, y_{1:t}) = p(\theta_0) \prod_{j=1}^{t} p(\theta_j|\theta_{j-1}) p(y_j|\theta_j)

状態空間モデルは、観測値 y_tに関する「観測方程式」と、状態 \theta_tに関する「状態方程式」の2種類の方程式で表現できる。

 \displaystyle
y_t = h_t(\theta_t, v_t), \\
\theta_t = g_t(\theta_{t-1}, w_t).
ただし、 v_t, w_tは何らかの確率分布に従う誤差であり、 h_t, g_tは任意の関数である。また初期状態 \theta_0にも何らかの確率分布を定める。このようにかなり柔軟な設定が可能なモデルであるが、正規分布かつ線形関数を用いたものは「動的線形モデル」として区別して呼ばれることがある。

動的線形モデル

動的線形モデルは、初期状態 \theta_0および各時点の誤差項に正規分布を仮定する:

 \displaystyle
\theta_0 \sim N(m_0, C_0), \\
v_t \sim N(0, V_t), \\
w_t \sim N(0, W_t).
なお、これらはすべて互いに独立とする。
さらに、観測方程式は状態と誤差との線形式、つまり関数 h_tを線形関数とする。同様に状態方程式も、前の時点の状態と誤差との線形式で表現できるとしたものである。
 \displaystyle
y_t = F_t \theta_t + v_t, \\
\theta_t = G_t \theta_{t-1} + w_t.
上記 F_tは状態と観測値の関係、 G_tは状態の推移を表す行列で、既知として直接値を定義する場合も、推定対象となる未知パラメータとする場合もある。

おわりに

状態空間モデルの概要を紹介した。動的線形モデルにおいては推定対象となる確率分布も正規分布で直接書き下すことができるが、より複雑なモデルになるとMCMCのような方法が必要になってくる。その辺りもまた記事にできればと思う。

f:id:mstour:20200803193337p:plain
状態空間モデルの概念図と、動的線形モデルの構造

参考文献

[1]G.Petris他(2013), Rによるベイジアン動的線型モデル, 朝倉書店.