マルコフ連鎖モンテカルロ法(3)マルコフ連鎖について振り返る

はじめに

前回2回は頻用される2つのアルゴリズム、MHアルゴリズムとGibbsサンプラーについて述べた。しかし、まだMCMCのそもそもの前提条件についてを述べていなかった。今回はマルコフ連鎖についての話をまとめる。

マルコフ連鎖

時点 t(t = 1, 2, ...)にしたがって状態が推移するような確率変数 x^{(t)}の系列を考える。この系列を確率過程という。また、 x^{(t)}がとりうる値すべてからなる集合Sを状態空間という。 tにおいて状態が i \in Sである場合に次の t+1において状態 j \in Sとなる確率は、 t-1以前の状態の履歴も含めた条件付き確率として

 \displaystyle
P(x^{(t+1)} = j | x^{(1)} = i_1, x^{(2)} = i_2, ..., x^{(t)} = i)
と定義できる。
さて、もし上記の確率が tの状態だけに依存して決まる( t-1以前の履歴に依存しない)、つまり
 \displaystyle
P(x^{(t+1)} = j | x^{(1)} = i_1, x^{(2)} = i_2, ..., x^{(t)} = i) = P(x^{(t+1)} = j | x^{(t)} = i)
となるとき、確率過程はマルコフ連鎖と呼ばれる。
 iから jへの推移確率を P(x^{(t+1)} = j|x^{(t)} = i) = P_{ij})とし、同じ状態にとどまる確率 P_{ii}も含めすべての推移確率を並べた行列 P = (P_{ij})を推移確率行列という。今は離散的な状態空間を考えているが、連続的な場合も考えることができ、その場合も含め一般的には推移核と呼ばれる。
推移確率行列を用いた状態推移の表現を考えよう。初期状態のベクトルを \pi^{(1)}とすると、次の状態 \pi^{(2)}への推移は推移確率行列 Pを掛けることで
 \displaystyle
\pi^{(1)} P = \pi^{(2)}
と書くことができる。続く \pi^{(3)}への推移には再度 Pを掛ければよい。したがって時点 t+1の確率分布は一般的に
 \displaystyle
\pi^{(t)} P = \pi^{(t+1)}, \\
あるいは \pi^{(1)} P^t = \pi^{(t+1)}
と表せる( P^tは、転置ではなく t乗を表す)。
状態 \pi^{(t)} \pi^{(t+1)}は一般的には異なるが、ある条件を満たすマルコフ連鎖においては1つの分布に収束し、推移確率行列に従ってもそれ以上分布が変化しなくなる。つまり
 \displaystyle
\pi P = \pi
が成立する。収束先の \piを、推移確率行列 Pをもつマルコフ連鎖の定常分布という。MCMCは、直接サンプリングが困難な確率分布とこの定常分布とが等しくなるように推移確率行列(あるいは推移核)を設計して、目的とするサンプルを得るための方法である。

定常分布に収束する条件

マルコフ連鎖が定常分布に収束する条件として「エルゴード性」と呼ばれる性質がある。このエルゴード性を構成する3つの概念をまずはまとめる。

1.既約的
状態 iから jへ有限回の推移で到達できる(確率が0でない)とき、 i jへ到達可能であるという。推移確率で表現すると P^{t}_{ij} > 0である。逆方向にも有限回の推移で到達できるなら( P^{t^{'}}_{ji} > 0)、 i jは互いに到達可能であるという。
状態空間 Sのすべての要素の組が互いに到達可能であるとき、そのマルコフ連鎖は「既約的」であるという。

2.非周期的
周期とは、状態 iから jへの推移の中で同じ推移のパターンが何度も繰り返されるような場合、そのパターン1つの時点間の長さのことをいう。どの状態に関しても周期が1、つまり同じパターンの繰り返しが存在しないようなマルコフ連鎖は「非周期的」であるという。

3.正再帰
状態 iから再び iへ戻ってくるまでの最小の推移数を T_iとするとき、 P(T_i < \infty) = 1、つまり確実に有限回数で戻ってくるような場合、マルコフ連鎖は「再帰的」という。さらに E[T_i] < \inftyであるとき「正再帰的」という。

これら3つを持つマルコフ連鎖エルゴード性を満たす(エルゴード的である、という)。エルゴード的なマルコフ連鎖は、定常分布を \pi(.)とすると、すべての状態 i, jに対して

 \displaystyle
\lim_{t \to \infty} P^{t}_{ij} = \pi(j)
が成立する。つまり、どの初期状態から出発しても、状態の分布は定常分布に収束することとなる。いったん定常分布に収束すると、それ以降に得られるサンプルはすべて定常分布に従っていることが保証される。

おわりに

マルコフ連鎖の概要をざっと確認した。マルコフ連鎖の理論とMCMCとの繋がりについて、また別の回で詳しく書いていきたい。

f:id:mstour:20200802184713p:plain
マルコフ連鎖
参考文献

豊田秀樹ほか(2008), マルコフ連鎖モンテカルロ法, 朝倉書店.