2値データの解析:(2)Fisherの正確検定

はじめに

前回は、対応関係のない 2 \times 2分割表の基本的な解析方法であるカイ二乗検定を紹介した。今回は、同様な形式のデータに対して用いられるもう一つの方法、Fisherの正確検定について述べる。
Fisherの正確検定(以下、Fisher検定とする)とは、カイ二乗検定のような漸近的性質を使わず、超幾何分布とよばれる確率分布に基づいて「正確な」確率計算を行うことが名称の由来だといわれている。カイ二乗検定はサンプルサイズがある程度大きくないと想定する確率分布に近づかず、有意差を間違って主張してしまいやすくなる(Type1エラーの増大)という弱点があるが、Fisher検定ではそのような心配はない。しかし、Fisher検定には過度に保守的になる(つまり、差がないのに間違って有意に差があると判断する危険は少ないが、有意差を示しづらい)ことが知られており、実際問題でどちらを使うべきかは非常に考えものである。ひとつの考え方としては、例えば2つの治療の効果が「異なる可能性を見つけたい」という目的であれば、カイ二乗検定のほうが見逃しのリスクは小さいので望ましく、一方2つの治療の効果が「異なることを厳格に示したい」のであれば、Fisher検定によって厳しい評価を行うべき、と言えるかもしれない(あくまで個人的な意見だけれど )。

状況設定

カイ二乗検定と同様の状況を考える。

度数 有効(Y=1) 無効(Y=0)
処置群(Z=1) a b m
対照群(Z=0) c d n
s t N

Fisher検定の方法

二項分布の正規分布近似を用いた方法(カイ二乗検定と同じ結果になる)では、処置群・対照群の合計人数は確定しているものとし、それぞれの有効となる人数を二項分布に従う確率変数と考えるが、Fisher検定での考え方は少し異なる。Fisher検定では、各被験者の有効・無効の結果もすでに確定しているとの条件を置く。
これはいったいどういうことかというと、詳しく言い出すと「統計的因果推論」の理論に立ち入らないといけなくなるのだが、各被験者には「処置群に割り当てられた場合の結果」と「対照群に割り当てられた場合の結果」という2つの結果がすでに(目には見えないが)存在していると仮定し、実際に治療の割付が行われ、研究が終わった時にそのどちらかだけが観測されている、という考え方をする。各被験者の結果は見えないところですでに決まっているため、どのようなデータが実際に得られるかはランダム割付の結果しだい、となる。上記の分割表は、そのようにして得られた結果の1パターンである。そして、処置群・対照群の間に差がない(有効となる確率が等しい)という仮定では得られそうにないような結果のパターンを数え上げる(他の統計的検定と同じように、得られたデータ以上に極端な結果が得られる確率を評価する)ことで、仮説を否定できるかどうかを判断することになる。
さて、Fisher検定では、前述の分割表のすべての周辺度数 m, n, s, tが固定されているという条件を置く。このとき、処置群 (Z=1)の有効 (Y=1)となる人数は超幾何分布とよばれる確率分布に従う。したがって、この確率分布を用いて、処置群の有効人数の今回得られている実現値 aが両群に差がないという帰無仮説が正しいとした場合にどれくらいの確率で起こり得るか(p値)を計算することになる。これは、先ほど述べたようにありえる結果のパターンをすべて数え上げることに対応する。
f:id:mstour:20201229203013j:plain 「はじめに」でFisher検定とカイ二乗検定の違いについて触れたが、もう1点重要な違いがある。Fisher検定はカイ二乗検定(や正規分布近似)と異なり、左右非対称な分布を用いているため両側p値の計算に注意を要する。いま処置群の有効人数を表す確率変数を A、得られた結果を aとすると、処置群に有利な方向に対する片側p値は P(A \geq a)、対照群に有利な方向に対する片側p値は P(A \leq a)である。両側p値の計算法としてよく見られる方法は、片側p値を2倍する(処置群に有利な結果が得られている場合には 2 \times P(A \geq a))、あるいは aという結果よりもさらに確率が小さい結果(つまり、 P(A = a) \geq P(A = e)となるような e)すべての確率を合計する、といったものである。後者は、確率分布の多くは端のほうに行くほど確率が小さくなることをイメージすると理解できるかと思う。

まとめ

今回は、Fisherの正確検定の概要を紹介した。この方法は初めて見る人には理解しがたい部分が多いかもしれない。なぜ有効・無効という結果を固定されたものと考えるのか?結果の不確実性を評価するのが統計ではないのか?このあたりをわかりやすく解説なんてまだまだできそうにないけれど、いつかやってみたいと思っている。

参考文献

岩崎学(2015) "統計的因果推論", 朝倉書店.