Cochran-Mantel-Haenszel検定とはいったい何なのか

2020/8/3 追記・細かな修正あり。

「Cochran-Mantel-Haenszel検定」(以下、CMH検定)とよばれる一連の方法について、いまいちよくわかっていない。 何がよくわからないかというと、僕は「Cochranの検定」と「Mantel-Haenszelの検定」は同じように層別化した分割表の検定を行うものだが厳密には両者は違うものだ、と理解しているのだが、某統計ソフトではCMH検定という名前を使っているし、臨床試験の報告なんかを見てもCMH検定で評価したという文言がよく出てきたりするのが気になっていた。えっっ、これはCochranとMantel-Haenszelのいったいどちらなんだ・・・?
ちなみに、いま分割表の行方向に治療群(治療A、治療Bの2つとする)、列方向に治療結果(有効、無効)を置いたものとすると、両者の違いは次の点である。Cochranの検定は各治療群の合計人数(行方向の周辺和)は固定されているとし(ランダム割り付けにより、研究計画でコントロールできると考えられる)、各治療群における有効の人数を二項分布に従うと想定して導出される(層別化をしているため、実際には層の数だけ分割表があり、検定は各層での統計量を統合して行う)。これは層別でない場合の正規近似、あるいはPearsonのカイ二乗検定と同様の考え方である。一方Mantel-Haenszel検定はさらに有効・無効の合計人数(列方向の周辺和)も固定して考え、あるセル(通常は最も左上のセルを用いるが、どのセルでも結果は変わらないらしい)の度数が超幾何分布に従うことを利用して導出される。なお層別でない場合に用いられるFisherの正確検定も同様に超幾何分布を用いて確率計算を行う。Mantel-Haenszel検定統計量が、層の数が1の場合、つまり層別がない場合にFisherの正確検定に一致するかというと、どうもそうではないようなことを見たことがある。詳細はよくわからない。 f:id:mstour:20201230193733j:plain

ということで、某統計ソフトのヘルプ https://documentation.sas.com/?docsetId=statug&docsetTarget=statug_freq_details92.htm&docsetVersion=15.1&locale=en で紹介されていたLandis et al.(1978)の論文を読んでみた。
1章Introductionにて、Cochran(1954)によって提案された二項分布にもとづく方法は「各層」20以上のサンプルサイズが必要なこと、一方Mantel and Haenszel(1959)による超幾何分布を用いた方法だと「全体の」サンプルサイズが漸近的な方法が妥当になるくらい十分であればよいことが述べられている(どれくらい必要なのかは書いていないが、確かそういった論文があったように思う)。Cochranの統計量とMantel-Haenszelの統計量の違いはごくわずかであり、各層のサンプルサイズが中程度以上であれば(例えば20以上だといわれている)本質的に結果は同じである。そうでなければMantel-Haenszelのほうが好ましいとのこと。 そして、以降ではGeneralized Cochran-Mantel-Haenszel approachが解説される(Generalizedとついているのは、本文を読んでいくと、カテゴリーに順位がある場合も含めての統一的なフレームワークという意味あいがあるのではないかと思う)。超幾何分布が導出に用いられており、この(Generalized)CMHというのはどうもCochranではなくMantel-Haenszelのタイプのようである。
最初にCochranとMantel-Haenszelの違いを説明しつつ以降ではCMHという名称にしているのは、各層に十分なサンプルサイズがあれば結果が本質的に同じだから、ということなのだろう。たぶん。
【2020/8/3追記】
最近買った文献[4]にもこのあたりのことが書いてあった。要約すると「Mantel-Haenszel検定は、Cochran検定よりやや保守的だが、漸近的にこの違いはなくなるので、どちらもCochran-Mantel-Haenszel検定と呼ばれる」そうだ。結局どちらも大標本を前提にして、漸近的にカイ二乗分布に従うことを利用するので、どちらでもいいっぽい。
【追記おわり】

2章以降は数学的詳細と具体例が続く。行・列ともに3カテゴリー以上の場合を想定した一般形を説明されているので、行列形式で記述されており頭の中だけでは式を追えなかった・・・よく使われる 2 \times 2の場合も説明されているので何となくわかった。

自分なりの結論としては、学術論文(といっても応用的な内容だけど)でも結局CMHって言っちゃっているので、まあ気にせずに使おうかと思う。ただし検定の背景、要はCochranのように二項分布(行方向の周辺和のみ固定)を考えているのか、Mantel-Haenszelのように超幾何分布(行・列両方の周辺和を固定)を考えているのかを認識しておくことは大事じゃないだろうか。まあ、カイ二乗検定とFisherの正確検定もそこまで違いにこだわって使い分けているわけじゃないけど・・・

参考文献

[1] Landis, J. R., Heyman, E. R., and Koch, G. G. (1978). "Average Partial Association in Three-Way Contingency Tables: A Review and Discussion of Alternative Tests.” International Statistical Review 46:237–254.
[2] Cochran, W.G. (1954). "Some methods for strengthening the common  {\chi}^{2}_{6} test. " Biometrics, 10, 417-451.
[3] Mantel, N. and Haenszel, W. (1959). "Statistical aspects of the analysis of data from retrospective studies of disease." Journal of the National Cancer Institute, 22, 719-748.
[4] John M. Lachin(2020). 医薬データのための統計解析, 共立出版.