共分散分析と前後差のt検定

はじめに

医学や心理学などでは、ある介入行為の効果を評価するために、ランダム化比較試験によって介入群と対照群とのアウトカム(血圧などの何らかの測定値だったり、質問票の得点など)を比較することがよく行われる。しかし、ランダム化を行ったとしても比較する2グループの背景因子が完全に揃うことは難しく、特にアウトカム変数の介入前の値(ベースライン値とよばれることが多い)そのものは結果に強く影響するため、それらが偶然不揃いとなった場合には、介入効果の推定にバイアスが入りかねない。対処法としては、重要な変数をランダム化の段階で考慮するか、解析で考慮するかである。解析でそのような重要な背景因子を考慮する方法の代表的なものに共分散分析という方法がある。なお、類似の方法として、介入前後の差をt検定で比較するということも比較的よく行われているが、状況によっては深刻なバイアスが入ることが示されている(Egbewale et al.(2014))。以下では両者の特徴をざっと紹介する。両者の比較のために、以降共分散分析では介入前値を共変量として考えることにするが、一般にはその他の変数を共変量とすることも可能であり、さらに複数の変数を使用することもできる。

共分散分析

共分散分析とは、アウトカムに影響を与える変数の影響を取り除いた上での介入効果を推定するための統計的方法である。分散分析と同様に、線形モデルとして以下のように記述することができる(分散分析ではカテゴリー型の因子しか考えないのに対して、共分散分析では連続型の変数を制御するという点が異なる):

 \displaystyle
Y_{ij} = \beta_0 + \beta_1 G_{ij} + \beta_2 X_{ij} + e_{ij}

ここで iは個人、 jはグループを表すインデックスであり、 Y_{ij}はアウトカム変数の介入後の値、 X_{ij}は介入前の値、さらに G_{ij}は介入の有無を示す指示変数(介入群を1、対照群を0とする)である。 e_{ij}はモデルで説明できない誤差で、平均0で共通の分散をもつ正規分布に従うと想定する。一般的な回帰モデルと同様に、介入効果を表すパラメータ \beta_1によって「 G_{ij}以外の変数の値を一定とした時の介入効果」を評価することができる。つまり、共変量の影響を取り除いていることになる。 f:id:mstour:20201227194339j:plain このように共分散分析は有益な方法だが、

  • 共変量とアウトカムとの間には直線関係があること

  • 共変量と介入効果とに交互作用がないこと

を暗に仮定しており、これらが満たされていない場合に問題となる場合があると言われている。なお「共変量と介入効果との交互作用」とは、共変量の値によって介入効果の大小が異なることを意味している。例えば介入前の血圧を共変量とした場合、元々血圧が高い人は低い人よりも治療の効果が大きい、という場合がこれにあたる。これらの仮定が問題なければ、共分散分析はバイアスが入らず、推定精度も高い優れた方法である。ただし、ランダム化を行っていない場合には、介入前値の不均衡を調整するために共分散分析を使うことで、介入効果がないにもかかわらず見せかけの差が生じるようなことがあるので注意を要する(Van Breukelen G.J.P.(2006))。

前後差のt検定

介入前値が比較するグループ間で揃っていないのであれば、介入の前と後とでの「差」を取れば公平な比較ができるのではないかと思うかもしれない。実際、そのような方法はよく用いられているようである。連続データに対しては、「前後差」のグループ間差をt検定で比較することが典型的である。
しかしながら、介入の効果が全くない場合にも、介入前の値が平均に比べ高かった人は介入後では平均に近い値をとる傾向にあるという「平均への回帰」と呼ばれる現象が起こることがよく知られている。すると、もし介入群と対照群の間に全く差がなかったとしても、単純に前後差をとった場合介入前の値が高いグループの方が介入前の値が低いグループよりも変化量が大きくなる可能性がある。このことはEgbewale et al.(2014)のシミュレーションでも検討されており、介入前後の値どうしの相関が弱い(つまり介入の効果が小さい)ほど、また介入前値のグループ間差が大きいほど、推定のバイアスが大きくなることが示されている。

まとめ

介入の効果を評価する研究によく使用される、「共分散分析」と「前後差のt検定」について簡単に紹介した。ランダム化を行った場合にも偶然生じてしまう介入前値の不均衡を調整するためにこれらが用いられるが、基本的には共分散分析を用いるメリットの方が大きい(ただし、前述した2つの仮定が満たされない場合には、例えば介入前値を無視した単純な比較の方が良いかもしれない)。しかし、ランダム化がなされていない場合に共分散分析を用いるとバイアスを生じさせることがあることが知られているので、いつでも共分散分析を使うべきとは言えない。

参考文献

  • J.L.フライス(2004), "臨床試験のデザインと解析", アーム.

  • Egbewale et al.(2014), "Bias, precision and statistical power of analysis of covariance in the analysis of randomized trials with baseline imbalance: a simulation study", BMC Medical Research Methodology 2014, 14:49.

  • Van Breukelen G.J.P.(2006), "ANCOVA versus change from baseline had more power in randomized studies and more bias in nonrandomized studies", Journal of Clinical Epidemiology 59(2006) 920-925.