2値データの解析:(5)リスクの指標

治療の成功や疾患の発現など、関心のあるイベントが起こる確率を「リスク」と表現することがある。試験治療を行うグループと標準治療を行うグループとの間で治療の成功確率を比較するなど、2つのグループ間でのリスクの違いを調べるような場合、結果の要約方法として

  • リスク差(Risk Difference; RD)
  • 相対リスク/リスク比(Relative Risk/Risk Ratio; RR)
  • オッズ比(Odds Ratio; OR)

の3種類が主に用いられている。今回は、それぞれの特徴を整理していきたい。
今回は2グループ間の2値イベントの比較を考えるので、次のような2 \times2分割表を用いる。

グループ1 グループ2 合計
イベントあり  a  b  m_1
イベントなし  c  d  m_2
合計  n_1  n_2  N

また、グループ1、2それぞれのリスク、すなわちイベントが起こる確率をそれぞれ \pi_1, \pi_2とし、その推定量 p_1 = \frac{a}{n_1}, p_2 = \frac{b}{n_2}とする。

リスク差

リスク差(Risk Difference; RD)は、文字通り2グループ間のリスクの差

 \displaystyle
RD = \pi_1 - \pi_2
である。リスク差の推定量
 \displaystyle
\hat{RD} = p_1 - p_2 = \frac{a}{n_1} - \frac{b}{n_2}
となる。
グループ1に新治療、グループ2に標準治療を行い、副作用の発現リスクを比較したいとする。データを集計した結果 p_1 = 0.5, p_2 = 0.3だった場合、リスク差を用いると「標準治療に比べて、新治療の副作用発現リスクは0.2(20%ポイント)高い( \hat{RD} = 0.2)、という形の報告になる。
各グループのリスクの推定量(標本割合)は、二項分布の性質から漸近的に正規分布に従う。したがって、それらの差であるリスク差の推定量も漸近的に正規分布に従う。
 \displaystyle
\hat{RD} \sim^d N \left( \pi_1 - \pi_2, \frac{\pi_1(1-\pi_1)}{n_1} + \frac{\pi_2(1-\pi_2)}{n_2} \right)
(「漸近的に従う」ということを表すため \sim^dという記号を用いた)
この分布を使って、帰無仮説 H_0: \pi_1 = \pi_2に関する検定(正規分布を用いたZ検定)を行うことができ、それはPearsonのカイ二乗検定と同じ結果になる。同様にこの分布を直接使った信頼区間を構成することもできるが、リスク差がとりうる範囲である (-1, 1)をはみ出す可能性があるので、その他の方法を用いるほうがよいといわれている。

相対リスク/リスク比

相対リスク(Relative Risk; RR)あるいはリスク比(Risk Ratio; RR)は、2グループのリスクの比をとったもの

 \displaystyle
RR = \frac{\pi_1}{\pi_2}
である。推定量
 \displaystyle
\hat{RR} = \frac{p_1}{p_2} = \frac{a n_2}{b n_1}
となる。リスク差と同じ例を用いると、 \hat{RR} = \frac{0.5}{0.3} = 1.67より「標準治療に比べて、新治療の副作用発現リスクは1.67倍である」という報告になる。
相対リスクの確率分布は、対数変換したものを考えることが多い。相対リスク推定量の対数 \log(\hat{RR})は漸近的に以下の正規分布に従う。
 \displaystyle
\log(\hat{RR}) \sim^d N \left( \log(\pi_1) - \log(\pi_2), \frac{1-\pi_1}{n_1 \pi_1} + \frac{1-\pi_2}{n_2 \pi_2} \right)
この分布の分散の一致推定量
 \displaystyle
\hat{\sigma}^2 = \frac{1}{a} - \frac{1}{n_1} + \frac{1}{b} - \frac{1}{n_2}
となるので、対数相対リスクの両側 (1 - \alpha)%信頼区間は分割表の度数を用いて
 \displaystyle
\left[ \log(\hat{RR}) - z_{1-\frac{\alpha}{2}} \hat{\sigma}^2, \log(\hat{RR}) + z_{1-\frac{\alpha}{2}} \hat{\sigma}^2 \right]
により計算できる。信頼区間の両端の値を指数変換すれば、相対リスクの信頼区間が得られる。この区間は、相対リスクがとりうる値である (0, \infty)の範囲に収まる。

オッズ比

オッズ比(Odds Ratio; OR)は、各グループのオッズ(イベントが起こる確率と起こらない確率の比: \frac{\pi_1}{1-\pi_1} \frac{\pi_2}{1-\pi_2})の比である(ややこしい)。

 \displaystyle
OR = \frac{\pi_1 / (1-\pi_1)}{\pi_2 / (1-\pi_2)}
定量
 \displaystyle
\hat{OR} = \frac{p_1 / (1-p_1)}{p_2 / (1-p_2)} = \frac{p_1(1-p_2)}{p_2(1-p_1)} = \frac{ad}{bc}
となる。先述の例( p_1 = 0.5, p_2 = 0.3)を用いると、 \hat{OR} = \frac{0.5 \times 0.7}{0.3 \times 0.5} = 2.33より「標準治療に比べて、新治療の副作用発現のオッズは2.33倍である」という表現になる。「オッズが2.33倍」ってどういうこと??という問題は後述する。
オッズ比も、相対リスクと同様に対数をとったものの分布を通常考える。対数オッズ比は漸近的に以下の正規分布に従う。
 \displaystyle
\log(\hat{OR}) \sim^d N \left( \log \left( \frac{\pi_1}{1-\pi_1} \right) - \log \left( \frac{\pi_2}{1-\pi_2} \right), 
\frac{1}{n_1 \pi_1 (1-\pi_1)} + \frac{1}{n_2 \pi_2 (1-\pi_2)} \right)
この分布の分散の一致推定量
 \displaystyle
\hat{\sigma}^2 = \frac{1}{a} + \frac{1}{b} + \frac{1}{c} + \frac{1}{d}
となるので、対数オッズ比の両側 (1 - \alpha)%信頼区間
 \displaystyle
\left[ \log(\hat{OR}) - z_{1-\frac{\alpha}{2}} \hat{\sigma}^2, \log(\hat{OR}) + z_{1-\frac{\alpha}{2}} \hat{\sigma}^2 \right]
で計算できる。この両端を指数変換することで、オッズ比の信頼区間が得られる。この区間もオッズ比のとりうる範囲である (0, \infty)に収まる。

どれを使うべきなのか

このようにリスクの違いを要約する指標として3つの代表的なものがあるのだが、ではどれを使うべきなのか?Lachin(2020)[1]に「指標の選択は、主として好みの問題または臨床的判断の問題」と述べられている通り、どれを使わないといけないという決まりはなさそうだが、気をつけないといけない点はある。まずはリスク差と相対リスクについて、ランダム化比較試験の報告のためのガイドラインである「CONSORT statement」の解説(Moher et al.(2010)[2])の記載を見てみよう。
CONSORTには論文に記載すべき事項がチェックリスト化されているが、その中で、2値アウトカムの場合はリスク差と相対リスクの両方を提示するのが望ましいことが述べられている(item 17b)。Moher et al.(2010)[2]では、どちらか片方だけでは治療効果を完全には捉えられないことが説明されている。リスク差にも相対リスクにも弱点があるのだ。
f:id:mstour:20200929075707j:plain
まずリスク差について、この解説に記載されている例を使って考えてみる。すごく単純化した表を以下に示す。

新治療のリスク 標準治療のリスク 標準治療に対する新治療の相対リスク 新治療と標準治療のリスク差
31.9(%) 38.2(%) 0.84 -6.3(%)

解説では、リスク差の弱点として、相対リスクよりも結果の一般化(今回の研究に参加していない人々にも今回得た結果を当てはめて考えること)が難しい、なぜならリスク差の大きさは元々のリスク(ベースラインリスク)、つまり上の例では標準治療を受ける場合のリスクの大きさに依存するからだ、ということが述べられている。例えば標準治療を受けた時のリスクが倍の76.4%であるような集団を考えてみる。新治療がリスクを0.84倍に下げるのであれば、新治療のリスクは76.4% \times0.84 = 64.2%と計算でき、リスク差は64.2%-76.4%=-12.2%となる。つまり、同じ治療であっても、リスク差の値は対象となる集団が違えば結構変わってくるということである。
一方、相対リスクの弱点は対象としているイベントそのものの性質によって解釈が変わりうることである。解説では、ありふれた疾患の場合には相対リスクが1に近くても臨床的に意味のある違いを示している可能性があるが、まれな疾患の場合にはたとえ相対リスクが大きくても(新治療によってリスクが減る場合には、小さくても)そんなに重要な結果ではないかもしれない、と述べられている。どういうことか。例えば、新治療が確立してXX病の発症リスクが0.1%に抑えられることが分かったとしても、元々XX病の発症リスクが0.2%しかなかったとしたら、(相対リスクは0.5だが)この新治療を世に広めるために公的なお金を使うべきなのだろうか?また、とても美味しいYYを食べているとZZがんのリスクが2倍になることがある研究で示されたとする。でも元々ZZがんが一生のうちに発現する確率は0.01%しかなかったとしたら、あなたはYYを食べるのをこの先我慢しますか・・・?
まとめると、リスクの違いを誤解なく表現するには、リスク差と相対リスクは両方使った方が無難そうである。
オッズ比については、例えばケースコントロール研究では、研究の性質上使わざるを得ない。またロジスティック回帰で解析する場合にもオッズ比は何かと都合がよい。しかし、そのままでは自然な解釈をするのが難しいので、(まれなイベントであることを仮定した上で)相対リスクの近似として理解するのが一般的だと思う。

参考文献

[1] John M. Lachin(2020), "医薬データのための統計解析", 共立出版.
[2] Moher, D. et al.(2010), "CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials", BMJ. 340: c869.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2844943/