2値データの解析:(3)割合の信頼区間(1標本)
はじめに
今回は、関心ある事象の発生する割合(例えば疾患の発生割合とか、例えば内閣支持率とか)の信頼区間について話してみたい。1標本割合の信頼区間でよく使われる(よく使われるのは僕の身近なところでの話かもしれないが)、Clopper-Pearsonの信頼区間とWilsonの信頼区間を紹介する。なお2標本の場合には、グループ間の割合の違いはリスク差、リスク比、オッズ比のように様々な形で要約され、それぞれに信頼区間の構成方法がある。2標本の場合についてはまた別記事を書く予定である。
検定と信頼区間についての前置き
信頼区間と検定とは表裏一体の関係にあるというのを聞いたことがあるかもしれない。検定はパラメータに関するある特定の仮説を否定できるかどうかを問題にしているが、信頼区間はそれとは反対に「検定で否定できないようなパラメータの値の集まり」である。
疾患の有無とか、内閣支持・不支持のような2値データは通常「二項分布」でモデル化し、母集団全体における真の疾患発生確率とか内閣支持率を二項確率パラメータで表現する。は得られたサンプル内での発生者の割合・支持者の割合によって推定できるが、その推定値が事前に決めた仮説(例えば、母集団での内閣支持率は40%である)と矛盾しているか否かを評価するのが検定である。(以降は、内閣支持率の例で考える。)
例えば今回の調査で支持者の割合が85%だったとすると、母集団での内閣支持率が40%と仮定したときに今回の結果を上回るような事態はどのくらいの確率で起こるのかを計算して、支持率40%という当初の仮説とどのくらい矛盾しているかを評価する。矛盾の程度、つまり当初の仮説を否定するかどうかは、これも前もって決めておいた確率の閾値を下回るかどうかで判断する。その閾値は、40%より高くても低くても意味があるとする場合(両側検定)は0.05、40%より高い場合だけに意味がある場合(片側検定)は0.025とすることが多い。この閾値(有意水準という)はという記号を使う。そうすると、もし仮に40%という仮説が正しかった場合にも(両側検定の場合)確率0.05で間違って仮説を否定する可能性がある。とはいえ有限のサンプルでものを言う以上この確率を0にはできないので、0.05くらいならまあいいでしょう、と考える。
2値データの1標本(1標本とは、1つの母集団に関する推測を行うこと)の検定には、二項分布の確率を正確に計算するものと、正規分布による近似を使うものとがある。
信頼区間はこの考えを裏返したようなもので、今回の調査の結果では否定ができないような仮説(パラメータの値)の範囲を計算する。この計算には検定の有意水準を用いることになり、この水準によって区間の幅が変わってくる。詳しくはこの後の具体的な信頼区間の話で。
Clopper-Pearsonの信頼区間
前置きが長くなってしまった。
Clopper-Pearsonの信頼区間は、二項分布の正確な計算による検定をベースにした方法である。まず、今回の調査によって対象者人中人が内閣支持だったとする。パラメータの二項分布の確率関数をで表すと、仮説が正しいとしたときに人中人以上の支持者が出る確率は
さて、Clopper-Pearsonの信頼区間を作るには、この問題を逆にして考える必要がある。わかりやすくするために、今回の調査を人に実施した結果、支持者数は人だったとする。信頼区間は検定で否定できないようなパラメータの値の集まりなので、今回はこの結果を得たときに否定できないようなの値を探せばよい。検定で否定できないのは、上の例ではp値が0.025以上になってしまった場合である。母集団での支持率の値が大きくなればなるほど、調査での支持者数に大きい値が出ることは珍しいことではなくなってくるので、p値は大きくなってくる。それがちょうど0.025になるようなが「統計的に否定できないようなの値」の最小値となる。数式で書くとという等式を満たすようなが、求めたいClopper-Pearson信頼区間の下限値である。
上限値も、全く同じような考え方で、反対方向の検定で否定できないの値を探しにいけばよい。この計算は反復計算を必要とするが、通常の統計ソフトには実装されているはずである。
この方法は、二項分布を用いた正確検定とセットで行うことが多い。