実験計画法とFisherの3原則 - 統計学入門一歩先へ

実験計画法(Experimental design)は、関心のある結果（医学研究であれば、症状の改善や生存期間の延長など）と、それに影響を与えると考えられる因子（異なる治療法など）との関係性を明らかにするための実験計画に関する方法論のことをいう。臨床試験や農事試験に携わるような人なら避けて通れないものだが、一方もっぱら観察データを扱う分野の人が実験計画法を駆使することはあまりないだろう。
しかし、個人的には実験計画法の考え方を知っているとデータ解析の最大の敵ともいえる「バイアス」についての感覚が鋭くなるのではないかと思う。
今回は実験計画法の基本的なところをまとめていきたい。

実験計画法の扱う内容

実験計画法は、実験の計画に必要な次の2つの事項に関する方法論である：
　(1)処理の選定
　(2)実験の配置

(1)処理の選定

実験で取り上げる特定の原因を「因子(Factor)」、因子の取る設定条件を「水準(Level)」という。
実験研究では、ある因子（医学ならば治療法や薬物の用量、農学ならば施肥量や品種など）を複数の異なる水準（異なる治療内容、異なる用量、異なる施肥量、異なる品種）を用いて実施したときに、水準の間で関心のある結果に与える影響に違いがあるかどうかを評価する。例えば、薬物の用量として低用量(25mg)・中用量(50mg)、高用量(100mg)を設定し、用量が異なることによって症状の改善度に違いが出るかどうかを評価する臨床試験を行うような場合がある。
因子と水準の組み合わせを「処理(Treatment)」という。研究の目的を達成するにはまずは処理を適切に選定しなければならない。薬物の用量の例で言うと、十分な治療効果を得るためには本当は200mgを投与しなければならないのに、25mg・50mg・100mgの組み合わせだけを実験しても研究の本来の目的を達成することはできない。
処理をどのように実験に組み込むかによって、実験は以下のように分類できる。個々の実験計画についてここで書くと長くなるので、また別の機会にやってみたい。

因子が1つ・・・一元配置(One-way layout)
因子が複数・・・多元配置(Multi-way layout)
- すべての処理を実施・・・要因実験(Factorial experiment)
- 一部の処理を実施・・・一部実施要因実験(Fractional factorial experiment)
  - 主効果のみ評価・・・ラテン方格法(Latin square)
  - 主効果と低次の交互作用を評価・・・直交表

（三輪(2015)を一部改変して抜粋）

(2)実験の配置

例えば医学研究であれば被験者、農事試験であれば一区画の農地などのように、実験の処理を施して結果のデータを得る単位のことを「実験単位(Experimental unit)」という。実験の結果には必ず誤差が発生するので、誤差の大きさを評価できるようにすること、また誤差を可能な限り小さくする必要がある。この目標を達成するために、処理をどのように実験単位に割り当てるかを考えるのが実験の配置の問題である。
適切に実験を配置するための原則として、Fisherの3原則がよく知られている。具体的な配置方法と合わせて次項で述べる。

Fisherの3原則

実験には必ず誤差が伴うため、「実験誤差をできるだけ小さくする」とともに「実験誤差の大きさを推定する」ことが必要となる。そのためには、Fisherにより提唱された以下の3原則を満たすような実験の配置が望ましい。

反復(Replication)
無作為化(Randomization)
局所管理(Local control)

「反復」とは、同じ処理を複数の実験単位に配置することをいう。具体的には、異なる複数の被験者に同じ薬剤を服用してもらう、複数の区画で同じ量の施肥を行う、などである。反復を行うことで、同じ処理を行った場合におこる偶然的な誤差の大きさを推定することができる（データから標本分散を計算できる）。また、反復の数を増やすことによって誤差を小さくすることができる（サンプルサイズが増えると標本平均のばらつきが小さくなる）。なお、同じ実験単位からあたかも反復であるかのように複数のデータを観測する行為は「擬似反復」として知られており、このようなデータを用いると誤差を過小評価することにつながる。

f:id:mstour:20200923072043j:plain — 反復の例。同じ処理を複数回行う。

「無作為化」は、結果にバイアスを生じさせるような因子の影響を取り除くために行われる。例えば2種類の薬剤の効果を比較する臨床試験であれば、一方の薬剤が重症者ばかりに、他方の薬剤が軽症者ばかりに投与されたとしたら、薬剤の純粋な効果を評価するのは難しいことが想像できる。そのため、処理（この例では2種類の薬剤）の割り当てを無作為に行い、両方の処理の間で結果に影響するような他の因子が偏らないようにする必要がある。

f:id:mstour:20200923072127j:plain — 無作為化の例。異なる処理をランダムに割り当てる。

反復数を増やしたり多くの種類の処理を行いたい場合、たくさんの実験単位が必要となってくる。すると、例えば農事試験では多くの作物を植えるための広い農地を準備しないといけないが、農地の肥沃度の違いが系統的な誤差（バイアス）を生じさせる可能性がある。このような系統誤差の原因と考えられるものを「ブロック」として分割し、各ブロック内で処理の無作為化を行うことにより、系統誤差の影響を除くことができる。この方法を「局所管理」という。臨床試験の場合には、被験者間の誤差が大きくなりがちであるため、被験者をブロックとし、各被験者にランダムな順番で異なる試験治療を実施するような研究計画が用いられることがある（「クロスオーバー計画」と呼ばれる）。

f:id:mstour:20200923072202j:plain — 局所管理の例。日当たり別にブロックを作り、その中で無作為化する。

実験の配置の観点から実験計画を分類すると、以下のようにまとめられる。なお、分割法(Split-plot design)などの計画もあるがここでは省略した。

ブロックを用いない・・・完全無作為化法(Completely randomized design)
ブロックを用いる・・・ブロック計画(Block design)
- ブロック内ですべての処理を実施・・・乱塊法(Randomized block design)
- ブロック内で処理の一部分を実施・・・不完備ブロック計画(Incomplete block design)
- 2種類のブロック因子を導入・・・ラテン方格法(Latin square)、直交表

（三輪(2015)を一部改変して抜粋）

まとめ

今回は実験計画法の概要を整理した。また、実験計画の基本原則であるFisherの3原則について紹介した。

参考文献

[1] 三輪哲久(2015), "実験計画法と分散分析", 朝倉書店.
[2] 三中信宏(2016), "統計学の現場は一枚岩ではない", 心理学評論, Vol. 59, No. 1, 123–128.
http://team1mile.com/sjpr59-1/wp-content/uploads/2016/07/minaka.pdf