疫学における因果性と因果推論:多元的なアプローチの必要性

強調オフ

因果論・統計学

サイトのご利用には利用規約への同意が必要です

Causality and causal inference in epidemiology: the need for a pluralistic approach

ncbi.nlm.nih.gov/pmc/articles/PMC5841832/

オンラインで2016年1月22日に公開

概要

潜在的結果アプローチ推論の制限版に基づく因果推論は、疫学の教育と実践においてますます重要な位置を占めるようになってきている。提案されている概念と方法は、特定の問題に対しては有用であるが、疫学分野全体の理論と実践が、因果推論に対するこの単一のアプローチに限定されるようになるとすれば、懸念すべきことである。我々が懸念するのは、この理論によって、疫学者が尋ねる質問や検討する研究デザインが制限されることである。また、因果関係を評価するために受け入れられると考えられる証拠が制限され、その結果、科学的および公衆衛生的な意思決定のために受け入れられると考えられる証拠が制限される。これらの制限は、因果関係について考えるための特定の概念的枠組みに基づいている。

第1章では、RPOA(Restricted Potential Outcomes Approach)の特徴を説明し、特定の問題を解決するためだけではなく、疫学全体が目指すべき理想として、これらの原則を提唱する方法論の動きがあることを示す。

第2章では、因果関係の性質について疫学が一つの特定の見解に限定されることが問題であることを示すことを目指す。

第3章では、RPOAが因果関係の評価に関しても問題があることを論じている。RPOAは研究デザインの選択を制限し、過去に非常に有用であった種類の観察研究の結果を誤って否定し、疫学的推論の教育に損害を与える恐れがあると主張する。

最後に、第4章では、因果関係の性質とその評価に関して、より合理的な「作業仮説」と考えられるものを提示する。

はじめに

1950年代から 1990年代後半まで、疫学的な因果関係と因果推論の概念は、喫煙が肺がんの原因であると認められた経験に根ざしていた。しかし、最近では、「因果推論」という言葉は、特定のツールや態度を意味するようになってきた。近日発売予定のテキスト3には「causal inference(因果推論)」というタイトルが付けられているが、これは、この狭い枠組みに限定されているにもかかわらず、この分野のすべてを網羅していることを意味している。このアプローチの支持者は、因果関係を評価するために無作為化比較試験(RCT)が卓越していると仮定し、それを推進している。そして、他の研究デザイン(すなわち観察研究)は、RCTを模倣する限りにおいてのみ有効であり、関連性があるとみなされる。

この論文では、「強硬な」方法論派が疫学界に出現するのを防ぎたいと考えている。

セクション1. 「制限付き」潜在的成果アプローチ

我々が反対している「強硬な」方法論的アプローチは、「潜在的成果アプローチ」(POA)と呼ばれることがある。しかし、この言葉は疫学の世界ではいくつかの異なる意味で使われている。しばしば、本質的に介入を伴わない反事実的思考[p.54]6と交換可能であると紹介される(下記の「ファミリーツリー」を参照)。しかし、実際には、統計理論の観点から、POAは無作為化比較試験(RCT)や仮想的な介入を議論する観点からもよく使われている[p.55, 59]6 ここで取り上げるのは後者のアプローチである。したがって、POAのより一般的なバージョンとの混同を避けるために、我々が検討しているパラダイムを表すために、「制限付き潜在的アウトカム・アプローチ」(RPOA)という用語を使用する。RPOAとPOAの違いは、2つの重要な点にある。

RPOAという言葉には2つの意味がある。技術的な意味では、数学的なツールや手法(有向非環状グラフ(DAG)構造方程式、限界構造モデルなど)の集合体に関するもので、特定の哲学的なコミットメントを意味するものではない。一方、哲学的な意味合いは、疫学者が因果関係についてどのように考えるべきかについての制限的な信念のセットからなる。

方法論的な動きは、合意された主張の単一の「バイブル」に固執することはほとんどない。これは、論理的実証主義のような最近の偉大な方法論的運動にも言えることであり、RPOAにも言えることである。ここでは、「わら人形」を攻撃しているのではないことを明確にするために、疫学におけるこのアプローチの著名な著者からの重要な引用をいくつか挙げ、これらの主張の論理的帰結を明らかにした。

疫学は正確さと定量性を追求しているが、何千年もの試行錯誤を経てきたにもかかわらず、因果関係を定量的に定義することはおろか、正確さも持ち合わせていない。疫学者は、これまで人類が漠然とした定性的な表現しかできなかったことを、正確な定量的表現で言いたいという厄介な立場に置かれているのである。

この難問に対する一つの答えは、アソシエーションだけで語ることである。RPOAによれば、定義された因果関係に注目する限り、正確な因果関係を主張することができる。

連想の世界に引きこもるのではなく、因果関係をはっきりさせることが大切である。因果関係を適切に定義するには、明確な反事実の結果が必要であり、関連する介入について広く共有されたコンセンサスが必要である4。

2014年の世界疫学会議の全体講演で、ヘルナンは「介入がよく規定されているときに、因果関係の質問はよく規定される」と主張した。この見解によると、「介入」という言葉は、対照的な非現実的な状態をもたらすような、我々人間が原理的に取ることのできる行動を示すために用いられる。このように、RPOAは潜在的な「人間の介入」の必要性によって制限されてしまうのである。

RPOAは、このような因果関係に関する質問の提起と回答の方法を、普遍的な哲学的分析として推進しているのではなく、疫学者にとって有用な因果関係に関する思考方法として推進しているのである。その有用性とは、特定の介入に関連する因果関係の主張の予測価値に由来するものである。VanderWeeleとHernánが説明する。

観察型疫学や社会科学における統計的分析によって明らかになった経験的な関連性は、予測も可能にする。関連性を観察することで、特定の共変量や過去を考慮して、特定の個人に何が起こるかを予測できることがある。しかし、このような観察研究で発見された関連性は、一般的には、事実とは異なるシナリオ、例えば、ある操作をして物事を元の状態とは異なる状態にした場合には、予測することはできない。統計学、疫学、社会科学などの因果推論の文献は、事実に反するシナリオの予測がどのような場合に正当化されるかを明らかにしようとしている。我々は、何らかの介入や操作を行った場合に起こるであろうことを正確に予測できるような関連性がある場合、その関連性を「因果関係」と表現する7。

したがって、RPOAは、因果関係の主張を、何らかの介入や操作によってもたらされるであろう事実に反するシナリオについての正確な予測と同一視している。

これまでのところ、RPOAは魅力的な見解であることがわかる。因果関係の主張が連想関係の主張よりも優れている点として、仮説的なシナリオの下での予測を挙げ、そのような仮説的なシナリオを明確に指定する因果関係の主張に注目することを提唱している。さらに、仮説的シナリオを人間が実現できるものに限定しているが、これも明らかにプラグマティズムの動機によるものである。エルナンはこう書いている。

肝心なのは次の質問 明確に定義されていない因果関係を推定することに何の意味があるのか?結果として得られる相対リスク推定値は、それをメカニズムに関連付けることができない科学者にとっても、それを効果的な介入策に変換することができない政策立案者にとっても、何の役にも立たないだろう4。

VanderWeeleはこう書いている。

本書に限らず、統計学、疫学、社会科学の分野で主流となっている因果推論の枠組みでは、因果関係は通常、反事実上の結果の対比という観点から考えられている。これらの反事実上の結果は、それ自体、典型的には仮想的な介入の下での結果として考えられており、反事実をもたらす仮想的な介入は、通常、何らかの人間の行動から構成されている。452] 昨日の気温が40度ではなく30度だったら、宇宙の他の部分は何が違っていなければならなかったかを想像するよりも、患者が薬Bではなく薬Aを服用した場合に、宇宙の他の部分がそのままであることを想像する方が簡単である[p.455] 8。

RPOAは、非実験的(観察的)研究を原則的に反対しているわけではないが、無作為化実験を模した研究を行うことを推奨している。これは、無作為化実験が無作為化されているという理由だけではなく(もちろんそれも理由の一つではあるが)実験であるがゆえに介入を伴うからである。HernánとRobinsは次のように述べている。

観察研究は、以下の3つの条件のもと、条件付き無作為化実験として概念化することができる。(i) 比較対象となる治療の値は,明確に定義された介入に対応している;(ii) 治療のすべての値を受ける条件付き確率は,研究者によって決定されていないが,測定された共変量にのみ依存している;(iii) 治療のすべての値を受ける条件付き確率は,ゼロよりも大きい,すなわち正である[3.1章]3。

これらの文章から、RPOAの特徴として以下のような主張を導き出した。

  1. 因果的な主張は、因果的な主張がよく定義されていれば、仮説的なシナリオの下での予測を可能にする。
  2. 因果関係のある主張と質問は、介入がよく規定されている場合によく定義される。
  3. 疫学者は、介入が明確に定義されていることを特徴とする、明確に定義された因果仮説に注意を向けるべきである。
  4. 無作為化を除いて、観察研究は実験研究のすべての側面を模倣すべきであり、そうすることで観察研究は明確に定義された因果仮説の調査に限定されるからである。

これらの原則は、歴史的に見ても非常に豊かで成功している疫学の実践とは似ても似つかない。また、因果推論に携わるすべての人に支持されているわけでもない。

RPOAは、2つの重要な点で、より一般的なPOAとは異なる。第一に、RPOAは、介入や操作が疫学の関心事であるためには、人間が実行可能な操作でなければならないと主張する。第二に、RPOAは、仮説的なシナリオの下で容易に予測できない因果関係の主張の意味と有用性を否定する。これに対して、他のアプローチでは、そのような主張を受け入れ、意味を持たせるための枠組みを提供しようとするのが一般的である9。

このような基本的な概念の違いの他にも、様々な違いがある。例えば、RPOAに影響を与えたとされるJudea Pearl氏は、観察研究が無作為化試験に倣うべきであるという考えや、性別や人種などの操作できない要素を原因とみなすべきではないという考えには賛同していない(以下の引用文参照)。

操作しなくても因果関係があるのは確かだ。月は潮を引き、人種は差別を生み、性は特定のホルモンを分泌し、他のホルモンを分泌しない。自然は、ある変数の値を容赦なく感知し、他の変数の値を決定するメカニズムの社会であり、それらのメカニズムを作動させる前に、人間の操作者を待つことはない[p.361]10。

因果関係の本質的な要素は応答性である。すなわち、ある変数が他の変数の変動に応答する能力であり、その変動がどのようにして生じたかには関係がない[p.313]11。

…科学者が反事実を発明したのは、おそらくそのような理由からであろう。反事実は、先行条件が成立する物理的手段を特定することなく、先行条件の実現を述べたり考えたりすることを可能にする[p.361]10。

このように、RPOAが独自の存在であることは明らかである。

RPOAアプローチの要素

RPOAは、少なくとも3つの異なる分野の発展からインスピレーションを得ている。一つ目は、喫煙と肺がんを研究している疫学者が採用した因果関係に対する実際的な態度である。現実的なアプローチを最初に表現したのは、1957年にLilienfeldが発表したものであろう。

医学と公衆衛生の分野では、因果関係について実用的な概念を採用することが妥当であると思われる。医学や公衆衛生の分野では、因果関係について実用的な概念を採用するのが妥当だと思われる。したがって、ある要因への曝露が同様に減少したときに、その疾病の発生率が減少する場合、その要因は疾病の原因として定義されることがある12。

疫学者が因果関係を主張する際の「換金性」を重視する姿勢は、現在のRPOA提唱者の態度にも表れており、介入可能な要因に注目することを提唱している。

2つ目のヒントは、因果関係に対する反事実的なアプローチである。1970年代から80年代にかけて、David Lewisのような哲学者は、反事実に明確な意味を持たせ、因果関係の分析に利用しようとした13-16。

パールは、因果関係が数学化されていると主張しているが10,前述のように、疫学におけるRPOAの提唱者よりも因果関係の主張に対してより包括的な態度をとっている。パール氏のフレームワークは、ルイス氏の哲学的研究と直接的かつ明確な関係がある。第一に、「do」演算子は、非現実的な出来事についての話を許容する哲学的な環境でのみ意味をなすものである。第二に、パールの有向非環状グラフ(DAG)は、ルイスと彼の学生が開発したニューロン図と外観も操作も似ている。ただし、より明確な規則に支配され、変数が数値を取ることができるようになっている。パールの最も顕著な哲学的貢献は、因果関係に対する反事実的アプローチと確率的アプローチを結びつけたことである。これにより、競合する仮説間の検証可能な差異を導き出すことができると期待されている。RPOAでは、一部の疫学者はさらに一歩進んで、因果関係の仮説を正確に表現するためのフレームワークとしてツールキットを使用し、このフレームワークで表現できない因果関係の主張は、疫学的には全く定義された因果関係の主張ではないと主張している。

哲学者たちは、反事実の概念の意味的解釈について詳しく、長く議論していた13,22。しかし、疫学者たちは、反事実の認識論、すなわち、反事実がどのように因果関係の評価につながるのかということに関心がある。これが、「潜在的な結果」という言葉が好まれる理由かもしれない23。同じ個人に対して2つの異なる治療法(曝露レベル)を行った場合の結果について知識があると想像するだけで17,「可能世界」という哲学的な複雑さを避けることができる。

RPOAのファミリーツリー

RPOAを因果関係の理論の「家系図」の中に位置づけると便利である(図1)。一番上のレベルには、因果関係に対するいくつかの広範な概念的アプローチがあり、差延理論、規則性理論、確率的アプローチ、特異性アプローチ、性質分析などが含まれる。これらのアプローチはいずれも哲学的な文献で広く取り上げられている。役に立つ最新のガイドとしては、Oxford Handbook of Causationがあり、これらすべてについて議論されている24。

図1 疫学で提唱されているRPOA(Restricted Potential Outcomes Approach)を、因果関係に関する理論の家系図に当てはめたもの。

RPOAは、因果関係の差異形成理論のファミリーの一つであり、原因はその結果に差異をもたらす事象であるという考えを共有している。つまり、原因が(問題となっている理論で規定されている何らかの意味で)異なっていたり、なかったりしたら、結果も異なっていたり、なかったりしただろうという意味である。

違いを生み出す理論の中には、家系図の次の「レベル」に当たる3つの大まかな考え方がある(これらのレベルには特別な意味はなく、図中の線は、様々な哲学的見解がどのように関連しているかを理解するためのヒューリスティックな助けに過ぎない)。例えば、「彼女が肥満でなければ、心筋梗塞にならなかっただろう」といったものである。第二に、因果関係は原因と結果だけの関係ではなく、原因、結果、原因に対する対比、結果に対する対比の四者関係であるとする対比主義がある25。第三に、因果関係の概念は介入の概念と密接に関連しているとする介入主義の考えがある26。対比主義者と介入主義者は、因果関係を考えるには、検討されている対照的な状態について明示的に考える必要があるという考えを共有している。これらの見解は、反事実的な条件式を支配する意味論に基づいて、原因がない場合に何が起こるかを決定させる反事実的な見解(この見解と誤って混同されることがある)とは異なる。介入主義者と対照主義者の見解は、対照主義者が意味論的なテーゼ、つまり因果関係の主張の意味についての理論を提供している点で異なる25。一方、介入主義者は因果関係の推論(推論、説明、予測)における因果関係の概念の使用を説明することに関心がある26。

RPOAは明らかに介入主義者の陣営に属するが、これはまた細分化できる。一方には原理的な介入主義者がいます。彼らは、介入の概念は人間が可能なことに限定されるものではないと考えている。人間が地震を起こすことはできないが、それでも地震は介入になりうる。より限定的な介入主義者の考え方は、人間的に実現可能な介入主義と呼ぶことができる。これは、原因は人間が実際に行うことのできる介入に対応するという考え方である。疫学におけるRPOAはここに位置している。これに対し、ジェームズ・ウッドワードのような原理的介入主義者にとっては、地震を反事実的な因果関係の歴史の一部として想像することは容易である。

実際、一般的なPOAは、人間が実現可能な介入主義に論理的にコミットしていないが、RPOAの提唱者は、このコミットを前提とする傾向がある。なお、上述したように、より一般的なPOAは、POAのどのバージョンを採用するかによって、(RPOAのように)反事実主義的アプローチや介入主義的アプローチに含まれる可能性があるため、図には含めていない。例えば、多くのRPOA理論家は、人種と性別が「操作不可能」であることを明らかにしている。

このように、RPOAは非常に特定の哲学的スタンスに大きく賭けている。このスタンスは、無作為化比較試験のみが因果関係を評価できるという視点とほぼ同じであるが、疫学の歴史を振り返ると、因果関係に対するこのような狭いアプローチが有効であったとしても、ほとんどなかったことがわかる29。

セクション2. RPOAが理論的に間違っている理由

このセクションでは、RPOAの理論的不備(および誤り)のいくつかを探る。

実現不可能な介入の問題

科学を実現可能な人間の介入の研究に限定すると、実現可能な人間の介入ではない(あるいは対応しない)原因が明らかに存在するという問題がある。地殻プレートの移動は地震の原因となり、熱波は死者の原因となり、突然変異は薬剤耐性の原因となり、X染色体を2本持って生まれたことは低賃金の原因となる。いずれの場合も、地震がない、熱波がない、突然変異のない細胞分裂、XYの2本の染色体を持って生まれるなど、関連する変数が取り得る完全に良い(反事実的な)値を指定することができる。現時点では、このようなことを実現するための人間の可能な方法はない。しかし、その限界は時間とともに変化する。かつては血中コレステロールに介入することは不可能であったが、今は可能である。例えば、血中コレステロールに介入することは不可能であったが、今は可能である。

このような問題は、人種や性別が原因であるかどうかについての最近の論文7,28でも取り上げられており、人間が実行可能な介入に限定したRPOAの説明がなされている。実際に2番目のX染色体を持つことは、試験の点数が高い、賃金が低い、終身在職権を得る頻度が低いなど、特定の実際の結果と関連している。しかし、試験の点数を向上させたり、賃金をより平等にするためだけに、関連するライフステージで人の性別に介入することは実現不可能である。このため、RPOA理論家は、「もしJaneが男だったら…」という類の先行詞を不明確なものとみなしている。この変化をもたらすような実現可能な介入がないということは、Janeが女性ではないという仮定のシナリオが十分に規定されていないということであり、したがって因果効果を概念化・定量化することは困難であると考えているのである。

このスタンスには2つの難点がある。1つ目は、人間的に実現可能な範囲の境界は鋭くはなく、時間とともに変化する可能性があり、実際に変化するということである。実際、医学研究の典型的な目標は、現在、人間が介入できない原因をコントロールできるようにすることである。高コレステロール血症は、スタチンによる効果的な治療法が登場するずっと前から、心血管疾患の原因とされていた30。現在、BRCA1とBRCA2は介入できない原因であるが、いつの日かこれらに介入する日が来るかもしれない。現在、BRCA1とBRCA2は介入できない原因となっている。将来的には、BRCA1とBRCA2やその生物学的経路に介入できるようになるかもしれないが、高コレステロール血症とBRCA1と2のケースは、どちらも介入できなかった時代があったので、並列している。並行しているのであれば、BRCA1とBRCA2が原因であることになる。このことは、人間が実行可能な介入のみを原因として数えようとする試みの論理的欠陥を示している。その境界線を無視してこそ、医学はその境界線をずらすことができるのである。

実現不可能な介入に対するRPOAの立場から生じる2つ目の問題は、概念化できることとできることが混同されていることである。もしも「もしもジェーンが男だったら…」という言葉に、可能な反事実的価値が割り当てられないという反論があったとしたら、因果関係の主張を反事実的に分析することを主張する枠組みの中では、対応する因果関係の主張は無意味であると主張するのが正しいだろう。しかし、ジェーンのような人が別の性に生まれることを実現できないという事実だけで、ジェーン(より正確にはジェーンの相手)が男性に生まれた世界を想像できないということにはならない。介入がよく規定されている(因果関係の主張がよく規定されているためのPOAの前提条件)ためには、その介入ができることは必要ではない。指定することと実行することは違うのである。人間的な実現可能性へのコミットメントは、RPOAではない方が良いと結論づけている。

「状態」の問題

RPOAアプローチのさらなる問題点は、肥満のような「状態」を原因として適切に扱うことができないことである。HernánとTaubmanは、RPOAの考え方では、肥満を原因として研究することはできないと提案している。

観察研究では、各被験者がBMI20を達成した実際の手順を知ることはできない。したがって、BMI20に割り当てられたときのカウンターファクトの結果…. は、あまりにも曖昧な概念である。反事実上の結果が曖昧であることの直接的な結果は、その反事実上の結果に関わる因果関係の対比が不明確になることである5。

肥満(または高コレステロール血症、高血圧、BRCA1またはBRCA2の保有、男性の性別)のような「状態」が原因と見なされなくなると、これは歴史的に成功した疫学的実践からのもう一つの逸脱である(上記のLilienfeldの引用を参照)。疫学者は、もはや病因の研究者ではなく、介入の研究者でしかないのである。

特異性の問題

RPOAのより深い問題は、人間的に実現可能かどうかにかかわらず、十分に規定された介入の概念に依存していることにある。

HernánとTaubmanは、ある肥満グループのBMIを下げようとした場合、運動や脂肪吸引などの介入方法によって、死亡率に対する効果が異なる可能性があると指摘している5。彼らは、特定の介入方法を念頭に置いてこそ、意味のある因果関係の主張ができると主張している。つまり、年間10万人の死亡が肥満に起因しているとは言えず、肥満の人の10万人の死亡は運動で、5万人は食事で、12万人は組み合わせで、脂肪吸引では全く防げないなどと言わなければならないのである。このことから、HernánとTaubmanは、肥満は明確に定義された原因ではないが、過食や運動不足、あるいはその2つの組み合わせはすべて明確に定義された原因であると主張している。難しいのは、「明確に定義された介入」自体が定義を必要とすることである。介入がよく規定されている場合にのみ因果関係がよく規定されるという主張には多くの困難がある。

第一の難点は、HernánとTaubmanが指定した介入は、彼らが肥満が原因であるという概念に向けているのと全く同じ種類の批判を受ける可能性があるということである。1日1時間の激しい運動(例:ランニング、サイクリング、ラグビー、ボクシング)やカロリー制限の仕方が、死亡率に大きな影響を与える可能性があるのである。つまり、この論文で提案されている議論は、ダブルスタンダードの一例なのである。

関連した2つ目の問題は、ある介入がよく規定されているかどうかが事前にわからないことが多いことである。有酸素運動はすべて同じ効果があるのか、ランニングはすべて同じ効果があるのか、インターバルトレーニングはすべて同じ効果があるのか、などなど。しかし、RPOAでは、例えばランニングが肥満関連死亡率に及ぼす影響についての因果関係の質問が、ランニングがよく規定された介入であるかどうかという質問に答えるまでは、よく規定されているかどうかを判断できない。そして、中距離走とは対照的なスプリント走が、よく規定された介入であるかどうかという疑問に答えるまでは、そうすることはできない。また、100m走と200m走を比較して、100m走が適切な介入であるかどうかを確認するまで、それを行うことはできない。といった具合に、無限に続くのである。介入の仕様に関する無限の質問にまず答えなければ、明確な因果関係を問うことはできない31。

第三に、目標を達成するためには、介入の正確な性質があまり重要ではないと思われる場合がある。このような場合、介入を正確に特定することは時間の無駄となる。高血圧は,さまざまなメカニズム(腎,心,血管)から生じ,メカニズムの異なるさまざまな薬物治療が存在する(利尿薬,カルシウム拮抗薬,アンジオテンシン拮抗薬など)。概して、どのような薬物治療であろうと、高血圧の根本的なメカニズムがどのようなものであろうと、血圧を下げることは望ましい有益な結果をもたらす32。

要するに、状況は正確な仕様にこだわるだけではなく、はるかに複雑なのである。RPOAは、十分に仕様化された介入に適していない因果関係の主張の意味や有用性を認めようとしないため、このような理論的な問題が現実的な問題を生み出しているのであり、それについてはこれから説明する。

セクション 3. RPOAが実際には間違っている理由

前節では、RPOAの因果関係に関する考え方が過度に制限されていることを論じた。本節では、RPOAの因果推論の考え方を否定する。この2つのセクションの議論は互いに依存しているわけではないが、似たような関心事が動機となっており、似たような結論を導き出している。

「悪い」証拠の重要性

RPOAに対する最初の実用的な批判は、事実上、証拠の文脈依存性を無視した方法で証拠をランク付けしていることである。単独では因果関係を示す証拠としては非常に不十分な証拠であっても、因果関係を示す非常に強力なケースを作る大きな構造の要となる可能性があるのだ。

このことは、喫煙傾向が肺がんの発症傾向と「体質的に」関連しているというフィッシャーの体質的仮説が最初に否定されたことからもわかる。この仮説は、青年期から中高年期までの長期にわたる喫煙の無作為化試験によってのみ反論できる。分析的疫学が最も近いと思われるのは、喫煙について不一致のある一卵性双生児を調査することである。このような研究は最終的に実施され、喫煙者に肺がんが多いことがわかったが、議論に影響を与えるには遅すぎた(1996)33。1950年代に体質仮説が実際に否定されたのは、時系列データによる。喫煙が普及したのは20世紀前半である。34,35 肺がんの発生率はわずか数十年の間に増加していたが、20世紀前半には喫煙が普及していた。体質仮説によれば、肺がんになりやすい人は喫煙を始めただろうが、肺がんのリスクを高める「連鎖」遺伝子変異の有病率は変わらなかっただろう。さらに、ある遺伝子変異が数十年の間にこれほどまでに有病率を高めるとは考えられないため、肺がんの人口発生率は安定していたはずである。つまり、肺がんを引き起こす新たな環境因子が導入されたのではないかと考えられたのである。

時系列データは、それ自体では因果関係を示す証拠としては極めて弱い。時系列データはそれ自体、因果関係を示す証拠としては極めて弱いものであり、RCTのように仮想的な介入を模したものではない。しかし、この状況では、喫煙仮説の証拠として不可欠なものであり、対立する説明である体質仮説に対する非常に優れた証拠となってた。36 この例は、証拠を「ランク付け」しようとする粗雑な試みの危険性を示している。因果関係を評価するための証拠の価値は、文脈に依存する。RPOAはこの点について何の規定もしていない。

代替案を排除することの重要性

ある仮説に対する科学的な議論の中心は、最も妥当性の高い代替仮説を特定し、それらを排除する証拠を見つけることである。この考え方は、哲学者(Karl Popperなど)によってよく研究されている。同様に、Alex Broadbentの疫学における因果推論と予測のモデルでは、「安定した」結果を得るために、代替仮説を排除することを重視している38,39。

疫学者もまた、代替仮説を排除することが仮説を評価する重要な方法であることを指摘している。1959年、Cornfieldは次のように述べている。

重要な代替仮説が入手可能な証拠と適合していれば、たとえその証拠が実験的なものであっても、問題は解決しない。しかし、1つの仮説だけがすべての証拠を説明できるならば、たとえ証拠が観察的なものであっても、問題は解決している。

同様の理由で、オースティン・ブラッドフォード・ヒル1は、9つの因果推論に関する考察を行っている。ヒルによれば、一つの基本的な考え方が極めて重要であるという。

私の9つの視点のいずれも、原因と結果の仮説に賛成または反対の議論の余地のない証拠をもたらすことはできず、また、どの視点も必須条件として要求することはできない。私の9つの視点は、いずれも原因と結果の仮説に対して議論の余地のない証拠をもたらすものではなく、またそれを必須条件とするものでもない。

先ほどの例では、タイムトレンドデータの価値は、まさに代替手段を排除することにある。しかし、RPOAにはこの点に関する規定がない。

三角測量、ネガティブ・コントロール、連動した証拠の重要性

RPOAは、疫学の中心的な課題である、異なる種類の証拠を用いて1つの全体的な評決を導き出すという課題を克服するモデルを提供していない。

疫学の内外で古くから行われてきた戦略の一つに「三角測量」がある。異なるデータ、研究者、理論的アプローチ、手法のすべてがその知見に収束する場合、その知見に対する信頼性は高まる41。例えば、傾向スコアを用いた分析と、全く異なる仮定に基づく道具変数分析で同じ関連性が得られた場合、その関連性の潜在的な因果関係は強く支持される42。

陰性コントロールは、Cornfieldの「競合する説明」の評価と定量化に役立つ。負のコントロールには主に、曝露コントロールと結果コントロールの2種類がある43。 興味深い例として、喫煙習慣が妊娠結果に影響を与えることが分かった。これは、喫煙している妊婦の他の特徴によるものではないかと主張されるかもしれない。負のコントロールを用いた研究がRPOAの原則に基づいて構築されているとしても、負のコントロールを使用するという考えや、どのような負のコントロールが最も価値があるかは、RPOAの原則からではなく、背景知識から生じるものである。

エビデンスの連動は、疫学が他の科学のエビデンスを参考にするときに起こる。1959年に発表された喫煙と肺がんに関する論文では、著者は疫学データだけでなく、病理学(喫煙者の肺に発生した癌と上皮細胞の機能不全)動物実験(皮膚に付着した高用量のタバコのタール)発がん物質としてのタールの人間による観察(煙突掃除人)などの他の証拠を検討した34,35。喫煙が肺がんを引き起こす理由を生化学的に説明する一つの例として、タバコの煙に含まれるベンゾ[a]ピレンが培養肺細胞のp53抑制遺伝子の変異ホットスポットに結合することが試験管内試験で発見された45。しかし、これだけでは因果関係を証明することはできない。喫煙と肺がんの疫学に関する知識がなければ、このような生化学的研究を行っても意味がないだろう。因果関係の推論には、特定の研究のデータを超えて、2つの異なる科学分野のメッセージを1つの補完的な物語に統合する必要がある。

因果関係の仮説の評価に関連する可能性のある証拠の巨大なフィールドを考慮すると、因果関係の問題を方法だけで解決できるというのは幻想である。哲学者のスーザン・ハックは、クロスワードパズルの例えを用いて、様々な分野から得られた特定の知見を既存の知識に統合するという考え方を説明している36。また、証拠の三角化と連動は極めて実用的であり、例えば、IARCによる発がん性物質の評価では、動物実験、機械的推論、様々な種類の疫学を組み合わせている47。

これらのアプローチはRPOAに適合するか?

我々は、証拠の重要性は文脈に依存し、代替案を排除することが因果推論の中心的な方法であることを主張してきた。三角測量(負のコントロールなど)と連動したエビデンスを用いることで、観察研究がRCTを模しておらず、想定される介入を明確に特定していない場合でも、代替説明を排除することで非常に強力な因果推論を行うことができる。RPOAは、因果推論に不可欠な特定の研究デザインと分析に焦点を当てている。RPOAは、全体像の中での「悪い」証拠の価値を説明することはできない。また、証拠の三角測量や連動したフレームワークを構築する方法や、そのようなフレームワークがいかに強力であるか、あるいは代替案を除外することの重要性についても説明していない。

このように、RPOAは、疫学における因果推論の実践と理論の両方に不適切な因果推論の見解を提供している。実際には、RPOAは「許容できる」証拠の種類を不当に制限し、その結果、疫学者が問うことのできる質問の種類を制限することになる48。

セクション4. 実践的多元主義

疫学者にとってのより良い選択肢は、因果関係の概念に関する実用的な多元主義を採用することであると我々は主張する。

因果関係の概念と因果関係の性質を区別することは有益である。疫学においては、因果関係の性質について強い哲学的立場をとることは必要ではないし、有用でもない。しかし、疫学者は因果関係の概念を使用する必要があるため、因果関係の概念を扱う必要がある。我々はGlymourとGlymourに倣って、RPOAは他の概念を犠牲にしてある特定の因果関係の概念にしがみついていると理解する。

因果関係には、介入して問題を解決するための公共政策を立案する際に用いられる反事実的/介入主義的な概念と、解決すべき問題を特定する際に用いられる歴史的な、より正確には病因論的な概念がある49。

GlymourとGlymourの見解の結果として、高血圧、高コレステロール血症、糖尿病などの「状態」を原因として研究することができ、これは疫学と生物医学における長年の成功した伝統に合致している。

このように、因果関係の概念に関しては、多元的なアプローチを推奨する。疫学者は、因果関係について様々な考え方があることを認識し、目の前の疫学的問題に最も適していると思われるアプローチを用いるべきである。時には、「この因果関係と思われる効果は、どのような介入に関連しているのか」と問うことが明らかになり、役に立つこともあるが、時には、不要であったり、無関係であったり、役に立たないこともある。因果関係の概念に関する多元主義は、まったく議論の余地がないわけではないが、因果関係の性質に関するいかなる見解よりも、はるかに哲学的な制限が少ない。

因果関係の性質については、すでに「因果多元論」と呼ばれる見解が存在する51。しかし、ここで言う「実用的な多元主義」とは異なる。なぜなら、疫学者が因果関係の性質についてスタンスを取る必要はないと考えているからである。我々の実用的な多元主義は、因果関係の性質についての静寂主義と、因果関係の概念についての多元主義を組み合わせたものである。疫学者は、特定の哲学的見解(特に困難さが確立されているもの)に全面的にコミットするのではなく、因果関係の本質が何であるかについて心を開いておくべきであり、どのような哲学的理論に出会っても、最も有用と思われる概念を用いて作業を行うべきである。

パールの構造的因果モデル(SCM)の枠組みは、POAやRPOAよりも広いことに注意してほしい。パールは、ルイス、サップス、ウッドワード、ダウィドなどの意見がこのフレームワークで表現できると主張し、SCMのフレームワークを統一的に主張している52。そうであれば、SCMによってプラグマティックな多元主義の必要性がなくなるのではないかと思うかもしれない。また、SCMのフレームワークでは反実例を本質的に利用しているが、多くの疫学者、統計学者、哲学者などは、反実例分析のみに基づいた因果関係に関する理論が「完全」であり、疫学における因果関係のすべての可能な状況やアプローチをカバーできるとは考えていない49。

また、RPOAのツールが広範なアプローチと共通していることに反対しているわけでも、その有用性を疑っているわけでもないことを再度明確にしておきたい。むしろ、RPOAが因果関係を評価するための唯一の、あるいは最良のツールであると主張することに異議を唱えているのである。RPOAの概念は、因果関係の単一の枠組みの中で、単一の分析研究を設計、分析、解釈することを考える上で貴重なものである。

おわりに

因果推論は、原理的にも実践的にも、RPOAでは捉えきれない、あるいは説明できない特徴を示し続けるだろう。すなわち、部分の総和以上の価値を持つ絵の連動によって代替仮説を排除し、個々の弱い証拠が重要な役割を果たすこともある。RPOAでは、研究の中で因果関係を問う質問をどのように行うかに焦点を当てている。しかし、1つの研究から因果関係が証明されることはほとんどない。せいぜい1つの研究が決定的なものとなるのは、ある種の証拠的な背景があってのことであり、それがなければ決定的なものとはならないかもしれない。証拠の価値は、状況に応じて変化し、研究の性質だけに依存するものではない。重要な因果関係の問題は、研究内ではなく、研究間で問われる。

理論疫学が進歩し、実務が改善されたとしても、ミスマッチは残る。グリーンランドはこう言う。

正確な因果推論や効果推定を行う上での主な課題は、多くの場合、多様でバラバラな証拠を統合して、まだ観察されていない対象への予測を行うことである。このプロセスは、現在使用されている正式な因果推論の方法論には当てはまらない。….54

「ぼろぼろの証拠」は、疫学が生きていくための環境である。F1カーは、レース場という理想化された環境では最高かもしれないが、それ以外のほとんどの状況では役に立たないので、「最高の」車というのは誤解を招く恐れがある。疫学生には、ありえないほど理想化された世界でしか通用しない方法を称賛するのではなく、荒れた証拠の世界に対処する方法を教えるべきである。将来の疫学者は次のことを学ぶべきである。

  • (i) 因果関係の推論は、多様な種類の証拠の統合に基づく判断であること、
  • (ii) 三角測量、負のコントロール、他の種類の科学からの証拠の連動など、代替案を排除して因果関係を評価するための多様な戦略、
  • (iii) 理想的な反実在の状況に合致しないデザインを含む、あらゆる種類の疫学研究デザインの要素、
  • (iv) 例えば、有病者の追跡調査や、動的な集団における症例対照研究の設定などにおいて、潜在的なバイアスが問題となるかどうかを批判的に検討すること55。

そうしないと、新しい世代の疫学者は、理想化されたRCTに近いデータが存在する場合を除いては、どんな問題も解決できないと考え、他の方法を使うことをためらうようになるかもしれない。

結論として、因果関係の推論には、原理的にも実践的にも、今後も多様な知識を統合することが必要である。1つの研究が決定的になるのは、せいぜいある種の証拠の背景があってのことであり、それがなければ決定的にはならないかもしれない。我々は常に、複数の、できれば多様な研究を必要としており、それは多くの場合、科学の様々な分野からのものであり、また、(代替)仮説の結果としての証拠に関する研究も必要となる。科学的および公衆衛生的な意思決定においては、ブラッドフォード・ヒルの視点に例示されているように、利用可能なすべてのエビデンスを考慮すべきである1。具体的には (ii) RPOAは、RPOAに「適合しない」アプローチがどのように機能するかを説明できないため、疫学における因果推論の規範的説明としては不十分である。(iii) 因果推論に対する他の様々なアプローチが利用可能であり、うまく利用されてきたが、それらはRPOAのような大げさな主張をしているようには見えず、RPOAとは両立しない。

科学的プロセスは、RPOAのアプローチよりもはるかに厄介で、興味深く、生産的である。現代の因果推論理論は貴重であるが、それだけでは十分ではない。したがって、我々は因果関係についての多元的な見解と因果関係の評価を継続的に使用することを提案する。

キーメッセージ

  • 21世紀の理論疫学で主流になりつつある「因果推論」運動は、自らを「反事実主義」と呼んでいるが、実際には因果関係に関する反事実主義、介入主義、対照主義の考え方を組み合わせたものである。
  • 因果関係を考える上で不十分な根拠となっているのは、一つの哲学的(サブ)スクールに限定され、疫学の実践において関連性があり有用であることが示されている因果関係に関する他の概念が犠牲になっているからである。
  • また、因果関係を評価するために多様な種類の証拠を統合する必要性を考慮していないため、疫学や生物医学における実践的な因果推論の基盤としては不十分である。
  • 新しい「因果推論」の手法は、複雑な疫学的問題を解決するためには有用であるが、これらは特定の環境における特定の問題に適用されるものであり、疫学を教えるための基盤としては不十分である。
  • 疫学の教育は、因果関係に関する一つの学派に固執するのではなく、問題の解決策を見出すことに根差したものであるべきであり、疫学者が考え、教え、活動するためには、因果関係に関する「実際的な多元主義」が必要である。
この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー