エビデンスに基づく医療における判断力不足

強調オフ

EBM・RCT

サイトのご利用には利用規約への同意が必要です

Underdetermination in evidence-based medicine

カナダ・オンタリオ州トロント、トロント大学医学部、科学技術史・哲学研究所、MD/MA学生

キーワード

基礎科学、臨床研究、Duhem-Quine論文、根拠に基づく医療、科学哲学、無作為化比較試験、過小評価

要旨

本稿では、エビデンスに基づく医療(EBM)の認識論が持つ哲学的な意味を、Duhem-Quine論文で示された「エビデンスによる理論の過小決定」の問題という観点から検討する。EBMのエビデンスの階層は、基礎科学よりも臨床研究に偏っており、過小決定の問題を悪化させている。深刻なunderdeterminationのために、EBMは病気や治療法の理解の基礎となる中核的な医学的信念を意味のある形で検証することができない。その結果、EBMは基礎生物学からの説明に懐疑的な認識態度をとり、集団レベルでの疾患の見方に追いやられてしまう。EBMの認識論的態度は、疾患のメカニズムを理解し、新しい治療法を開発するための知識を統合するために必要な理論的フレームワークの開発を妨げることにより、限られた研究ヒューリスティックを提供する。医学の認識論は、基礎科学と臨床研究の補完的なアプローチを含む多元的なものであるべきであり、EBMのヒエラルキーがもたらす限定的な認識論的態度を回避するものである。

出版のために受理された。2014年7月18日

はじめに

EBM(Evidence-based Medicine:根拠に基づく医療)は、医療の分野で大きな影響力を持っているが、同時に多くの論争を引き起こしてきた。本論文は、EBMに対する哲学的批判であり、EBMのエビデンスの階層化によって生じる認識論的問題を、Duhem-Quine論文で明確にされた「エビデンスによる理論の過小決定」という問題の観点から検討する。EBMのエビデンス階層は、基礎科学よりも臨床研究を優遇し、システマティックレビューやランダム化比較試験(RCT)を好む一方で、「生理学的研究」や「ベンチリサーチ」を最低レベルのエビデンスとみなしている[1,2]。Scott SehonとDonald Stanleyは、クインのテーゼを医学に応用し、EBMはクイン的な「パラダイムシフト」ではなく、基礎科学の手法を補完しながら、クイン的な「信念の網」を探るための一つのアプローチを提供するものであると主張している[3]。ここでは、この分析を拡張し、EBMの認識論的態度に対する過小決定の意味に焦点を当てている。私は、EBMのエビデンスの階層化が過小評価の問題を悪化させ、病態生理や病気の病因に関する知識を排除する姿勢につながり、医学研究に限定的なヒューリスティックを提供することになると主張する。

デュエム・クインの論文は、臨床試験がいかに理論を過小決定し、医学の中核的な信念を完全に検証する意味を持たないかを示している。重度の過小評価は保守性を伴うが、これはEBMが医学理論に懐疑的であり、疾患を集団レベルの統計的な関連性として捉えることを説明している。このような認識論的態度は、医学研究に限界をもたらす。病気のメカニズムや治療法に関する核心的な信念を探ることができないため、EBMは、仮説の生成や新しい治療法を開発するための知識の統合に必要な理論的枠組みを生み出すことができない。臨床試験は医学研究の重要な要素であるが,臨床試験は医学知識の唯一の認識権威ではないし,単一の研究ヒューリスティックとしても有効ではない。この議論は、EBMの決定されていない認識論に起因する懐疑的な立場を避けるために、医学は臨床研究と基礎科学の補完的なアプローチを採用すべきであることを示唆している。

過小決定の問題とDuhem-Quineの仮説

Duhem-Quine論文は、現代の科学哲学において最も影響力のある概念の一つである。このテーゼは,フランスの物理学者・哲学者であるピエール・デュエムとアメリカの哲学者であるWVO・クインが独立して提案した2つの別個のテーゼを組み合わせたものである[4-6]。デュエム-クワイン論文は,経験的証拠だけでは科学理論の受容・拒絶の根拠として不十分であり,それゆえに世界についての我々の信念を過小決定してしまうために生じる,証拠による理論の過小決定の問題を扱っている。本論文では、仮説は単独では観察や実験によって検証できず、むしろ理論群の一部としてのみ検証されるため、結果として経験的データが理論選択を過小決定することになると主張する。ここでは、まずDuhemとQuineの考え方を別々に検討し、これらの概念がEBMの認識論的態度を評価するのに役立つことを示したい。

理論的なグループ(un ensemble théorique)という概念は、Duhemによって提案された[4]。Duhemは、実験は「単独の仮説」ではなく「理論的なアンサンブル」をテストするものであるため、反証する結果はアンサンブル全体を疑うだけであり、どの特定の仮説を修正すべきかを示すものではないと主張した。

実験が事前に設定したものと一致しない場合、そのアンサンブルを構成する仮説は受け入れがたいものであり、修正しなければならないことがわかるが、どの仮説を修正すべきかはわからない [4]。

デュエムのテーゼを医学に応用するために,仮想的で単純化された例を用いて説明しよう。医学における理論群Tには、仮説が含まれている場合がある。T1「病気Xは病理学的プロセスYによって引き起こされる」、T2「治療Zは病理学的プロセスYを標的とする」、T3「治療Zは病理学的プロセスYを無効にする」。しかし、理論群に含まれなければならない補助的な仮説もあり、これをAと呼ぶことにする。

modus ponensにより、理論群Tが真であれば、ある実験観察が続くと推論することができる。T → O, ‘Treatment Z cures disease X’, 同様に modus tollens により、’Treatment Z does not cure disease X’ ならば、¬O → ¬T となる。しかし、この実験では、理論群のどの部分が反証されたのか、どの理論を一致して修正すべきなのかがわからない。したがって、ある臨床試験で反証となる結果「¬O」が得られた場合、理論群を構成する仮説「T1」「T2」「T3」や補助的な仮説「A」のいずれかを否定することができる: ¬O – ¬(T1、T2、T3またはA)。集合(T1、T2、T3、A)のうち、どれが偽であるかを特定することができない。我々の信念のどれを修正すべきかを教えてくれる論理的な要素はない。したがって、証拠は理論を過小決定する。

デュエムのテーゼは、EBMの認識論において過小決定の問題が特に深刻な理由を理解するのに役立つ。臨床試験では、補助的な仮説の数がはるかに多いため、より大きな理論群をテストすることになり、その結果、我々の信念を修正するための論理的な根拠が少なくなるのである。例えば、臨床試験で検証される理論群には、次のような補助仮説が含まれる。例えば、臨床試験で検証される理論群には、A1「試験では適切な投与量が用いられた」、A2「患者は治療を遵守した」、A3「患者は結果に影響を与える併存疾患を持たなかった」、A4「治療群と対照群の患者のベースライン特性は類似していた」などの補助的な仮説が含まれる。臨床試験の結果が偽りであった場合、検証されているより中核的な医学理論に加えて、これらの補助的な仮説(A1、A2、A3、A4など)に対する我々の信念が修正される可能性がある。

例えば、大規模なRCTであるISEL試験では、非小細胞肺がん(NSCLC)の治療に上皮成長因子受容体(EGFR)阻害薬であるゲフィチニブを使用することを検証し、対照群と比較して生存期間を改善しないことを示した[7]。この改ざんされた結果に直面した著者は、否定的な結果を説明するために補助的な仮説を立てた。A1、「ISELで有意な生存ベネフィットが得られなかったのは、最適ではない投与量によって説明されるかもしれない」、A2、「試験地の地理的な位置が試験結果に影響を与えたかもしれない。A3「ISELに参加した高度難治性疾患の患者は、本質的にいかなる治療にも反応しなかった可能性がある」など。[7]. この偽装結果は、NSCLCの病理学的プロセスを阻害するゲフィチニブの有効性に関する、より核心的な仮説を否定することにもなる。実際、ISELで測定された有意ではない主要な結果により、ゲフィチニブは「効果がない」ことが「証明された」と考えられるようになった[8]。しかし、この結論は、全集団における生存期間を測定した本試験の主要評価項目によって決定されたものではなかった。ゲフィチニブは実際には一部の患者に有効であったが、主要エンドポイントが有意に達しなかったため、ゲフィチニブは有効ではないと判断された。ゲフィチニブが有効であるという中核的な仮説を否定するのではなく、有意でない一次エンドポイントは、RCTが適切な患者集団に対して実施されたという補助的な仮説を否定するものである。

実験室での研究では、かなりのコントロールが可能であるため、補助仮説はまだ存在しているが、比較的少なくなっている。EBMが「ゴールドスタンダード」としてRCTを重視するのは、臨床研究に実験室のようなコントロールを導入し、交絡変数の可能性を排除しようとする試みであると考えられる。交絡変数の存在は、検証される補助的な仮説の数を増やし、その結果、過小評価の度合いを高めることになる例えば、患者の服薬アドヒアランスの違いというよく知られた交絡変数は、臨床試験の結果が治療群間のコンプライアンスの違いによるものであるという、さらなる補助仮説をもたらす[9]。RCTでは、アドヒアランスの測定、除外基準、層別化、無作為化を用いて、特定の交絡変数を最小化することで、試験対象となる理論群の規模を小さくすることができるが、臨床現場の複雑さを考えると、過小評価は依然として広範囲に及ぶ。無作為化によって、盲検化によって選択バイアスが除去されたという補助的な仮説を排除することはできるが、無作為化によってすべての補助的な仮説を排除することはできない[10]。EBMが推進する臨床研究では,試験の方法論や臨床現場の複雑さをめぐる補助的な仮説が追加されるため,医学理論の論理的基礎を提供するには不向きである。一方、実験的手法を用いた基礎科学は、医学的知識の核となる疾患の病態生理や治療薬の薬理学を解明するのに適している。

デュエムは、過小評価を実験物理学の分野に限定して論じた。興味深いことに、デュエムの哲学はクロード・ベルナールの実験生理学から深い影響を受けている。ベルナールは『実験生理学序説』(1865年)の中で、実験室を中心とした医学の実験方法を主張している。

私は病院を科学的な医学の前庭としてしか考えていない。
医師が最初に入るべき観察の場であるが、医学の真の聖域は実験室である。
彼はそこだけで、実験的な分析によって、正常な状態と病的な状態における生命の説明を求めているのである[11]。

デュエムはベルナールに感銘を受け、「experimentale contrôle expérimentale n’a pas en Physique, la même simplicité logique qu’en Physiologie」と信じていた[4]。彼は、実験生理学では、研究者が実験条件を完全にコントロールして理論を分離して検証することができるので、過小決定の問題は生じないと考えていた。しかし、デュエムはこの点を誤解していた。過小決定の問題は何度も解決できないものであり、実験生理学においても問題となる。この点は、後述するクワインの全体的過小決定のテーゼが明らかにしている。しかし、デュエムの指摘は、管理の行き届いた研究においては、過小決定の問題はそれほど深刻ではないことを認識しているという点で重要である。つまり、実験生理学の手法を用いて医学の中核的な仮説を検証することは、実際にははるかに単純なことなのである。

不確定性への対応

臨床研究には医学の核心的な信念を決定する能力がないことを理解することで、EBMの認識論的態度を説明することができる。この説明のためには、Quineのテーゼを検討することが有用である。Quineの過小決定に関する見解は、Duhemのテーゼをより強くしたものと理解できるが、異なる推論を用いて独自に定式化されたものである。クワインは、過小決定の問題は、物理学に限らず、科学全般に適用されるものではなく、我々の知識のすべてに適用されると考えている。

我々のいわゆる知識や信念の総体は,地理や歴史の最もカジュアルな事柄から原子物理学の最も深遠な法則,さらには純粋な数学-ematicsや論理学の法則に至るまで,人工的に作られた布地であり,それは我々の経験に縁に沿ってのみ影響を与えるものである [5].

クインは、どのような観察も、我々の知識や信念の全体的な「場」のどのような側面にも対応する修正を引き起こすことができると主張している[5]。クインによれば、我々の信念の場にあるいかなる理論も修正の対象となるが、同時に、いかなる理論も経験に照らして一定に保たれ、他の信念を調整することで対応することができる。クインにとっては

全体的な場は、その境界条件(経験)によってあまりにも決定されていないので、ある一つの反対の経験に照らしてどの記述を再評価するかについては、かなりの選択の余地がある [5]。

SehonとStanleyは、EBMは我々が信じる医学の分野の周辺部と中間部の間で機能していると主張しているが、これはEBMの認識上の限界を正確に表していると思う[3]。実際、アイセル試験の例に示されているように、分野の中核(すなわち、NSCLCの病態生理に関する我々の理解)は、EBMによってあまりにも過小決定されているため、その証拠によって基礎理論を調整するための論理的根拠を得ることができない。

全体的な決定力不足は、おそらくDuhem-Quine論文の最も重要なインパクトである、世界についての我々の信念を決定する上での系外の要因の役割を導入することにつながる。デュエムは、決定力不足の観点から、理論選択は科学的直観によって導かれるべきだと主張していた[4]。クインは、理論の選択は心理的保守主義に支配されると考えており、それによって我々は経験に最も「関連する」信念の分野の部分を修正することを選択するのだと考えていた[5]。したがって、実験結果や観察結果が否定されるような事態に直面した場合、我々は心理的に、自分の信念の分野の中心に近い仮説を否定するよりも、周辺に近い仮説を修正する傾向がある。

トーマス・クーンのパラダイム間の非整合性の概念は、証拠による理論の過小決定の問題として理解できる。クーンは、パラダイム間の理論選択には、「正確性、一貫性、範囲、類似性、実利性」といった科学界の外在的価値が重要な役割を果たしていることを示唆していた[12]。クーンの研究は、彼自身が大いに落胆したように、我々の科学的信念を決定する上で、権力、人種、ジェンダーなどの社会論理的要因の役割に注目する動きに影響を与えた。ラリー・ローダンは、この「認識論の社会学化」を批判し、演繹的論理以外の認識論的考察が理論選択を決定しうると主張している[6]。医学における理論選択の決定に社会学的要因が果たす役割は、特に過小決定が広範囲に及ぶEBMの文脈においては、興味深いテーマである。重度の過小決定のために、EBMの信念は他の認識論的アプローチよりも社会的な影響(それが経済的なものであれ、ジェンダーに関連するものであれ、文化的・人種的なものであれ)を受けやすいという可能性がある。実際、EBMに対する批判は、その知識の主張がいかに特別な利害関係者の影響を受けやすいかに焦点を当ててきた[13]。

クインに倣って、私は、深刻な過小決定がなされている場合、EBMの実践者は保守主義の態度をとると主張する。EBMの支持者は自分の研究方法に自信を持っており、うまく実施されたRCTの結果が出ても、研究デザインに関する補助的な仮説を修正する必要はないと考えている。また、RCTはそのような補助的な仮説を適切にコントロールしていると信じているので、結果が否定されてもこれらの記述は修正されることはない。臨床研究は、特定の状況下で特定のエンドポイントをもたらす治療法の有効性に関する中間的な仮説を調整することはあっても、病気の病因や治療法のメカニズムなど、医学知識の「なぜ」と「どのように」に関する中核的な理論を修正することはできない。

この点については、腫瘍学の文献に別の例がある。INTEREST試験では、標的EGFR阻害剤であるゲフィチニブによる治療と細胞毒性化学療法であるドセタキセルによる治療を比較し、NSCLC患者の全生存期間に対する2つの薬剤の影響が同等であることを示した[14]。しかし、この結果に基づいて、ゲフィチニブとドセタキセルが同等であると結論づけることは、両薬剤が異なるメカニズムで作用することを認識していない[8]。薬剤の作用機序の違いは、臨床試験の結果によって決定されるものではない。どちらの薬剤を使用しても患者の全生存率は同じであったため、このような違いは重要ではないと主張する人もいるかもしれない。しかし、メカニズムの違いは、なぜ薬剤が異なる集団を標的とするのかを理解する上で重要であり、これは臨床的にも重要な知識である。ゲフィチニブはEGFRに変異のある患者を標的とするが、ドセタキセルはEGFR野生型の患者に高い奏効を示す。腫瘍学では、病態生理学や薬理学の知識を過小評価するRCTの粗い経験主義的なアプローチによって、重要な観察結果が見落とされる可能性がある例がさらにある[8]。Richard Ashcroftが指摘するように、RCTは「なぜ治療が有効なのか(そしてなぜそうでないこともあるのか)という、科学的にも認識論的にも困難な疑問の全体像を覆い隠してしまう」[15]のである。RCTは、「治療が効くかどうかを説明するために、より深い生物学的理論に訴えることなく、治療が効くかどうかの問題を解決しているように見える」[15]。これらの中核となる理論は、その前提となる証拠の形によって決定されないため、EBMは医学知識のそのような側面を避けている。

EBMと基礎科学

重度の未決定に対応するため、EBMは基礎科学や機械的な推論に対する懐疑を特徴とする経験主義的な態度を採用している[16]。哲学では、経験主義と合理主義が対立している。経験主義者は経験から知識を得るのに対し、合理主義者は第一原理から推論して知識を得るのである[17]。Robyn BluhmとKirstin Borgersonは、医学哲学においては、合理主義と経験主義は、異なるレベルで適用される2つの経験主義的アプローチとして理解するのが良いと論じている。合理主義者は、経験的に調査する病態生理学の基本的なメカニズムを理解しようとするのに対し、経験主義者は、平均的な患者における有効性を決定するために集団レベルで活動する[16]。この有用な区別は,合理主義と経験主義の両方が医学の認識論においていかに重要な役割を果たしているかを示す助けとなり,EBMの認識論的態度の欠陥を浮き彫りにしている。

EBMは、その哲学的な系譜を、19世紀にパリで生まれた医学的経験主義に求めている[18]。ピエール・シャルル・アレキサンドル・ルイは、パリの医学校の著名な経験主義者で、「数値計算法」を開拓し、初期の臨床研究を行った。ジュール・ガヴァレはルイの研究を分析し、統計学的原理である「大量の数の法則」に従って、治療法の効果を評価するには多数の患者を対象とした臨床研究が必要であると主張した[19]。しかし、Gavarretは臨床研究の限界を認識しており、臨床研究には当時の基礎科学である病理学的解剖学の予備知識が必要であることや、疾病の分類学が十分に確立されていない場合には統計的アプローチを適用できないことを認めていた。

経験したことのある病気には、正確かつ詳細な診断が必要である。[疾患の診断が正確に行われていないにもかかわらず、その治療法を明らかにするための優れた統計学の要素を無駄に取り戻そうとすると、そのような作業は間違った結論を導き出すだけでなく、より厳密な検討を必要とする[19]。

Gavarretは、古代人はパリ派が進めた病理解剖の知識がなかったため、統計的手法を効果的に適用することができなかったと主張した[19]。彼は、臨床研究や「la loi des grands nombres」は、原因の有無を解決する能力に限界があり、原因そのものを決定することは、統計の領域外の別の検討事項であることを認めている。

病因が関係している場合、大数の法則の原則は、自然についての仮説とは無関係に、疑わしい特別な原因の存在または非存在を証明するのに役立つだけである。原因そのものを決定しようとするには、別の順序の考察の助けを借りなければならないが、この後者の問題は、統計学の活動範囲外である[19]。

Gavarretは医学的経験主義を推進し、臨床研究を早くから提唱していたが、このアプローチの限界を認めていた。彼は、臨床研究を成功させるためには、基礎となる病理学の知識が必要であることを強調した。さらに、病気の原因を究明するためには、臨床研究以外の方法が必要であることも認識していた。EBMは、パリの医学的経験主義者の哲学的な遺産であると主張しているが、これまで見てきたように、初期の英雄たちの経験主義を超えてきている。ポール・トンプソンはこの問題を探求し、EBMが数学を単なる分析の道具として用い、強固な科学的理解の要件である病気の因果モデルを確立するために数学の言語を使用していないことを示している[20]。

Users’ Guides to the Medical Literatureからの例は、EBMの基礎生物学への不信感を示している。Gordon Guyattらは、男性にはアスピリンが脳卒中予防に効果的であるが、女性には効果的でないことがサブグループ分析で示唆された臨床試験の結果を引用している[1]。その後、この差を検証するためのより大規模なRCTが実施され、この結果は否定された。Guyattらはこの例を用いて、事後的なサブグループ分析がいかに誤った結論をもたらすかを示している。しかし、興味深いことに、最初の臨床試験におけるサブグループ分析の結果は、動物実験を刺激し、男性と女性の間の不一致を確認し、そのメカニズムを示し、男女間の血小板の活性化と薬物動態の違いが原因であることを示唆した[21-23]。しかし,Guyattらは,その後に行われたRCTの結果によって,基礎となる生物学が重要ではなくなってしまった。最初の試験の違いを説明できる生理学的メカニズムがあるかどうかは問題ではなく、十分な数の集団を対象に試験を実施すれば、男女間で観察される差はないのである。

EBMの姿勢は、生物学的な説明に懐疑的であり、その活動を中途半端な空間に限定し、集団レベルでの薬の有効性に関する仮説を修正することまではしない。EBMにとって、動物実験は重要な結果からの単なる目くらましにすぎない。Guyattらは、「人間の心は十分に豊かなので、ほとんどすべての観察結果を裏付ける生物学的に妥当な説明には事欠かない」[1]と書いて、基礎となる生物学を否定している。この発言は,病気や治療のメカニズムに関する医学的理論に対する懐疑的な見方を反映している。しかし、そのようなメカニズムの違いは、臨床的に重要な意味を持つ可能性がある。男女間でのアスピリンの効果の違いや、抗血小板療法への反応が低い患者の集団には重要な違いが残っており、これらの違いについてはさらなる調査が必要である[24,25]。「脳卒中予防のためのアスピリンは、男性でも女性と同様に効果があった」と結論づけ、そのメカニズムを否定することは、臨床的に重要なニュアンスを理解することにはならない[1]。例えば、最近、催眠薬のゾルピデムの場合に示されたように、薬物動態の性差は、投与量に重要な影響を及ぼす可能性があるが、そのような差はRCTでは十分に判断されないことが多い[26]。

より有用な医学的認識論は、合理主義と経験主義の両方のアプローチの重要性を認識している。Jeremy Howickは、EBMにおける基礎科学とメカニズムの役割について書いており、「質の高いメカニズム的推論」が臨床的証拠と結びついたときに主張の強さを向上させることを認めている[13]。しかし、Howickは、例えば、心筋梗塞後の患者の心臓突然死を減らすために抗不整脈薬を使用したところ、死亡率が上昇したというように、メカニズム上の推論が失敗した治療法につながった例をいくつか強調している。このように、Howickは、RCTで検証される理論的枠組みと仮説を生み出す上での基礎科学と機械的推論の重要性を最小限にしている。Howickは、逸話的な経験に基づいて「観察的」に導き出された仮説は、「基礎科学からの仮説を検証するよりも実用的な利点がある」と主張している[13]。基礎科学は通常、現在使用されていない治療法に関する仮説を生み出す」のに対し、「すぐに使える逸話的証拠」から治療法を検証することは、現在の使用を奨励したり阻止したりすることで、より即効性のある利益をもたらす[13]。このような粗野な経験主義的アプローチでは、我々が持っている治療法は、現在利用可能なものと、逸話的な症例報告から生まれたものに大きく限定されてしまう。Howickは、治療法の開発における基礎科学の重要性を軽視しており、「機構的な発見」が臨床的に適切な治療法に結びつく割合は低いという研究結果を引用している[27]。基礎科学研究の翻訳を割合で定量化すると、1つの治療法の開発が与える影響の大きさを認識できない。この研究では、基礎科学が臨床上の利点を生み出した1つのケースとして、アンジオテンシン変換酵素阻害剤の開発が挙げられる。アンジオテンシン変換酵素阻害剤は、高血圧だけでなく、他の心血管疾患や腎疾患の治療にも多大な影響を与えており、米国では5番目に処方されているクラスの薬剤である[28]。Howickは、基礎科学を「仮説を生み出すための高価な方法」と見なしているが、医学研究における機械的推論の重要性を認識しておらず、EBMの認識的態度の本質的な弱さを明らかにしている[13]。

医学研究への影響

EBMの階層は、我々の医学的信念の分野の核心を過小評価した証拠を支持し、その結果、病気の病態生理に懐疑的な認識態度をもたらす。このような態度は、知識を統合し、新しい治療法を開発するために必要な理論的枠組みを無視しているため、医学研究を制限することになる。EBMの初期の提唱者は、この動きを「新しいパラダイム」と宣言し、「基礎科学と疾病メカニズムの知識」に過度に依存していた「旧来のパラダイム」に取って代わろうとしている[29]。臨床的な意思決定を改革することに加えて、EBMは、他の研究方法よりもRCTへの資金提供を好むように、将来の研究の方向性に影響を与えようとした[30]。研究の分野では、EBMが「パラダイム」という言葉を選んだことは、特に厄介な意味合いを持っている。クーンによれば、パラダイムはすべてを包含するものであり、研究者が行う質問の種類や、自由に使える方法を決定するものである[31]。EBMは、適切な知る方法を指示し、特定の認識論的視点を推奨しているが、これは実りある研究のヒューリスティックを提供することにはなりそうもない。

過去1世紀の医学の歴史を簡単に振り返ると、大きな医学的進歩が病気のメカニズムを探ることによってもたらされたことがわかる。疫学的研究も医学に重要な影響を与えてきたが、治療法の進歩には病気の病因に対する基本的な理解が必要であった。医学知識の進歩における基礎科学の重要性を示す典型的な例は,アレキサンダー・フレミングによるペニシリンの偶然の発見である。この発見は,ブドウ球菌とペニシリウムのカビを用いた実験によってもたらされた[3]。最近では,生理学,微生物学,生化学,分子遺伝学,薬理学などの生物科学の進歩により,病気のメカニズムがより深く理解され,多くの新しい治療法が開発されている。

血液学の分野では、 慢性骨髄性白血病 (CML) とその新しい標的治療薬であるチロシンキナーゼ阻害剤イマチニブの例がある。CML の臨床的特徴は、 19 世紀以降、 医師たちによって認識されてきた。ハイドロキシウレア、ブスルファン、シトラビンなどの化学療法剤や、インターフェロンアルファなどの生物学的製剤は、最終的には致命的な疾患であるこの病気の自然史にはあまり影響を与えなかった。1990年代には、骨髄移植が、ドナーが一致した限られた患者に治癒の可能性をもたらす治療法となったが、治療に関連した死亡率が高くなった。

臨床研究では、これらの非特異的な細胞障害性治療の有効性が検証される一方で、基礎科学では悪性化のメカニズムが研究されていた。1960 年、 CML の理解に大きな進展があった。 患者の細胞に含まれる 「微小な染色体」 が確認され、 「フィラデルフィア染色体」 と呼ばれた [32] 。その後数十年にわたり、 細胞遺伝学と分子遺伝学の進歩を背景に、 研究者たちは、 フィラデルフィア染色体が、 構成的に活性化するチロシンキナーゼ BCR-ABL を生成する 2 つの癌原遺伝子が融合した相互転移の産物であることを明らかにした [33-36]。動物実験では,BCR-ABLキナーゼが白血病を引き起こすのに十分であることが示された[37]。このように、これらの基本的なアプローチにより、CMLの病因を分子レベルで特定することに成功した。

病態生理学的なメカニズムがわかれば、CMLの根本的な原因であるBCR-ABLキナーゼを標的とした治療法を開発することが可能になる。1996 年、 研究者たちは BCR-ABL キナーゼの選択的な阻害剤を発見し、 後にイマチニブと名付けられた。イマチニブの腫瘍増殖防止効果と BCR-ABL 発現腫瘍への特異性は、 白血病細胞株で実証された。実際、 観察研究である第 1 相試験では、 イマチニブの安全性と有効性が確認され、 本剤を投与された患者の 98% が完全寛解に達した [39]。イマチニブは迅速な承認を得て、 すべての CML 患者の標準治療となった。CML の場合、 効果的な治療法を開発するためには、 疾患 のメカニズムを理解することが必須条件であった。様々な一般化学療法の有効性を検証する経験的なア プローチは、 CML の治療に大きな進歩をもたらすことが できなかった。

2003 年に行われた RCT では、 イマチニブが、 それまでの標準治療であったインターフェロン アルファとシタラビンに比べて、 CML の生存率を改善し、 進行を遅らせるのに非常に有効である ことが示された [40]。EBM のヒエラルキーに従えば、 この RCT の結果は、 この治療法を信頼するための 「最良の証拠」 を構成していると、 勝ち誇ったように主張するかもしれない。この研究はイマチニブの臨床使用に強力なエビデンスを提供しているが、 RCT を優先させると、 この試験の理論的根拠を生み出した数十年に及ぶ基礎科学研究の成果が認められない。このような主張は、 CML の病態生理に対する我々の理解が、 イマチニブの有効性を確信する上で、 重要な認識力を与えていることを認めていない。

RCT の結果が出たからといって、 根底にある病気のメカニズ ムに関する知識を放棄するだけでは十分ではなかった。実際、 CML の治療では、 イマチニブに抵抗性を示す白血病が出てきて、 新しい課題が生まれた。しかし、 疾患の病因と抵抗性の原因 (BCR-ABL キナーゼの抵抗性) を理解することで、 新世代のチロシンキナーゼ阻害剤の開発が可能になり、 この抵抗性のある一部の患者に効果を発揮した [41]。

確かに、EBMの提唱者が確実に我々に思い出させてくれるように、機械的な推論は道を誤らせることがある[13]。しかし、EBMは、現在の治療法の使用や新しい治療法の開発における医学理論やメカニズムの重要性を評価していない。基礎科学は、 臨床試験のための重要な仮説の源であるだけでなく、 我々の信念の核心部分に手を加えることで、 質問の種類や病気治療のアプローチを変えてしまうこともある。CML とイマチニブは、 癌生物学の理解を進め、 創薬と標的治療のための新しいモデルを作った。この知識は CML 患者以外にも影響を与え、 他の標的薬の開発にもつながった。前述の NSCLC におけるゲフィチニブもその一例で、 RCT がいかにこのような標的療法の有効性を正確に判断できないかを物語っている。

臨床研究の役割

この記事は、臨床研究に対する批判を意図したものではない。むしろ、RCTが究極の認識上の権威であり、他の知り方が軽視されるEBMの階層的認識論に疑問を投げかけている。上述したように、臨床研究はEBM運動以前から行われており、実際、このようなアプローチは、治療の有効性と安全性を検証するために重要であることを実証してきた。Gavarretは早くから臨床研究を推進し、多数の患者を系統的に観察して治療法の有効性を評価することの重要性を主張していた。しかし、Gavarretは、臨床研究だけでは病気の病因を決定するには不十分であり、原因の有無しかわからないことを認識していた。彼は、臨床的証拠は基礎的な病理学の知識を補完するものであると主張し、当時の基礎科学である病理解剖学の進歩を、臨床研究を成功させるために必要な条件であると評価した。EBMの最初の「基本原則」である階層の概念は、この相補性の概念とは相反するものである[1]。

臨床研究やRCTから得られるエビデンスは、医療において重要な役割を担っているが、治療に対する信頼性の唯一の根拠となるものではない。RCTは特定の管理された条件下での薬剤の使用についてのみ教えてくれるが、その条件は、重大な併存疾患を持つ患者や小児の集団など、薬剤が使用される環境とは大きく異なることがよくある。場合によっては、病気のメカニズムに関する理論が、治療法の有効性を評価する上で、より大きな認識力をもたらすこともある。例えば、遠隔での執り成しの祈りの効果を裏付けるRCTの証拠があるにもかかわらず、治療における遠隔での執り成しの祈りの治療効果に懐疑的なのは、中核的な医学理論によるものである[42]。同じことがホメオパシー療法にも当てはまる。いくつかのRCTで効果があるという証拠が得られているにもかかわらず、基礎科学ではその効果を疑う十分な理由がある[3]。対照的に、病態生理学の知識は、RCTが実施される前に、狂犬病ワクチンの接種や肺炎球菌性肺炎の治療におけるペニシリンの有効性を確信させた[43]。CMLは、病気のメカニズムの理解が治療法の有効性の確信を裏付けるもう一つのケースである。

疫学研究や臨床研究は、問題点を明らかにし、さらなる調査を促すのに有効であるが、こうしたアプローチには限界があることを認識する必要がある。RCTは厳密にデザインされているため、特定の種類の質問、主に医薬品の介入を比較する質問への回答に限定され、医学の大部分の重要な領域はRCTの手法を利用できない。また,RCTは,John Worrallが新生児の持続性肺高血圧症に対する体外膜酸素療法のケーススタディで検討したように,患者を治療群間で無作為化することが倫理的に正しいかどうかといった,倫理的な配慮によっても制限される[43]。

私は、病気のメカニズムを探るためには、実験室でのベンチ研究の方が適していると主張しているが、この記事では、基礎科学に有利な代替的なヒエラルキーを論じているわけではない。医学で直面する問題の多様性と複雑性を考えると、単一の方法論を優先するアプローチは成功しそうにない。多元的な認識論が最も適切であると思われるが、多元的な認識論はEBMとは相容れない。EBMでは、ある特定の知識が他の知識よりも優遇されており、この事実はEBMが他のアプローチを排除して実施されることを意味している。

おわりに

本稿では、EBMの認識論が提起する哲学的問題を、「証拠による理論の過小決定の問題」と「Duhem-Quine論文」の観点から検討した。臨床研究やRCTが他の知識に優先するEBMのエビデンスの階層は、未決定の問題を悪化させ、基礎生物学の機械論的な推論や説明に懐疑的な認識論的態度をもたらすことを論じた。これでは、病気をしっかりと理解し、新しい治療法を開発するために必要な理論的枠組みを構築することができない。医学は、基礎科学と臨床研究の補完的なアプローチを採用すべきであり、臨床医学が直面する問題を解決するための限定的な研究ヒューリスティックを提供するEBM階層を避けるべきである。

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー