エビデンスに基づく医療：それはあまりにも遠くにある橋なのか？

コンテンツ

概要
背景
巻末資料

Evidence-based medicine: is it a bridge too far?

www.ncbi.nlm.nih.gov/pmc/articles/PMC4636779/

オンラインで2015年11月6日公開

Ana Fernandez,corresponding author1 Joachim Sturmberg,2 Sue Lukersmith,3 Rosamond Madden,3 Ghazal Torkfar,4 Ruth Colagiuri,4 and Luis Salvador-Carulla5

概要

目的

本論文の目的は、エビデンスに基づく医療（EBM）が生まれた背景にある要因と、現在の医療環境におけるEBMの論争や限界について説明することである。本論文では、2つのフレームワークを用いて分析を行った。(1）健康と医療をそれぞれの要素から生まれる非線形現象として捉える複合適応型健康観、（2）科学における発見、裏付け、実施の各段階の違いを理解するための新たな背景となる科学哲学への統一的アプローチ、である。

成果

標準化の必要性、臨床疫学の発展、医療システムの経済的持続性への懸念、臨床試験数の増加に加えて、大量のデータを処理するコンピュータの能力が向上したことにより、EBM運動の発展への道が開かれた。EBMは、医療システムの効率性と公平性を向上させる自身の能力を示す証拠ではなく、権威ある知識に基づいてすぐに採用された。EBMのアプローチの主な問題点は、科学的知識に対する制限された単純なアプローチであり、臨床ガイドラインに含めるべき研究の主要な品質として内的妥当性を優先していることである。その結果、エビデンスを生み出す方法として、解明的無作為化比較試験が好まれている。この方法は、発見の段階では有用であるが、専門家の知識、患者の価値観、文脈などの追加情報を取り入れる必要がある実施の分野では不十分である。

結論

EBMは、健康と医療を複雑な相互作用、すなわち相互に関連した非線形現象として認識し、様々な複雑性科学の手法を用いてより良い分析を行う必要がある。

キーワード

知識の複雑性、根拠に基づく医療、根拠に基づく診療、外的妥当性、フレーミング、一般化可能性、内的妥当性、無作為化比較試験

背景

過去20年以上にわたり、EBM（Evidence-based Medicine）の概念は、医療・健康の実践や政策における意思決定のゴールドスタンダードとして受け入れられるようになっていた。

EBMは、臨床上の意思決定にエビデンスを利用するための標準的な手順を提供するものである。EBMとは、「個々の患者の治療に関する意思決定において、最良のエビデンスを意識的、明示的、かつ賢明に使用すること」と定義されている。エビデンスに基づく医療の実践とは、個人の臨床経験と、系統的な研究から得られる最良の外部臨床エビデンスを統合することである」[1]。Muir Grayは、この定義があまりにも医師中心であると考え、患者の視点の重要性を強調するためにこの定義を拡張し、「…エビデンスに基づく臨床実践とは、臨床家が患者と相談しながら、利用可能な最良の科学的証拠を用いて、患者に最も適した選択肢を決定する意思決定のアプローチである」と提案した[2]。[2]. SacketとGrayはそれぞれの論文で、EBMによる意思決定の段階を、(1)臨床疫学、系統的検索、メタアナリシス、コスト分析やモデリングなどの手法を用いた外部エビデンスの評価と統合、(2)臨床的専門知識、患者の価値観や嗜好を考慮した確率論的な推論、と説明している。驚くべきことに、合理的な臨床上の意思決定に対するこの広範かつ繊細なアプローチは、実際にガイドライン作成に適用されたが、偏った方法でエビデンスを削減した。信頼できるエビデンス」として認められたのは、解明的なランダム化比較試験（RCT）によるエビデンスのみであった。

EBMの価値は支持者によって断固として擁護されていたが、臨床実践[3-8]、認識論[9-14]、健康社会学[15, 16]、実施科学[17]など、多くの分野から広く批判されていた。さらに近年では、以前は支持していたEBM研究者が、特に患者との意思決定の共有や、エビデンスと経験に基づいた専門家の判断に関連するEBMの構成要素に関して、本来の広範な原則と学際的な価値観を踏襲し、適用する運動の「ルネッサンス」を主張している[18, 19]。主な論点は、EBMはその利点にもかかわらず、医療提供、政策、資金調達に重要な悪影響を及ぼした可能性があるということである。その例としては、(1)複雑性、個人のニーズ、その人のコンテクストや多重罹患などの問題を管理できなかったこと、(2)研究の量と質のばらつきにより、管理が不可能になり、場合によっては臨床的意義を欠くようになったこと、(3)生活の医療化、すなわち非特異的な訴えに対して新たな病気を作り出したり、エビデンスに基づく「品質マーカー」を使って医薬品や医療機器を広く普及させたりしたことなどが挙げられる[20-22]。

本論文は、EBMの歴史的発展と論争[23]、および現在の医療状況におけるEBMの限界を分析することで、EBMの記述的合理的再構築に貢献するものである。我々はこの分析を、健康とヘルスケアの変数の関係的相互作用に焦点を当てた複雑適応系科学の視点[24]と、Schurz[23]が提案した科学哲学への統一的アプローチからアプローチする。人の身体的、社会的、情緒的、認知的な経験の間のバランスのとれた状態としての健康の複雑適応的な見方と、その結果としての複雑適応的なヘルスケアとヘルスケアシステムの形成は、人の固有のニーズに高度に応答するものとして、また医学的知識の複雑適応的な理解として、別の場所で詳細に説明されている [25-27]。科学哲学への統一的アプローチは、科学的知識の基本的な前提条件を体系化し、科学における価値観の役割を見直すものである。また、科学における発見、裏付け、実施の各段階の違いを理解するための新たな枠組みを提供している。科学知識の新しい分野を定義するための重要性と、各段階における異なる論理的推論の役割については、別の場所でレビューされている[28]。

本論文は4つのセクションで構成されている。第1章では、EBMの起源、原則、および台頭に貢献した関係者をレビューし、第2章では、この動きがなぜこれほど急速に発展し、広く受け入れられたのかを議論する。第3章では、EBMに対する「制限された」アプローチと、診療ガイドラインを作成するための標準的な方法を設計する際のEBMの使用について説明し、最後に、システム思考と実装科学の文脈でEBM運動が直面している現在の課題についてコメントする。

EBMはどこから来たのか？

20世紀初頭、EBMの発展を先取りした3つの要因があった。それは、（1）米国の病院が病人の避難所から、科学的原理に基づいた医療を行う権威ある組織へと変化したこと[29]、（2）医学教育の改革[30]、（3）臨床疫学の誕生[31]である。病院の変革には、ガイドラインによる医療提供の標準化のプロセスが伴っており、これは米国医師会が医療における基準となる認定機関としての地位を確立するための努力とも密接に関係していた[29]。標準化には、外科医が十分な訓練を受けていることを保証する医療従事者の規制、ばらつきを減らして品質を向上させるための病院での手順基準の策定、そして、病院の管理者が医師の行動を管理できるようにするための、初めての患者記録ファイルの導入が含まれてた [32]。TimmermansとBergが示唆しているように [29]、標準やガイドラインの使用は、新たな科学的知識や技術とともに、専門家の自律性の向上を可能にした。しかし、基準やガイドラインは、20世紀後半になると、臨床上の自律性を低下させる主要な誘因にもなった[29]。

臨床疫学の科目は、客観性と合理性によって進歩が達成されるので、医学は芸術ではなく科学でなければならないという啓蒙思想に基づいて、医学プログラムに徐々に導入されていいた[29]。1968年、マクマスター大学（カナダ）は、基礎科学、臨床疫学、臨床問題から生じる臨床医学の研究を組み合わせた、統合的な「問題解決型学習」カリキュラムを初めて提供した[31, 33]。EBMの「父」であるDavid Sackettがこの学部を指導した。1979年にSackettが主導したカナダの定期健康診断タスクフォースが一連の勧告を発表したことで[34, 35]、臨床疫学の知見を臨床に役立てることの合理性が強調された。この調査結果は、定期的な年1回の検診をやめて、患者の年齢と性別に応じた選択的なアプローチをとるようにという勧告を裏付けるものであった。提言が「エビデンスのレベル」に従って行われたのは初めてのことであり、もっぱら「研究デザインの評価」に基づいて行われた。すなわち、RCTは良いエビデンス（レベルI)コホート研究や症例対照研究は良いエビデンス（レベルII)そして臨床経験に基づく専門家の意見は悪いエビデンス（レベルIII）とされた。当然のことながら、治療法の推奨度を評価する基準は同じで、レベルA「介入を行うべき」からレベルE「介入を行わないべき」まで適用された。

EBMが広く採用されるための前提条件として、臨床家は科学文献を評価する際に、より批判的になる必要があった。1981年、Sackettら[33]はCanadian Medical Association Journalに一連の論文を発表し、研究デザインの内的妥当性を評価する基準として、治療についてはRCTが、診断についてはコホート研究が、病因や害については症例対照研究がゴールドスタンダードであると説明した。しかし、Zimmermanが指摘するように[31]、この単純化はEBMの最も重要な弱点の一つであった。実際，EBMに対する大きな抵抗は，医学の知識ベースを，偶発的・経験的・非線形・予測不可能なものではなく，合理的・技術的・線形・予測可能なものとして規定することに関連している[16, 26, 36]。

膨大な量の研究文献を管理することは、コンピュータの普及、特に医師のデスクトップにあるパーソナルコンピュータの普及によって可能になった[37]。これにより、1980年代半ばにイギリスのオックスフォードにある国立周産期疫学ユニットのディレクターであるIain Chalmersは、周産期試験の電子データベースを構築し、臨床医がこの情報に容易にアクセスできるようにした[38, 39]。電子データベースの概念や作成、コンピュータの性能の向上は、それまで一部の専門家だけに限られていた知識管理の民主化を促進した [40]。その数年後、膨大な量の研究文献を体系的に調べ、レビューし、統合して、患者の診察時に臨床医がアクセスできるようにする組織として、コクラン共同計画が登場した。

EBMの発展を説明するもうひとつの背景には、1970年代に医療システムの持続可能性に対する懸念が高まったことがある。この懸念は、医療経済学などの新しい学問分野の出現をもたらし、EBMに加えて、管理主義[41]やアウトカムマネジメント[42]などの医療改革の主要なアプローチの発展に影響を与えた。これらの3つのアプローチは、測定可能な目標を達成するための「具体的」なものに焦点を当て、定義された目的、アウトプット、基準に対するパフォーマンスの継続的な評価を行い、効果基準による資源の配給を行い、管理とモニタリングによって医師の仕事をより透明化するものであった。

健康維持組織の発展と密接に関連していたのが、米国におけるアウトカム・マネジメント（OM）であり、医師の自律性と臨床実践のコントロールを促進するために品質改善の原則を採用した。OMは4つの主要な原則に従っている[42]。(1）基準やガイドラインに依拠した適切性、（2）患者の機能や福祉に関する日常的かつ体系的な測定に基づく日常的なアウトカム評価、（3）膨大な規模の臨床データやアウトカムデータをプールするデータマイニングとの連携、（4）各意思決定者の関心事に最も適したデータベースのセグメントを考慮した普及とインパクト分析への注力。OMがEBMと異なるのは、EBMが「実験データ」を重視するのに対し、OMは「実データ」を重視する点であり、OMもEBMも、新しいツールを提供することで臨床家の臨床的意思決定能力を向上させることを目的としている。これは、意思決定の権限が臨床家から管理者や監査役に移されるという経営主義や新自由主義的アプローチの考え方とは明らかに対照的である[41, 43]。

標準化の必要性，臨床疫学の発展，医療システムの経済的持続可能性への懸念に加えて，大量のデータを処理できるコンピュータの性能が向上したことにより，1991年に公式に設立されたEBM運動の発展への道が開かれた[33]。「エビデンスに基づく医療」が出版された。A new approach to teaching the practice of medicine “がエビデンスベースワーキンググループによってJAMA誌に掲載されたことにより[44]、EBMの概念と原則が急速に広まり、エビデンスベースワーキンググループはEBMを「新しいパラダイム」と宣言した。それは、直感、臨床経験、病態生理学的根拠に基づいた主観に基づく医療を「もっぱら」実践するという「古いやり方」を、「科学的」証拠に基づく客観的なアプローチに変えるものである。彼らは、エビデンスを重要な検討事項として加えることを提唱する一方で、臨床上の意思決定を導く「権威ある意見」を持つ専門家の役割を明確に否定したのである。

なぜEBMは広く受け入れられたのか？

1992年から 2015年9月まで、PubMedデータベースでは、タイトルに「evidence-based」を含む論文が2万件以上見つかった。エビデンスに基づく診療ガイドラインは、大多数の公的機関や専門機関で規範となっており、EBMのアプローチは今日の科学的思考の中核となっている。RCTは、医療におけるEBMの「認識された新しいパラダイム」を支える基本的な研究手法とみなされており[45]、こうした考え方は今や医学の領域をはるかに超えて広がっている（例えば、保存科学が医学と同じようにRCTを含める必要があるかどうかの議論を考えてみよう：http://blog.nature.org/science/2013/08/15/debate-randomized-control-trials-in-conservation/）。

Popeが示唆したように[16]、EBMは、（経験に基づいて現在のパラダイムを変える必要があるという）アジテーションから始まった社会運動として発展した。それは、マクマスター大学のグループが経験を共有し、永続的な目的意識を育むことで結晶化し、臨床疫学のキーオピニオンリーダーが影響力のある医学雑誌に発表した一連のポジションペーパー、宣言、ガイドラインで広まっていったのである。皮肉なことに、科学界によるEBMの採用は、エビデンスではなく権威的な知識に基づいたものであり、まさにEBMが代替することを意図したタイプのアプローチであった。

EBMにおける権威ある知識の利用

EBMの成功に大きな役割を果たした可能性のある権威ある知識に関する3つの要因、すなわち、評判、マシュー効果、そして見えない大学を挙げることができる。

ほとんど匿名のEBMワーキンググループaが書いたEBMに関する最初の論文がJAMAに掲載されたことで、この運動はすぐに信頼性の根拠を得ることができた。ワーキンググループの著者として出版されたことで、その論文は権威あるコンセンサス論文としての地位を確立した。しかし、Zimmermanが示唆したように[31]、EBMワーキンググループは政治的なマニフェストに近い言葉を使っており、医学の実践に広範囲な変化を求め、その過程で「科学的客観性のある企業」を作り上げることを求めてた。このワーキンググループは、JAMAの副編集長であるDrummond Rennieとともに、最初の重要な年の間、EBM運動の主唱者であり続けた。最初の3年間に発表されたEBMに関する22の論文のうち、12の論文がJAMAから発表されたが、これはRennieとJAMAの新しいアプローチに対する顕著なコミットメントを反映している[31, 46]。この新しい動きは、JAMAによって支えられただけでなく、British Medical Journalがヨーロッパでの熱心な支持者であることもわかった[1, 47]。

3年以内に、この動きは、EBMに批判的な立場をとる同じように権威のある雑誌、ランセットによって脅かされた。1995年には、匿名の社説で、「The Lancetは、入手可能な最善のエビデンスに基づく診療を称賛し、そのような進歩のニュースを批判的に評価して臨床医の注意を喚起することは、査読付き医学雑誌の役割の一部であるが、エビデンスに基づく医療をそれ自体の規律として専門家に押し付けようとする試みを軽蔑する」と述べている[48]。Lancet誌はその後も，EBMの動きに対して最も批判的な雑誌の一つであり続けている。例えば 2005年には、「External validity of randomized controlled trials（無作為化比較試験の外的妥当性）」という論文を発表した。この試験の結果は誰に適用されるのか」と題した論文を発表し、エビデンスの階層化は内的妥当性に焦点を当てており、結果の外的妥当性／一般化可能性という重要な問題を無視していると批判している[49]。

EBM運動の主要な提唱者や著者の評判は確立されていた。David SackettとIain Chalmersは有名な臨床疫学者で、それぞれMcMaster大学とOxford大学という評価の高い機関で働いてた。ゴードン・ガイアットは，トロントを拠点とする若い医師や看護師で構成されたカナダの医療グループ「医療改革グループ」の共同設立者であり[31]，上級医師の意見に左右される医療行為に反対する活動を行っていた。また、医師でありながら捕虜となったアーチー・コクランや、ガザ地区の医師であったイアン・チャルマーズは、過酷な状況下で得た個人的な経験から、高価な新しい治療法が古い治療法よりも優れていないケースが多いことに気付いてた[50]。どこから見ても、一流の専門家たちは明らかに動機づけられてたが、実際には、彼らの提言は「患者の臨床ケア」に対する過度に単純化されたアプローチをもたらした。

これに関連する評判効果は、マシュー効果[51]から得られる。マシュー効果とは、ある視点や著者グループの信頼性を、その支持者の間での過剰な相互引用によって高めることであり、b 17世紀以来、科学者が利用してきた慣習である。その結果，あるグループは，（助成金，出版物，学会発表などを通じて）将来の研究，実践，政策のアジェンダを設定するための影響力と権力を獲得する可能性が高くなるが，これは，出版方針と品質評価手順の現状によって容易になっている[52]。

EBMの主要プレイヤーが、共同作業グループやネットワーキングを推進、実施、拡大するという並外れた能力を持っていたため、「見えない大学」として知られるようになった[51]。見えない大学とは、別々の場所に住んでいても、同じ学会に出席し、同じ雑誌に論文を発表し、同じ考えを共有するために基調講演に招待し合う科学者や専門家のグループで構成される。マクマスター大学のグループとコクラン・コラボレーションのコラボレーションにより、見えない大学が生まれた。コクラン・コラボレーションは、時を経て、「目に見える大学」の形に変化したと言えるかもしれない。実際、コクラン共同計画は、一連の小規模なワークショップを開催することで、EBM支持者の国際的なソーシャルネットワークを構築した。

EBMの広いモデルから狭いバージョンへ

EBMの歴史的・哲学的基盤は、広い医療システムの視点から始まった。1930年代、当時医学生であったコクランは、抗議のプラカードで「すべての有効な治療は無料でなければならない」と要求した[53, p.1]。この要求は、「特定の病気の自然史（sic）を良い方向に変える上での、「特定の医療行為の効果」を測定することを前提とした、コスト／ベネフィットの視点を示すことであった[53, p. 2]。コクランは、RCTは病気の管理からバイアスや主観的な意見を取り除くことができると主張したが、実際にRCTは治療的介入を理解する上で重要ではあるが限定的な利益を示した。コクランは、「有効性」と「効率性」を明確に区別し、科学的手法としてのRCTは、試験対象者に「有効性」を示すことはできても、それが医療における「効率性」の向上につながるわけではないこと、つまり、「医療システムの複雑さ」のために、日常診療では同じ結果が得られないことを観察した[53, p. 2]。さらに、コクランは治療よりもむしろケアの側面に関心があり、医療制度の中でしばしば無視される「平等」という問題を暗示していた。彼はこう述べている。「特に私は、ケアの必要性が広まっている一方で、治癒はまれであり、あらゆるコストをかけて治癒を追求することがケアの供給を制限する可能性があると考えており、少なくともそのバイアスは宣言されている」[53, p.7] と述べている。

EBMアプローチの始まりは、明らかに「医療システムの仕組み」の複雑さと、「患者のケアのために可能な限り最善の決定」を行うこととの関係を理解することに焦点を当ててた。しかし、これらの複雑さは、標準化された、典型的な単一の疾患管理ガイドラインに焦点を当てた狭い範囲に急速に縮小された。

実践のための科学的知識の管理とガイドライン作成の動き

EBMの主な目的の一つは、大量の科学的知識をより利用しやすくすることであり、臨床上の意思決定をサポートするための推奨事項を記載した臨床ガイドラインを開発することは、当然のことのように思われた。

臨床ガイドラインは有用であるが、例えば、1つの情報源（すなわち解明的なRCT）のみを利用する場合には限界がある。また、これらのガイドラインは、患者の好みや臨床経験を知るような、他の知識源を臨床上の意思決定に利用する専門家の自由を制限することになる[54]。特定の診療分野のエビデンスに基づくガイドラインは、一般的に臨床家からは、不利な訴訟や臨床審査委員会の結果によって強化された、最終的で権威ある診療経路とみなされている [29]。その結果、多くの臨床家は、臨床ガイドラインを、個々の患者のニーズや状況に合わせた臨床判断を行う上での主な脅威、すなわち、必要な臨床上の自律性を妨げるものと見なしている。実際、32年前のJR HamptonのようなEBM支持者は、「臨床的判断」が医学の発展を妨げる主要な障害であると考え、臨床の自由の死を求めてたが[55]、最近になってようやく、臨床家が患者の最善の利益のために「専門的知識」を利用できるようにするためには、臨床的自律性が必要であることに気づいた[56]。

臨床ガイドラインの作成に使用された研究の質にこだわることが、広い意味でのEBMの枠組みが狭い意味でのRCT主導の形に変化した理由であると考えられる。EBMガイドラインに含まれる推奨事項を実践や政策に反映させることの難しさや、ガイドラインに対する還元主義的なEBMアプローチの連続的な改訂プロセスについては、他の研究者によってレビューされている[49, 57, 58]。

「グレーディング」された知識

エビデンスに基づくガイドラインを実践に移す際の初期の問題は、裏付けとなる研究体を適切に格付けすることの難しさに起因していた。それゆえ、RCTのグレーディングの詳細な分析が提案された[59]。GRADE（Grades of Recommendation, Assessment, Development, and Evaluation）ワーキンググループは、51の組織が使用している6つのグレーディングシステムを分析し、驚いたことに、研究の質の評価における信頼性が低いことを発見した。また、どのシステムも、すべてのユーザーグループ（専門家、患者、政策立案者）にとって使いやすいものではなかった。この研究は、おそらく、EBMをリードするグループの1つによる、EBMに対する最初の大きな批判となり、証拠のレベルと強さを評価するシステムには、臨床上の推奨を提案するための重要な欠点があると結論づけられた[60]。同じグループは後に、ほぼ無作為化試験のみに焦点を当てていた初期の評価システムが不適切であることを認識した。同グループは、観察研究には、勧告に用いられる研究の裏付けの質を低下させることも増加させることもできる特徴があり、質の高い観察研究は、より良い臨床上の意思決定に貢献できることを認識した[61]。エビデンスを評価する際に考慮される要素には、研究の全体的な質、研究の一貫性、有益性と有害性のバランスに関する不確実性、価値観や機会費用の不確実性などがあり、コクランのより広範なビジョンと再び結びついている。

エビデンスの質の評価を勧告の強さから切り離す必要性の認識は、大きな前進であった。「質の高いエビデンスが必ずしも強い勧告を意味するわけではなく、質の低いエビデンスから強い勧告が生まれることもある」 [62]。しかし、「誰がこれらの推奨を行うべきか」という新たな疑問が生じた。逆説的であるが、「EBM専門家」によって作成された臨床ガイドラインの推奨は、その専門家グループの意見を参考にして、推奨の文言を検討して合意し、エビデンスの等級付けを行い、彼らの価値観や背景を活用する、つまり「事前の専門知識」を適用している。しかし、これらの審議において、情報、専門家の意見、文脈的な要因がどのようにバランスされているかは、しばしば不明瞭である。

勧告の作成と評定における体系的かつ明確なアプローチの必要性を認識し、現在、ガイドライン作成基準では、各勧告について所見の要約[63, 64]またはエビデンス・ステートメント[65]を要求しており、これらはガイドラインのテクニカルレポートに含まれている。

知るための様々な方法

EBMコミュニティは、エビデンスを限定することへの批判に応え始めており、観察研究や質的研究の結果など、他の知識源を取り入れ、評価しようとしている。しかしながら、次のようなグレーディングシステムに内在する根本的な欠陥は依然として残っている。例えば、研究デザインと品質は、系統的ではあるが単純化された線形構造で整理できるが、実際には、患者の嗜好や地域や診療の状況への適用性など、異なる非常に関連性の高い情報を使用すれば、全く異なるグレーディングシステムになるであろうという仮定 [66]や、疫学的原則に基づいてグレーディングされた研究はバイアスのリスクを減少させるであろうという仮定である。この基準は、新しい知識の発見には意味があるかもしれないが、研究を地域の診療に導入することを主な目的とする場合には、重要な考慮事項ではない。

科学的知識は、発見、裏付け、実施という3つの大きな領域に分かれており、ある領域の情報を他の領域に直接適用することはできないことを考慮することが重要だ[23, 28]。発見と裏付けを導く価値中立の原則は、実施段階ではさらに-そして複雑に-明らかにする必要がある。Schurz[23]によれば、価値中立性の要件は、「科学者が自分の科学的知識を、手段的推論で前提とする基本的な価値観の前提から切り離すことを意味する」。EBMガイドラインの作成では、平均値推論とアブダクションが、ガイドラインの推奨事項の構築への貢献を十分に形式化することなく使用されている[28]。この哲学的議論のルーツは本稿の範囲をはるかに超えており、残念ながら、EBMの基盤を支えるために必要な科学哲学の原則は、いまだに適切に探求されていない。

発見や裏付けの分野では、内的妥当性が重要な基準となる（観察された変動は因果関係があると解釈できるため、研究デザインはバイアスのリスクが低いことを保証する必要がある）。実施の分野では、重要な基準は、結果の外的妥当性の度合いであり、地域の状況への適用性と患者への介入/受け入れ可能性である。外的妥当性は、結果が異なる人、環境、時間に一般化できることを意味し、重要である。内的妥当性と外的妥当性の間には逆の関係がある。EBMの最終的な目的が、実際の環境で実際の人々の健康を改善することであるならば、外的妥当性は強調され、強化されるべきである。ある治療法がコントロールされた状況で有効であるかどうか（=内的妥当性）だけでなく、その治療法が現実の世界でも効果を発揮するかどうか（=外的妥当性）も重要である。EBMで用いられている臨床ガイドライン作成のための評価システムは、体系的で信頼性が高いものの、内的妥当性を優先していることが多く、「目的に合っていない」と言われている。内的妥当性の重視はEBMの失敗の一因となっており、変数や交絡因子がコントロールされた実験計画（RCT）に基づく推奨は、研究の背景が現実の臨床実践／リアリティを反映していないため、しばしば実践に移すことができないからである[67, 68]。

また、EBMやガイドラインのコミュニティは、ガイドラインが現在の静的で不親切な構造であるために、その実施が限られていることを認識している[18, 54, 69]。ウィキベースの動的な臨床ガイドラインの開発などの新しい提案は、最終的にこの問題を解決し、すべての利害関係者（患者、臨床医、意思決定者など）の参加を可能にし、より高い透明性と受容性をもたらす共同作業を行うことができるかもしれない[70, 71]。

発見／裏付けから実施への飛躍は 2005年にランセット誌で行われた批判[49]や、ワグナーの慢性／統合ケアモデル[71]に取って代わられた疾病管理アプローチを開発したERエプスタインのような他のEBM専門家の立場にも一部反映されている。エプスタインはEBMを信奉していたが、健康知識に関するエプスタインのビジョンは明らかにRCTを超えており、ポール・エルウッドのOMアプローチに近いものであった。彼はEBMをケアの質を向上させるためのいくつかのツールの一つと考えてた。「新しいパラダイムは、集団ベースのリスクと疾病の評価、疾病予防と健康増進のシステム、コミュニティベースの介入、自動化された情報、エビデンスに基づく医療、定義されたケアのプロトコルの枠組みの中での医療提供者とのコンタクトであり、アウトカム情報の明示的な収集である」 [72]。EpsteinとSherwoodは、RCTのゴールドスタンダードを支持しているものの、アウトカム管理/実施における主な情報源としてRCTを使用することの難しさに言及し、RCTに代わるものとして「前向き有効性試験」に言及している[72, 73]。

リアルワールドのアウトカムを評価するRCTの限界

より根本的な疑問として、無作為化比較試験でリアルワールドのアウトカムを達成／評価できるのかということがある。要するに、支持者が好むような解明的無作為化試験だけを使用するならば、答えはノーである。しかし、定義上、通常の条件下で実施され、実践者が試験対象の介入をどのように適用するかをかなり自由に決めることができ、目障りではなく（すなわち、患者や実践者のコンプライアンスを向上させるための特別な努力はしない)アウトカムの検出に管理データベースを使用する実用的な対照試験は、有効な代替手段を提供することができる。解明的RCTが発見と裏付けにつながり、変動性を取り除くことを目指す一方で、実用的対照試験（無作為化を含む）は実施の領域に適合し、変動性を規範として受け入れるものである[74, 75]。これらの試験は、現地の状況を考慮し、理論に基づいて行われ、他の知識源によって補完された場合に、ほとんど評価される[76]。

結論　EBMが直面する課題

ほとんどの場合、EBMはその当初の命題であるエビデンス、専門家の知識、患者の嗜好を効果的に取り入れるには急成長しすぎた[1]。EBMがRCTに依存していたことは、単純な介入で治療される急性疾患（ほとんどが単一疾患）には有効であったが、このアプローチは、複雑な医療システムにおける慢性疾患や多臓器不全を特徴とする現在の疫学的状況には適していない。特にEBMは、健康の社会的決定要因や地域の状況の重要性をほとんど無視してきたため、医療の「cookbook approach」や「MacDonaldization」というあだ名がついた[29, 77])医療の「有効性」や「効率性」が必要な医療サービスの「平等性」に与える真の影響を考慮しなければならない。

アプリオリなものとして、エビデンスは文脈に敏感であり、したがってある程度暗黙的であり[78]、臨床的意思決定のための有用な勧告を作成する際には、グローバルなエビデンスとローカルなエビデンスの両方を組み合わせる必要がある[79]。ローカルエビデンスには、特定の環境における修飾因子の存在、ニーズの大きさ（有病率、ベースラインのリスクまたは状態)患者の価値観、コスト（患者およびシステムにとって)システム内の資源の利用可能性などが含まれる [80]。このようなローカルなエビデンスは、「専門家の知識」と組み合わせる必要があるが、これは「専門家の意見」とは区別され、別の方法で評価されるべきである。専門家の知識」とは、現地の状況をよりよく理解するために専門家が持つ暗黙の知識を意味する。専門家の知識は、データ（蓄積された経験）に基づいており、何かについての単純な意見や感情とは異なる[81, 82]。ガイドラインの作成における「口語的証拠」の妥当性については、現在も議論が続いている[83]。これは、科学的知識の基本や、専門家の知識とエビデンスの違いについて、著者や査読者が基本的な理解をしていないことを憂慮してのことである。

患者に最善の結果をもたらすために、研究エビデンスをどのように使用し、地域の状況や専門家の知識と組み合わせるかについて、他の分野を調査し、そこから学ぶことが必要である。例えば、科学の他の分野、例えば保全科学や人工知能などでは、専門家の知識が日常的に分析に取り入れられている。専門家ベースの共同分析は，専門家の知識をデータ分析に組み込むための体系的な手順である。このようなアプローチは，複雑な問題を扱う際に有用であることが証明されており，異種のゲノム／病態生理学的経路や多様な個人的ニーズに起因する複数の症状を持つ患者の増加を特徴とする現在の健康状況において，強力なツールと見なすことができる[81]。

将来的には，研究データの分析に「専門家の知識」を取り入れることで，臨床的な意思決定により有用なエビデンスが得られる可能性がある．この意味で、EBMは、RCTの単独使用を超えて、科学的知識は多次元的であり、1つの階層的なシステムだけでは整理できないことを認める必要がある。異なる方法論を用いた研究から得られる知識は補完的なものである[28]。したがって、全体像を把握するためには、解明的なRCTから得られる情報を、日常的な診療における有効性を評価する実用的なRCTから得られる情報と補完し、対比させる必要がある。これは、「内的妥当性」の損失と結果の不確実性の増加を意味するが、「代表性の向上」を意味する。

EBM運動が直面している最も重要な課題は、科学的推論の方法を詳細に説明することである。これには、健康における「科学的知識」、「エビデンス」、「意思決定」の正式な定義や、科学的推論プロセスで使用されるさまざまなタイプの論理的推論など、その分類原理の分析が必要である[28]。他の研究者が強調しているように、我々は、「良い」証拠 [84] と科学的な「真実」との間の混乱を明確にするために、この学術的な演習が非常に重要であると考えている。システム思考 [85, 86]とは別に、医療の研究者、臨床医、政策立案者は、EBM運動 [18, 23, 28, 87]で好まれている古典的な実験的/演繹的アプローチを超えて、研究を設計・解釈するための科学哲学の知識を深め、意思決定プロセスの指針とすることで恩恵を受けることができるであろう。

また、医療システム研究には、異なる視点、認識論、研究を概念化し実施する方法を持つ様々な分野（社会的なものを含む）が関わっていることを強調しておく必要がある。コクランが示唆しているように、医療システム研究は「臨床的有効性」を特定することよりも広く、「効率性」と「平等性」は医療システム改善の実施を成功させるために同様に重要な考慮事項である。したがって、すべての利害関係者の基本的な価値観の前提を明示する必要がある。

倫理

この原稿は、発表された論文のナラティブレビューであるため、倫理的な承認は必要なかった。

巻末資料

aグループとして署名したが、脚注では名前を記載した。

b大多数の論文が科学界にほとんど影響を与えないにもかかわらず（ハズレ)少数の論文が科学界の注目を集め、多くの引用を受ける（ハズレ・アバンダンス）という事実を指す。

c余談であるが、コクランは捕虜収容所で医師として働いていた時の観察により、ケアの大きな効果の経験的な証拠を得たが、その科学的根拠は精神神経免疫学の研究により解明されている。