エビデンスに基づく実践における経験の役割

強調オフ

EBM・RCT科学哲学、医学研究・不正

サイトのご利用には利用規約への同意が必要です

The Role of Experience in an Evidence-Based Practice

themedicalroundtable.com/article/role-experience-evidence-based-practice

日付 2012年6月13日座談会ID:GM96328引用:Med Roundtable Gen Med Ed: Med Roundtable Gen Med Ed. ; 1(1): 75 – 84.

概要

要約

議論の焦点は主に以下の通りであった。

1) エビデンスに基づく医療の価値と、それが患者中心の医療で果たす役割を批判的に評価する。
2) エビデンスに基づく医療の3つの主要原則。
3)臨床研究が臨床決定において果たすべき役割。
4) 患者の価値観や嗜好の重要性。
5) 個人的な「ハンズオン」体験と病態生理学的推論の価値。
6) 臨床経験や病態生理学的根拠と、臨床試験の結果とのバランスをとること。
7) 個々の患者に基づいた臨床上の決定をカスタマイズすること。
8) 従来の時代遅れのEBMを超えた、証拠の質を評価するための新しいGRADEフレームワーク。

TMR:ゴードン・ガイアット博士とマーク・トネリ博士は、このエキスパート・ラウンドテーブル・考察に招待され、過去20年間に普及した今では時代遅れとなった「エビデンスに基づく階層」の進化したフレームワークの中で、専門家の意見の役割がどのように変化していくと考えているのかについて議論した(図参照)。彼らの議論は、現在のEvidence-Based Medicine(EBM)の概念や考え方のある側面を浮き彫りにしている。Gordon Guyatt博士は、オンタリオ州ハミルトンにあるマクマスター大学の臨床疫学・生物統計学部の著名な教授であり、医学部のメンバーでもある。

マーク・トネリ博士は、ワシントン州シアトルにあるワシントン大学メディカルセンターの出身で、呼吸器・重症患者治療部門の教授、生命倫理・人文科学の非常勤教授、呼吸器・重症患者治療フェローシップのプログラムディレクターを務めている。また、数十年にわたってEBMに関する執筆・出版活動を行っており、主に臨床現場におけるEBMの限界と、臨床的意思決定における経験の価値について述べている(下表参照)。彼らは、このエキスパート・ラウンドテーブルで、それぞれのアイデア、考え、懸念を語っている。

図の説明

右の例のような多くの「エビデンス・ヒエラルキー」チャートは、かつては「最も優れたエビデンス」を上に、「最も弱いエビデンス」を下に示すものとして受け入れられていたが、現在では時代錯誤となっており、GRADEのような新しいシステムがこの分野の発展とともに台頭してきている。

ガイアット博士:

エビデンスに基づく医療には、3つの原則があると思う。私たちは、ある種のエビデンスを他のものよりも信頼している。2つ目は、入手可能な最高品質のエビデンスを体系的にまとめておくこと。そして3つ目は、エビデンスはそれだけでは何をすべきかを教えてくれない。エビデンスは、常に価値観や好みの文脈の中にあるものなのである。

私の理解では、トネリ博士のご批判は、この3つの原則のうちの1つ目に焦点を当てているように思うが、いかがであろうか?

トネリ博士:

その通りだと思う。3つ目の原則については、私も絶対に賛成である。しかし、最初に言っておきたいのは、証拠という言葉がさまざまな形で使われていることから、その意味を明確にする必要があるということである。特に、臨床研究の結果をエビデンスとするならば、臨床研究自体が臨床的な意思決定に十分ではないと思う。患者さんの価値観や好みは重要だが、それ以外のテーマも重要だと思うし、以前から認めているものもある。臨床研究が適用できるかどうかは、個々のケースの状況によって決まる。

したがって、あなたの3つ目の発言には同意できるが、1つ目の発言には同意できない。この発言は、エビデンスには階層があり、特に臨床現場に適用されるようなエビデンスがあるという考え方を支持していると思う。しかし実際には、臨床的な意思決定において、個人的な経験や病態生理学的な推論よりも無作為化比較試験の方が説得力がない場合もある。

ガイアット博士:

私たちの意見の一致と不一致の境界を明確にしたほうがいいと思う。3つの状況をお話しするので、医学界の対応に同意するかどうか教えてください。20年ほど前、脳血管外科医は中大脳動脈の狭窄に対して頭蓋外から頭蓋内へのバイパス手術を行ってた。彼らの個人的な経験では、患者はこの手術で非常に良くなり、以前よりもはるかに良くなってたし、説得力のある生理学的根拠もあった。

その後、無作為化試験が行われ、手術の通常の合併症に関連した利益はなく、実際には害もあることが示唆された。さらに最近では、エンカイニドとフレカイニドが、無症候性不整脈を事実上消滅させる薬剤であった。循環器内科医の経験は素晴らしいものであった。彼らは非常に強力な生理学的根拠を持っており、食品医薬品局を説得して、無作為化試験の前に薬を認可させたほどである。その後、無作為化試験が行われたが、エンカイニドとフレカイニドは不整脈による死亡を減少させるのではなく、増加させることがわかった。

最後に、私が医学のトレーニングを受けていた頃、心不全の患者がいる場合、β遮断薬は禁忌とされていたが、これも生理学的に説得力のある根拠と臨床経験があった。30年後の無作為化試験では、心不全患者の死亡率を低下させるという点で、β遮断薬が最も強力な薬剤であることが示唆されている。これらの3つの例では、臨床経験と生理学的根拠が1つの方向性を示唆し、無作為化試験が別の方向性を示唆していた。臨床現場では、無作為化試験が生理学的根拠や臨床経験に取って代わったと考えられているようであるが、あなたもそう思われるか?

トネリ博士:

それには同意する。この議論では、特に心臓不整脈抑制試験(CAST)1をはじめとする3つの例がよく取り上げられ、機構論や病態生理学的根拠は信用できないと言いたげである。私は、これらの無作為化比較試験は、介入を日常的に行うべきかどうか、我々が考えているような効果が実際に得られるのか、という疑問に答えるためによくデザインされていると思う。それらはすべて適切で有益な研究である。実際、私は何年か前に、肺活量減少手術を大規模な対照試験の対象にすべきだと激しく主張した。この手術には病態生理学的な根拠があり、セントルイスでは地元での臨床経験もあった。

これらの質問に答えるとすれば、私は賛成である。ランダム化比較試験は非常に有用である。

しかし、視点を変えてみたいと思う。なぜなら、個々の患者のケアについての決定に直面している臨床医が、臨床研究を尊重するあまり、病態生理学的根拠や臨床経験を無視してしまうことに対する私の懸念を理解することが非常に重要だからである。私は集中治療室(ICU)を担当しているので、そのような例が多くなってしまい申し訳ない。例えば、急性呼吸窮迫症候群に対する低潮容積換気は、大規模な無作為化試験で有益であることが実証されているが、目の前の患者さんは、私たちが期待するような反応を示さないかもしれない。深い低酸素血症があるかもしれないが、少量のタイダルボリュームの増加で修正することができる。私は、この患者さんに6mL/kgのタイダルボリュームを使用することを提案している優れた研究結果を無視するか、少なくとも今のところは脇に置いておき、8まで増加させるつもりである。そうしないと、この患者さんに酸素を供給することができず、この患者さんは死んでしまうか、この患者さんには不整脈があって、それを解消することができない。私が主張しているのは、臨床医の視点である。臨床医は、個々の患者について判断を下す際に、病態生理学的な根拠や個人的な経験を用いることができるはずである。公衆衛生に関する政策決定の話ではない。そのような政策決定は、無作為化比較試験によって十分な情報が得られることが多いという点では、あなたに同意する。

ガイアット博士:

まあ、思ったとおり、私たちの間の意見の相違は、おそらく比較的小さく、強調すべき問題だと思うが、これからも見守っていきたいと思う。まず第一に、あなたが証拠の階層化に同意していないにもかかわらず、少なくとも特定の事例においては、あなたは階層化を信じているようである。先ほど紹介した状況では、臨床試験の結果と矛盾する生理学的根拠や臨床経験があっても、少なくともそのような状況の一部では、臨床試験がそれまでの臨床経験や生理学的根拠を切り捨てることができると考えてたね。

トネリ博士:

私は、臨床現場でも、より広い意味でも、病態生理学的な議論や個人的な経験よりも臨床研究の方が説得力がある場合があることに同意したが、だからといって、実際にヒエラルキーを示唆するものではない。実際、あなたもよくご存知のように、ある介入が有益であることを示唆しているように見える最初のランダム化比較試験では、しばしば病態生理学的または経験的な懸念があったが、驚くべきことに、長期的にはその介入が有益ではないことが判明したという例がいくつもある。敗血症患者における活性化プロテインCは、その典型的な例だと思う。このように、病態生理学的な根拠がランダム化比較試験に勝てなかった例がある一方で、ランダム化比較試験が他の経験的な研究によって誤解を招くものであったことが証明され、病態生理学や経験に基づいて懸念を表明していた人々が適切な懸念を抱いていたということもある。

ガイアット博士:

例の件で、2つのことをお伝えする。それは、活性化プロテインCに関する懸念の理由は、試験が利益のために早期に中止されたことであるべきだとする論文が、ちょうどBritish Medical Journal3に掲載されるところである。また、集中治療室のコミュニティには、活性化プロテインCの有用性が認められなかった最終的な試験に失望し、活性化プロテインCを使用する生理学的根拠に非常に魅力を感じた人が多くいたと思う。

トネリ博士:

多くの人が説得力を感じていたとは言いません。実際、あなたが指摘したように、多くの人は、最初の臨床試験を見て、これまでに行われたすべての臨床試験を見て、敗血症に対する単独の介入が有益である可能性は極めて低いと事前に考えていたと思う。臨床家が研究結果をどう解釈するか、特に個々の臨床研究をどう解釈するかは、臨床家の背景知識が大きく影響すると思う。

ガイアット博士:

生理学的根拠については、少なくとも意見の相違があった。確かに、多額の資金を投じて薬を開発した会社は、基礎となる生理学的根拠があると信じてたが、いずれにしても、私たちには意味上の不一致があるように思えてならない。まず第一に、無作為化試験の結果、特に介入の初期の試験を信用しない理由がたくさんあることに同意する。私が現在執筆している本の多くは、無作為化試験を信用しない理由について書かれており、私が開発に携わったGRADEフレームワーク4では、不正確さ、矛盾、集団への適用性の観点からの間接性などの問題のカテゴリーを特定している。先ほど述べたように、試験を早期に中止するという大きな問題や、初期の結果が良すぎるという問題についても書いていた。

このように、無作為化試験の結果を疑うべき理由はたくさんあるが、ヒエラルキーとは何を意味するのかという点で、おそらく意味的な不一致があるように思う。無作為化試験の結果が、それまでの生理学的根拠や臨床経験に勝ることに同意しているようであるが、あなたは、無作為化試験が常にそうなるとは限らないので、それを階層と呼ぶにはまだ早いと主張しているようだ。私は、真っ向から対立させたときに、そうなることが非常に多いので、それをヒエラルキーと呼ぶ準備ができていると思う。これは意味的に微妙な違いなのかもしれないね。

トネリ博士:

私は、それよりも少し先のことを考えている。ヒエラルキーが意味をなさない理由は他にもいくつかあると思う。1つは、臨床研究、病態生理学的根拠、そして個人的な経験について語るとき、これらは3つの異なるタイプの医学知識であり、同じもののバリエーションではないということである。したがって、これらの知識に階層を設けることはできない。ただ、ランダム化比較試験が、私の病態生理学的根拠に明らかに勝てない場合もあると思う。例えば、ホメオパシーの研究で有益性が示唆されていても、遡及的な執り成しの祈りの研究で有益性が示唆されていても、説得力はない。これらの研究は、病気の仕組みに関する私の病態生理学的な理解を覆すことはできない。

3つの医学的知識はそれぞれ種類が違うので、階層化されているわけではない。臨床家が個々の患者さんをケアする際に残されているのは、これら3種類の知識をそれぞれ検討し、それらを比較することである。臨床研究は、非常に説得力のあるものもあれば、そうでないものもある。率直に言って、二人とも同意すると思うが、これらの知識がうまく調和していることがよくある。個人的な経験、病態生理学的な理解、そして臨床研究のすべてが一致しており、非常に説得力があるため、意思決定がしやすいのである。

しかし、そうでない場合、私はヒエラルキーに懸念を抱く。出来の悪い観察試験が、私の個人的な経験に常に勝るという考えは、合理的な議論とは思えない。

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー