エビデンスに基づく医療のダークサイド

強調オフ

EBM・RCT

サイトのご利用には利用規約への同意が必要です

The dark side of evidence-based medicine

pubmed.ncbi.nlm.nih.gov/8917983/

臨床医の視点から

ラルフ・I・ホーウィッツ博士

ホーウィッツ博士は、内科学の会長であり

イェール大学医学部の内科学部長、医学・疫学教授。

イェール大学医学部医学科・疫学科教授。

この解説は、ホーウィッツ博士がCleveland Clinic Division of Medicine Grand Roundsで行った講演に基づいている。

エビデンスに基づく医療のダークサイド

エビデンス・ベースド・メディシン(アウトカム・ムーブメント)は、米国の医療費のかなりの部分が、証明されていない、あるいは効果のない検査や治療に浪費されていることを公理として受け入れている。そのため、この運動は医療改革や医学教育の中で重要な位置を占めている。その目的は、決して控えめなものではない。1992年、Evidence-Based Medicine Working Group1は、この分野の到来を告げる論文を発表した。その中で、患者の治療においては、臨床研究から得られる証拠が、直感、臨床経験、生理学的根拠に取って代わるべきであると主張している。それ以来、私の所属する病院を含め、多くの施設がアウトカム・ムーブメントの流れに乗り、患者のケアのためのガイドラインを作成している。

アウトカム・ムーブメントの暗黙の了解は、ある事象の発生確率に関する非人間的な知識が、効果的な臨床医学の主要な前提条件であり、伝統的な医師の経験による学習や病態生理学的な推論よりも優れているというものである。この主張は、エビデンスに基づくアプローチと、より伝統的な方法とのバランスを取ろうとする医師に懸念を抱かせる。

アウトカム・ムーブメントを支持する知的な議論にもかかわらず、このアプローチの実際的な側面に対する我々の直感的な反応を調べることは重要だ。あなたが38歳の女性で、貧血と血小板減少症を患っていると想像してみてほしい。あなたは、一連のプロセスに導かれる単純な臨床家と、何百人もの貧血患者を治療した経験を持つ専門家のどちらに治療を受けたいだろうか?我々の多くは、ガイドラインやエビデンスだけではなく、経験に裏打ちされた経験から得られる専門性を好むであろう。そのため、エビデンスに基づく医療という大げさな表現を超えて、エビデンスの限界と医療の「芸術」の重要性を認識することが重要だ。

– エビデンスは不確実性を払拭しない

現代医学における多くの診断・治療行為の有用性を示すエビデンスは非常に強力であるが、臨床判断の指針となるエビデンスが不完全であったり、矛盾していたり、解釈が一貫していない分野も多くある。臨床手技の妥当性を検討した研究を見れば、臨床決定を導くためのエビデンスが不十分な医学の領域があることがわかるだろう。

3つの州で1585人のメディケア患者を対象に行われた上部消化管内視鏡検査に関するある研究では、約17%の患者で内視鏡検査が不適切に行われてた2。同様に、子宮摘出術に関する研究では、16%の手順が不適切とされたが、25%は不確実であった3。

ほとんどの医師は、手技の適応やその他の臨床上の決定が適切であるかどうかについて、確信が持てない臨床状況が多くあることを理解している。しかし、これらの不確実性は、医師の意思決定を麻痺させるものではない。

– 相対的リスク低減と絶対的リスク低減の報告

不確実性の継続的な存在に加えて、エビデンスに基づく医療におけるエビデンスの限界を考慮することも重要である。研究結果の発表方法について考えてみよう。

絶対的リスク低減と相対的リスク低減の有用性

非弁膜症性心房細動の男性525人を対象とした無作為化試験では、プラセボを投与された患者の1年後の脳卒中のリスクは4 . 3%、ワルファリン投与群では0 . 4</h6>

研究者らは、この結果を79%の相対的比例リスク低減と表現し、この2つの割合の差をプラセボの割合で割って算出した。これは、無作為化比較試験の結果を要約して報告する際の最も一般的な方法である。しかし、この79%という相対的なリスク低減は、絶対的なリスク低減である3.4%とは大きく異なる。これは、プラセボ群とワルファリン治療群の実際の発症率の差、すなわち4-3%と0.9%の差である。

絶対的なリスクの差は、臨床家が患者の治療を決定するために必要な情報にはるかに近い。また、絶対的なリスク差の逆数である「number-needed-to-treat(治療に必要な数)」は、臨床上の意思決定において非常に有用である。ワルファリンの研究では、絶対的リスク差の逆数は約30である。したがって、1人の死亡または血栓症による脳卒中を予防するためには、30人近くの患者をワルファリンで治療する必要があることになる。

では,なぜ研究者は比例的なリスク減少として情報を提示するのだろうか?それは、絶対的なリスク減少よりも、比例的なリスク減少の方がはるかに印象的だからである。したがって、より印象的な数値を用いることで、研究者はToday Showに出演したり、プレスリリースを発表したりして、劇的な結果を謳うことができる。

しかし、臨床家はこれに注意しなければならない。一連の研究では、結果の報告方法が医師の治療決定に影響を与えることが示されている5-7。医師は、結果が絶対的なリスクの差として示されるよりも、リスクの比例的な減少として示される場合の方が、はるかに治療法を使用する可能性が高いのである。

医療の技術には、単にデータを適用するだけでなく、データを解釈することも含まれる。医師は、情報の提示方法に注意を払い、患者の治療成果を高めるための判断を下す必要がある。

– サブグループ分析の危険性

例えば、ある医師が58歳の患者を治療しているとしよう。また、その患者が男性ではなく女性だったとする(退役軍人局の協力研究センターで行われたこの研究には男性しか含まれなかった)。このような証拠に基づいて、どのような治療が適応されるであろうか?

このような質問をする医師は、一連のサブグループ分析を求めている。

臨床医は、特定の患者に対する治療の有効性を判断するために、日常的にサブグループ解析を求めている。統計学者や研究者は、そのような分析の実施や報告を拒否するのが常である。なぜなら、サブグループ解析では、実際の生物学的効果ではなく、偶然に発生した肯定的な所見が得られる危険性があるからである。

この研究では,心筋梗塞が疑われる患者17,187人を対象に,日常診療のみ,アスピリンのみ,ストレプトキナーゼのみ,アスピリンとストレプトキナーゼの併用のいずれかに無作為に割り付けた。アスピリンの投与を受けなかった8600人の死亡率は11.8%であった。相対的なリスク低減は20%、絶対的なリスク低減は2.4%であった。しかし、臨床家は「アスピリン治療は特定の患者層に有効か?これは妥当な質問であるが、ISIS 2の統計コーディネーターは、そのようなサブグループ解析を行うことを非常に嫌がってた。その理由を説明するために、大規模無作為化試験でサブグループ解析を行うべきではないという明確な例として評価されている解析結果を発表した。

サブグループ解析の不条理

ISIS 2の研究者は、患者の星座に応じてデータを分析した。サブグループ解析の結果、天秤座と双子座生まれの患者では、1ヵ月後の死亡数がアスピリン群とプラセボ群でほぼ同じであったが、その他の星座では両群間にかなりの差があった8。このことから、研究者たちは、天秤座と双子座生まれの患者にはアスピリンを投与せず、その他の星座生まれの患者にのみ投与すべきではないかと、冗談めかして考えた。これは、サブグループ解析での差が偶然だけで見つかることがあるという点を明確に示している。

サブグループ解析の必要性

逆に、臨床医学で最も強力な観察結果の一つは、否定的な結果が出た試験のサブグループ解析から得られたものである。VA Cooperative Study of Surgery for Coronary Artery Occlusive Disease(冠動脈閉塞性疾患に対する外科手術のVA協同研究)では、安定した狭心症の患者を内科的治療と外科的治療のどちらで治療しても、全体的な死亡率には差がないことがわかった9。しかし、この試験で最も重要な観察結果の1つは、1015人の患者のうち113人の患者のサブグループで得られたものであった10。この差は大きいとはいえ、統計的には有意ではなかった。しかし、このサブグループ解析は、左冠状動脈疾患患者の治療方針として、内科的治療よりも外科的治療を選択する根拠となり、このことはさらに多くの試験で証明されている。

我々はサブグループ解析に注意を払う必要があるが、臨床医は研究者の同僚に、データに対して臨床的な疑問を投げかける必要がある。治療の平均的な効果を知るだけでは十分ではない。どのような患者に、どのような状況で、どのくらいの期間治療を受け、どのような他の治療法と併用することが最善なのかを知る必要がある。これらの質問に対する答えが得られなければ、患者に対する責任を放棄することになる。

サブグループ解析が妥当な場合

私は、サブグループが臨床的に重要である場合や、過去の研究や生物学的メカニズムに基づいて治療法の違いが予想される場合には、サブグループ解析を検討すべきだと考えている。これらの分析は、サブグループによる差が大きく、それがバイアスや偶然では説明できず、他の研究でも再現される場合に信じるべきである。そうして初めて、これらのサブグループ解析は、患者のケアを弱めるのではなく、情報を提供し、改善することができるのである。

– 平均的な患者ではなく、真の患者を治療する

エビデンスに基づく医療の使用をめぐるもう一つの問題は、治療パラドックスである。研究者は、治療に反応すると予想される患者に研究集団を限定し、反応しないと思われる患者を除外する。

例えば、コレステロール低下療法の冠動脈一次予防試験の多くは、コレステロール値が300mg/dL以上の患者を対象としており、これは人口の上位5〜10%にあたる。しかし、冠動脈疾患の患者のうち、男性の70%、女性の50%は、コレステロール値が240mg/dL未満で発症している。では、どうすればよいのであろうか?それとも、臨床試験に参加したことはないが、ほとんどの症例を占めている患者に治療結果を外挿するのか?

この治療パラドックスは、医師が日々直面している基本的な問題である。なぜなら、無作為化試験の結果には、医師が臨床現場で最もよく遭遇する患者が含まれていることはほとんどないからだ。臨床経験では、これらの研究から得られたデータを解釈することが必要であり、決まった答えを適用することはできない。この治療パラドックスを解決しようとする試みは、2つのグループの医師を生み出した。すなわち、研究されていない人にも利用可能な証拠を広く適用することを支持する伝道者と、研究に含まれる人に限定して厳密に適用することを提案するカタツムリである。このように、議論は尽きない。

– 医師は患者を診ているのか、それとも集団を診ているのか?

医師が患者のケアをする際に、集団に対するアプローチを求められることが増えている。全く同じ情報が与えられた場合、医師は集団に対して個人と同じ、あるいは異なる決定を下すのだろうか?

ある研究では、個人と集団という異なるシナリオで、医師に判断を求めている11。あるシナリオでは、疲労感、不眠、集中力の低下を訴える大学生が登場した。あるシナリオでは、疲労感、不眠、集中力の低下を訴える大学生が登場し、一般的ではないが治療可能な症状に対して、追加の血液検査を指示すべきかどうかを医師に尋ねた。医師は、医療計画に含まれる同じような患者の集団よりも、個々の患者について判断を求められた場合、検査を指示する傾向が強かった。

医療機関と医師の間の緊張感の源

医療保険制度にとっては、患者の集団にとって最良の結果を得ることが主要な目的であり、一方、医師の主要な義務は、個々の患者にとって最良の臨床結果を得ることである。しかし、ヘルスプランは個々の患者のケアに対して対価を支払う。逆に言えば、医師が個々の患者のために行う決定は、医師が最適な結果を達成したいと考えている患者の集団の集合体につながる。

このように、個人と集団のどちらを治療するかという選択をめぐる緊張関係は、多くの場合、医療機関と医師の間だけで起こると考えられている。しかし、そう単純な話ではない。このような緊張関係は、個々の患者のケアについて意思決定をしなければならない医療機関自体にも存在する。医師も同様に、個々の患者をケアしながら、自分の診療所を構成する患者集団に最善のケアを提供しているかどうかを確認しなければならないという緊張感があるのである。

– 肯定される医療の技

私は、臨床科学が医療技術を支えると信じている。エビデンスに基づいた医療を行うためには、個人的な経験、類推、外挿などを用いた臨床判断が必要である。しかし、このような医学の科学と芸術の相互作用により、医師は患者のリスク嗜好を知る責任が増す。1回の出血を犠牲にして3回の塞栓性脳卒中を防ぐために100人の患者を治療する必要があることを知っている患者は、同じデータを提示された別の患者とは異なる治療方針を決定するかもしれない。

医学の芸術は、データが不完全で不鮮明な場合に花開く。これは医学の多くの部分に当てはまる。人道的医師が、個々の患者のニーズに応えようと努力すれば、医療技術は発展する。患者のケアは、ガイドラインを適用するのではなく、情報を解釈する行為である。

この解釈の行為によって、医師は恵みを受けるのである。科学的な証拠は、医師の経験、推論、そして患者とその好みに関する知識と融合しなければならない。

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー