エビデンスに基づいた医療の明暗

サイトのご利用には利用規約への同意が必要です

研究方法

Bright and dark sides of evidence-based medicine

https://pubmed.ncbi.nlm.nih.gov/27149007/

要旨

エビデンスベース エビデンスベースの医学は、臨床医学の実践と教育の現在のパラダイムである。この概念医学は、広く、高品質のメタアナリシス、医学研究、特に無作為化臨床試験(RCT)とそのメタアナリシスから得られた証拠を使用して臨床的意思決定を最適化すると考えられている、彼らは出版バイアスとして、観察研究と比較してバイアスのリスクが低いと関連付けられている。しかし、RCTは無作為化臨床試験に限界がないわけではなく、その結果は様々な理由で歪められる可能性がある。この論文では、特に出版バイアスに焦点を当てて、RCTの最も一般的な試験の欠点をレビューする。

証拠に基づいて有罪判決を下し、証拠が正当化する程度や確実性のみを与える習慣は、もしそれが一般的になれば、世界が苦しんでいる病気のほとんどを治すことになるだろう。(バートランド・ラッセル、1957年)

はじめに

エビデンスに基づく医療(EBM)とは、「個々の患者のケアに関する意思決定を行う際に、現在の最善のエビデンスを良心的、明示的、判断的に利用すること」と定義されており、臨床医学の実践と教育における現代のパラダイムである1 。EBMの実践的な方法論は、1980年代後半から 1990年代前半にかけて、カナダのオンタリオ州ハミルトンにあるマクマスター大学の臨床疫学者であるGordon GuyattとDavid Sackettによって開発された1,3。EBMの目的は、プロパガンダから証拠を分離すること、仮定から確実性を分離すること、アサーションから研究結果を分離すること、迷信からレシオナリズムを分離すること、伝承から科学を分離すること、そしてドグマから知識を分離することと定義されている。

臨床的意思決定の基礎となるエビデンスに基づく医療

EBMでは、質の高い医学研究から得られたエビデンスを用いて臨床的意思決定を最適化することが期待されている。

しかし、研究の結論は確率論的なものである。したがって、「エビデンスに基づく」と「エビデンスに基づかない」を単純に区別することはできない。したがって、バイアスのリスク、すなわち、観察された効果が真であるという確実性のレベルを定義する必要がある。エビデンスの確実性の等級付けにはいくつかのシステムがあり、その多くは(いくつかの簡略化をして)信頼度が低下する5つのレベルを含んでいる。

レベル1 よく計画され、実施された無作為化比較試験(RCT)とその体系的メタアナリシス

レベル2 コホート研究とその系統的な再検討、または質の低いRCT

レベル3 症例対照試験とそのシステマティックレビュー

レベル4 歴史的症例シリーズとそのレビュー

レベル5 症例報告と証言

この分類は、治療ガイドラインのグレード分けに用いられ、最強(一貫性のある結果が得られた複数の質の高いRCTに基づくもの、あるいは特別なケースでは単一の大規模で質の高いRCTに基づくもの)から最弱(直接的な研究エビデンスがなく、経験的根拠に基づくもの)までのグレード分けが行われる。ガイドラインの実施により、臨床判断の科学的基盤が強化され、医療の一貫性、効率性、質、安全性が向上することが期待されている。

治療ガイドラインは一般的にRCTとそのメタアナリシスに基づいて作成される。

医学:科学か芸術か?

その利点にもかかわらず、RCTには限界がないわけではない。第一に、RCTはその設計と実施に欠陥がある可能性がある。例えば、治療的RCTの欠点としては、患者数の不足、研究群における予後因子の不均衡な分布、患者のコンプライアンスの低下、プロトコルの不備、他の薬剤の併用などが挙げられる。さらに、RCTの方法論は臨床とは無関係であるかもしれない(例えば、参加基準が非常に制限されているため)。最後に、最も強力なエビデンスを提供する大規模RCTは、費用がかかり、実施が困難である。その結果、医学界が最も関連性が高いと考えている研究テーマ(特に実際の臨床に基づいた実用的な試験)よりも、スポンサーの利益に左右される研究テーマに優先順位を置くことになるかもしれない。実際、臨床試験の約 80%は企業がスポンサーとなっているが、その理由は資金調達が容易であり、設計が容易であるからである4。

EBMは、これまで軽視されてきた研究エビデンスの役割を強調するものとして、大きな熱意と希望をもって受け入れられた。しかし、時が経つにつれ、EBMは常に臨床経験を補完するものとして捉えられるべきであるという認識が高まってきている。例えば、治療的RCTは、ある治療法が他の治療法よりも平均的に効果が高いかどうかを定義するものではあるが、個々の患者をどのように治療するかという問題に答えるものではない。したがって、臨床研究の相互紹介は、結果の妥当性や重要性、臨床現場での妥当性などを含めて批判的に行われなければならない5。また、EBMを適用する際には、最良の研究エビデンスと治療の有効性やコストを統合し、患者の価値観や嗜好、期待などを考慮しなければならない1,7,8。EBMをめぐるこの議論は、医学は芸術か科学かという古典的な問題に立ち返るものである。

過小評価されている問題は、RCTの結果が「現実の」日常臨床で見られるものと一致しているかどうかである。患者の選択や治療コンプライアンスの違いにより、プロスペクティブな臨床研究から得られた結果を実際の臨床現場に単純に外挿することはできないことを示す多くの証拠がある。実際、日常臨床における治療効果は通常、臨床研究で報告されたものよりも低く、毒性は高い。9,10 多くの治療的介入の基盤はまばらであったり、質が低かったりするため、臨床上の推奨事項はますます低レベルのエビデンスに基づいているように思われる11。 糖尿病に対するインスリン、大きな傷に対する縫合、心室細動に対する除細動など、一般的に受け入れられている治療介入は数多くあるが、RCTでは取り上げられていない(そして今後も取り上げられない可能性が高い)12,13 。しかし、有効性のエビデンスが欠落しているからといって、有効性がないという証拠を意味するものではない。

良いこと、悪いこと、醜いこと

診療所でのEBMの適用は、適切に実施されたRCTの解釈の誤りによっても影響を受ける可能性がある。この問題の良い例としては、乳がんの術後内分泌療法として知られているタモキシフェンとアロマターゼ阻害剤の2つの治療法を比較したRCTがある。何万人もの患者を含むこれらの研究では、ほぼ一様にアロマターゼ阻害剤の方が無病生存期間がわずかではあるが有意に増加することが示されたが、全生存期間の増加は認められなかった。どちらの治療法も通常、QOLは同等であり、毒性プロファイルは異なっていた(どちらか一方に有利というわけではないが)。それにもかかわらず、これらの研究の結果は、アロマターゼ阻害剤の明らかな優越性を示唆するような形で提示されていた14 。このような解釈は、タモキシフェンをアロマターゼ阻害剤に置き換える大規模かつ部分的に正当化されていない結果となった。このような医療現場での誤解のもう一つの例として、進行膵臓癌を対象としたエルロチニブ(エピダーマル成長因子受容体阻害剤)を用いた化学療法と用いない化学療法を比較した研究がある15。にもかかわらず、エルロチニブは有益であると考えられ、臨床現場で広く応用されていることがわかった。

最大の脅威

出版バイアス 多くのRCTの限界は、患者数が少ないことであり、その結果、比較の統計的な力が低いことである。この弱点は、メタアナリシスやシステマティックレビューを適用することで部分的に解決されているが、これは過去の定量的研究を統合し、要約し、レビューすることで統計的な力を高めるものである。メタアナリシスの限界は、レトロスペクティブなデザインであること、標準的な治療法の経時変化を考慮していないこと、一次研究の異質性などである。しかし、最も重要なことは、メタアナリシスおよびシステマティックレビューは、発表されているかどうかにかかわらず、関連するすべての研究が含まれている場合にのみ信頼できると考えられることである。この原則に違反すると、公開バイアス(publi-cation bias)が生じる。これは、20世紀末に定義された現象で、研究結果の強さと方向性に基づいて、投資家が原稿を提出したり、ジャーナルがそれを採用したりする傾向がある。

この問題を実証している例は数多くある。最も顕著なものの一つは、2008年に発表された抗うつ薬に関するRCTsのレビューである18;米国食品医薬品局(FDA)に登録された74の研究のうち、POLSKIE ARCHIWUM MEDYCYNY WEWNĘTRZNEJ 2016;126(5)31%(3449人の研究参加者を占める)は発表されなかった。肯定的な結果が得られたとFDAによって考慮された37の研究のうち、36の研究が公表されたのに対し、否定的または疑問のある結果が得られたのは3つだけであった。残りの33の研究のうち、22の研究は公表されず、11の研究は肯定的な結果を伝える方法で公表された。結論から言うと、公表された文献に基づいて、実施された試験の94%が陽性であったのに対し、実際には試験の51%がFDAによって陽性と見られていた。Krzyżanowska et al 19は、臨床腫瘍学のアメリカ社会性(ASCO)の年次総会で事前に発表された大規模なRCTを発表するために失敗に関連する要因を分析し、世界で最も普及している腫瘍学の会議。この発明には、1989年から 1998年の間にASCOの会議で事前に発表された大規模RCTのすべての要旨が含まれていた。510件のRCTのうち、26%は会議での発表後5年以内に完全な結果が発表されておらず、そのうちの19%が「陽性」、32%が「陰性」であった(P <0.001)。また、有意な結果が得られた研究とそうでない研究では、発表までの期間に非常に有意な差があった(それぞれ2.2年と3.0年;P <0.001)。もう一つの例は、さらに驚くべきものである。国立衛生研究所が登録した 2028 件のオンコロジー RCT のうち、PubMed に掲載されたのはわずか 17.6%で、学術機関がスポンサーとなった試験の 59%と産業界がスポンサーとなった試験の 5.9%が含まれている2 0 RCT の合計 65%が結果を肯定的に報告しており、学術機関がスポンサーとなった試験の 50%と産業界がスポンサーとなった試験の 79%が含まれている。

資金調達や被引用の競争が激化した結果、統計的に有意な結果、つまり「より良い」結果を示す発表の頻度が増加しており(1990年から 2007年の間に分野を超えて22%以上)の増加この傾向は生物医学的科学の分野ではさらに強くなっている21。検索対象は、コクラン方法論登録、MEDLINE、EMBASE、Ovidの主要な公開データベースに加え、Science Citation Indexであった。特定の研究の所見は、陽性(P <0.05で統計的に有意、印象的または重要と認識される、または効果の正の方向性を示す)または陰性(統計的に有意ではない、重要ではないと認識される、または効果の負の方向性またはヌル方向性を示す)のいずれかに分類した。肯定的な所見が得られた試験は、否定的な所見やヌルな所見が得られた試験と比較して、発表される確率が4倍近く高くなった。さらに、陽性所見が認められた試験は、陰性所見が認められた試験では6~8年後に発表されるのに対し、4~5年後に発表される傾向があった。

公表に偏りが生じる理由としては、いくつかの可能性が考えられる。第一に、スポンサーが研究者に陰性の研究を公表することを奨励しないか、あるいは積極的に 抑制している可能性がある。第二に、発表に値しないと判断された研究を発表しようとする研究者の熱意がある。最後に、そのような研究は、特に広く信じられている信念や概念と矛盾する場合には、公開に受け入れられる可能性が低い。その結果、否定的な研究はますますファイルの引き出しの中に隠されたままになっている。
発表バイアスは、倫理的にも科学的にも重要な意味を持つことがある。前者には、患者が臨床試験への参加を善意で受け入れ、将来の患者のケアの向上に貢献していると確信していることが含まれる。さらに、医療界は研究成果の公正な普及を期待している。肯定的な研究と否定的な研究が同じように行われているのであれば、科学的な根拠からすれば、研究を公表しないことは有害ではないのであるが、そうではないことが明らかである。このように「ポジティブな」研究と「ネガティブな」研究の公表が明らかに歪んでいることは、誤解を招く医学的知識を広めることになり、その結果、臨床上のあらゆる結果を招くことになる。

その場での出版バイアス

このバイアスは、研究内容に関係なく、研究者が何を分析し、どのように分析し、何を報告するかを自由に決めることができるという事実に起因している。肯定的な結果を追求することには、分析変数や分析手法の事後的な選択、同じデータセットからの複数の分析、サブグループ分析の過度の重要性の帰属など、広範で容認できない統計学的な操作(「データマッサージ」)が含まれる。このような偏った報告は、特定の研究の中から選択された、無計画ではあるが、他の意味で最も魅力的な側面だけをピックアップして発表することになる。このような偏った報告の例として、ヒト免疫結節不全ウイルス(HIV)ワクチンの有効性を評価した米国の試験がある。この「陽性」の発見は、多重検査の補正を含まず、事前に決められた仮説に基づいていなかったにもかかわらず、この研究は有望なものとして大衆紙やビジネス紙に発表され、大きな注目を集めた2 5 この研究の評価は、同じ空胞を用いた後続の研究の結果が陰性であったにもかかわらず、長く維持された2 6。

誤解を招くようなメッセージのもう一つの例は、乳癌の術前治療においてアロマターゼ阻害剤であるレトロゾールとタモキシフェンを比較した研究である27 。この研究の最初の発表では、全体的な結果は示されなかったが、その代わりに、HER1/2陽性患者の少数のサブセットにおいて、タモキシフェンよりもレトロゾールの方が優れていることが強調されていた(タイトルでさえも)。この知見は、ポストホックの無計画な探索分析の結果であり、複数の比較は考慮されなかったが、権威ある雑誌に「迅速な発表」との評価を与えられた。結果として、その後の研究で否定的な結果が出たにもかかわらず、この報告は、他の設定でもHER2陽性の患者にアロマターゼ阻害剤を選択的に使用するという不当な傾向を生み出した。

解決策は?

限界があるにせよ、EBMは医療処置の結果を確認するための最良の方法であり、現代の医療には欠かせないものであることに変わりはない。しかし、そのベースとなる臨床研究には重要な欠陥や限界がある。欠陥のある臨床研究は、方法論の改良や査読方針の厳格化によって軽減されるかもしれないが、出版バイアスの問題が残っている。健康科学の文献には、真の値よりも大きな効果を示す傾向の多くの例がある。このような慣行は、非常に混乱を招く結果をもたらし、誤った方針の普及につながる可能性がある。このような問題を特定し、理解し、対処するための体系的な努力が必要であることは明らかである。簡単な解決策としては、結果にかかわらず、すべての研究と特定の研究のすべての結果を公表するという 一般的なルールが考えられる。この仮定は、オンラインジャーナルの時代には容易に実現できるが、科学界の幅広いコンセンサスが必要である。一方で、レビューやメタアナリシスに関連するすべての研究を含めるために、未発表の知見を特定するためのあらゆる努力をすべきである。

過去数年の間に、臨床再検索の質を向上させ、出版バイアスのリスクを低減させようとする試みが数多く行われてきた。2005年、国際医学雑誌編集者委員会(ICNJE)は、最初の患者が登録される前に登録された試験のみを出版の対象とすると宣言した28 。すべての医学雑誌がこの義務を厳格に承認し、完全に実施することで、出版バイアスの規模を大幅に縮小することができる。最も最近、ICNJEは、論文の所見の再現を可能にするために、インターベンショナル臨床試験によって生成された非同定の患者データを著者が他の人と共有すべきであると提案した2.9。2014 年、The Lancet は、生物医学研究の質を向上させ、すべての知見を公表することを目的とした運動(REduce research Waste And Reward Diligence; REWARD)を開始した(http://www.thelancet.com/ campaigns/efficiency)。このイニシアチブは、世界中の生物医学研究に毎年投資されている 1 兆ドルのうちの 3 分の 1 を占めているが、その大部分は、設計、実施、報告が不十分であるために無駄になっているという前提に基づいている。REWARDの目的は、資金提供者、規制当局、学術研究機関、学術雑誌、研究者の能力を体系的かつ継続的 にモニタリングすることによって達成されるべきである。

本論文では、EBMをめぐる論争をハイライトし、生物医学研究データの臨床応用における課題を示している。EBMをよりよく理解し、EBMの欠点に対処することで、臨床的な意思決定を最適化することができるかもしれない。