健康上の意思決定のためのエビデンス – 無作為化比較試験を超えて

サイトのご利用には利用規約への同意が必要です

EBM・RCT
Evidence for Health Decision Making – Beyond Randomized, Controlled Trials

https://pubmed.ncbi.nlm.nih.gov/28767357/

トーマス・R・フリーデン、M.D.、M.P.H.

はじめに

良好な公衆衛生の実践の基本原則は、すべての政策決定を、オープンで客観的に得られた最高品質の科学データに基づいて行うことである1。治療効果に関するデータの理想的な情報源は無作為化比較試験(RCT)であると考えられていたが,決定的な行動を起こすためのエビデンスを得るための他の方法への関心が高まっており,異なるデータ源の強みを生かし,限界を克服するための新たなアプローチが求められている2-8。本稿では,公衆衛生の観点から,RCTとそれに代わる(時には優れた)データ源の利用について説明し,RCTの主な限界を示し,健康に関する意思決定のための複数のデータ源の利用を改善するための方法を提案する。

よくデザインされた大規模な試験では、無作為化によって既知および未知の要因が対照群と介入群に均等に分配され、交絡の可能性が低減される。しかし、RCTには、その長所とは裏腹に大きな限界がある。2,4,6 RCTは通常、治療効果の持続期間(例:ワクチンの免疫力の低下)を評価したり、まれではあるが重篤な治療の副作用を特定したりするのに十分な試験期間や集団規模を有していない。また、RCTのコストと時間の制約がますます高くなっているため、目的とする結果との相関性が低い可能性のある代替マーカーに頼ることになる。リスクの高いグループを選択すれば、十分な数のエンドポイントが得られる可能性が高くなるが、これらのグループは、より広い対象集団とは関連性がないかもしれない。これらの限界と、RCTの計画、実施、分析に何年もかかることから、RCTが臨床の革新に追いつくことができない。このような限界は、限られた不完全なデータに基づいて公衆衛生上の決定を迅速に下さなければならない感染症の発生など、緊急性の高い健康問題に対するRCTの使用にも影響を与える。また、RCTは、手術手技の違いによる治療効果の個人差を評価する能力にも限界があり、希少疾患に対しては一般的に実用的ではない。

しかし、他の多くのデータは、臨床および公衆衛生上の活動に有効な証拠を提供することができる。新しいプログラムや政策の実施による結果の評価を含む観察研究は、依然として最も重要な情報源であるが、その他の例としては、臨床データや疫学データの集合体の分析がある。1980年代後半、ニュージーランドでは乳幼児突然死症候群(SIDS)の発生率が高かったことから、SIDSで死亡した128人の乳幼児と503人の対照乳幼児の情報を比較する症例対照研究が行われた9。その結果、うつぶせ寝をはじめとするSIDSの危険因子がいくつか特定され、SIDSの発生率を低下させることが明確に知られる前に、乳幼児をうつぶせ寝にしないように親を教育するプログラムが実施された。このプログラムによってSIDSの発生率が大幅に減少したことは、有効性の強力な証拠となった。SIDSを対象としたRCTを実施することは、倫理的にも論理的にも困難であった。同様に、タバコ規制介入のエビデンスベースは、税金、禁煙法、広告キャンペーンなど、有効性の確固たるエビデンスを生み出した政策の結果の分析に大きく依存している。

現在のエビデンス評価システムはRCTに偏っているため、非RCTデータの検討が不十分になる可能性がある10。 観察研究に対する反対意見としては、認識されていない要因によるバイアスの可能性や、これらの研究が治療効果を過大評価するという信念がある11。4,6,13,14 広く引用されている例として、更年期ホルモン療法の使用に伴う心血管系の健康リスクがある。当初、これらの違いは、観察研究の弱点を示していると考えられてたが、その後の解析により、どちらの研究もそれぞれの患者集団に対して有効な結果を示しており、矛盾は閉経の開始に関連したホルモン療法の開始時期に起因すると考えられることがわかった17-21。しかし、ホルモン療法の使用を広く推奨するのは時期尚早であった。行動を起こすのに十分なデータが得られたかどうかを判断するのは難しいことであるが、病気を持たない何百万人もの人々に薬を服用するよう勧める場合には、もっと高いハードルが必要である。この推論は、食品医薬品局が医薬品の安全性と有効性の審査を甘くすべきだと言っているのではなく、有効な可能性のあるすべてのデータソースを厳格に審査すべきだと言っているのである。

どのような研究デザインも完璧ではなく、あらゆる種類の研究から矛盾した知見が得られる可能性がある。以下の例は、すべてのデータソースの長所と短所を認識し、健康上の意思決定に最も有用なデータを得る方法を見つけることの重要性を示している。

代替データソースの妥当性-弱毒性インフルエンザ生ワクチン

公衆衛生プログラムの実施後に厳密な分析を行うことで、ワクチンの効果に関するデータなど、極めて重要な情報を得ることができる。インフルエンザワクチンは他のワクチンと異なり、毎年接種され、その効果が評価されるため、インフルエンザワクチン接種の取り組みの分析はその典型的な例である。インフルエンザワクチンによるインフルエンザ関連疾患の予防効果は、ウイルスの遺伝的変化や、年齢、基礎疾患、過去の感染やワクチン接種などの宿主要因など、多くの要因に影響される。米国では、Influenza Vaccine Effectiveness Networkを通じて、インフルエンザワクチンの有効性がモニターされている。これらのデータは、ワクチン接種によって毎年予防されるインフルエンザ関連の病気、入院、死亡の数の推定値を導き出すために使用され、さらに、公衆衛生上の介入を測定、評価、指導するための重要な情報となっている。

2003年に初めて認可された弱毒生インフルエンザワクチンは、「鼻腔スプレー」として知られており 2007年以降、2歳から49歳までの健康な小児と成人への使用が承認されている。 22 このワクチンは、免許取得後のRCTにおいて、成人と小児の両方に良好な防御効果を示しており 2014年6月には、小児における不活化インフルエンザワクチンに対する弱毒生ワクチンの優れた有効性を示す複数のRCTの結果に基づき、予防接種実施諮問委員会(ACIP)は 2014-2015年のインフルエンザシーズンにおいて、2~8歳の健康な小児への使用を優先する旨を発表した26。しかし、その後に行われた弱毒生ワクチンと不活化ワクチンの有効性に関する観察研究では、弱毒生ワクチンの性能がRCTで示されたものよりも劣っていることが示され27,ACIPは2015-2016年シーズンの健康な小児における弱毒生ワクチンを不活化ワクチンよりも優先的に使用することを更新しなかった。さらに最近では、特に2009年のH1N1パンデミックインフルエンザウイルスに対して、弱毒生ワクチンのワクチン効果がゼロかそれに近いと観察されたことを根拠に、27-29年、ACIPは2016-2017年のインフルエンザシーズンに鼻腔スプレーワクチンを使用しないよう勧告した30。この例では、ワクチン製剤の変更(3価から4価へ)接種対象者の変更(例:自然免疫により生ワクチンが中和された)またはその他の要因により、RCTデータが外的妥当性を欠き、プロスペクティブに収集されたワクチン有効性データと比較して誤解を招く結果となった。今後の研究により、これらの違いの理由が明らかになるかもしれないが、RCTと観察データの両方が必要になるかもしれない。

プログラム条件との関連性-結核の直接観察療法

1946年に行われた結核治療のためのストレプトマイシンのRCT31では、単一の薬剤を使用したために急速に耐性が生じたが、この試験の成功により、英国医学研究評議会と世界中の共同研究者によって40年以上にわたって行われた一連の長期的な結核治療のRCTに拍車がかかった32,33。1958年以降に実施されたアプローチ33は、標準的な第一選択薬を用いた直接観察療法(DOTS)多剤耐性菌に感染した場合には第二選択薬を用いた「DOTS-plus」へと発展した36。

これらの研究の限界は、再発や、まれではあるが悲惨な薬剤耐性結核への進行による健康、疫学、社会的コストを評価していないことである37,38。これらの研究は徹底したモニタリングのもとに行われたが、何千人、何百万人もの患者を治療する大規模プログラムに一貫して適用できる治療法を確立したわけではない。さらに、結核治療法のRCTでは、多剤耐性の発生と蔓延という、まれではあるが破滅的な二次的、集団的影響による有害性を予測したり、考慮したりすることはできないだろう。

多剤耐性結核に対するDOTSおよびDOTS-plusの効果を評価するための非RCT研究の例としては、プログラム効果の意思決定分析39,直接観察された治療方法が異なる地域の患者から分離された菌の遺伝子型分析40,多剤耐性結核の発生に関する疫学的・実験的分析に加えて医療・公衆衛生記録のレビュー41などがある。このような理由から、米国胸部外科学会、世界保健機関、米国疾病管理予防センターは、標準的な治療法として直接観察療法を推奨し続けている。

母集団分析 – 心血管疾患に対するナトリウム摂取量の影響

心血管疾患の主な危険因子は高血圧で、現在、米国の成人の約29%が罹患している43。血圧を下げるための重要な戦略は、過剰なナトリウム摂取を減らすことであり、特に食品供給に変化をもたらす44。また、集団レベルでの傾向から、ナトリウム摂取量の削減が心血管疾患を予防するというエビデンスもある。46 摂取量の適度な削減が達成された6カ月以上のナトリウム削減試験のメタ分析や、十分にデザインされた長期のコホート研究から、ナトリウム摂取量の削減が心血管イベントの発生率の低下と関連するという強力なエビデンスが得られている47,48。

しかし、これらの研究には、通常のナトリウム摂取量の評価、逆因果関係の可能性、不十分なフォローアップ、残余交絡、および検出力不足など、方法論的な欠陥があることが示されている52。長期的な通常のナトリウム摂取量を正確に評価することは、個人のナトリウム摂取量と長期的な転帰を関連付けるコホート研究において重要であり、一定期間に複数回の24時間採尿が必要となる52-54。スポットや単回の24時間採尿では、個人内のばらつきが大きく、補正や大規模なサンプルサイズでは克服できない可能性がある54-56。通常のナトリウム摂取量と排泄量を正確に測定することが難しく、曝露の分類を誤る可能性があるため、コホート研究の有効性を高めるためには複数回の24時間採尿48を行う必要があり、個人の摂取量の測定よりもばらつきの少ない集団平均値を用いた研究デザインの方が、より信頼性の高い情報が得られることが多い57。そのため、ナトリウム摂取量と心血管イベントを集団レベルで評価した研究では、ナトリウム摂取量の削減による有益な効果が示されているのに対し、個人の摂取量を正確に測定した研究ではそのような結果が得られていないのかもしれない54,57。

確立された危険因子であっても、RCTは単純に間違った答えを出すことがある。よく知られている例として、心血管疾患に関する大規模なMultiple Risk Factor Intervention Trial(MRFIT)がある。この試験では、禁煙や運動などの介入による健康アウトカムの差が不十分であることが示された58。より長い追跡調査により、この試験では禁煙や栄養改善による効果が正確に確認された可能性があることが示されたが、この研究では、実質的なライフスタイルの変化の実施と効果の測定における問題点が浮き彫りになった。

一部の研究者は、集団全体のナトリウム削減の取り組みを知らせるために、ナトリウム摂取量の削減が臨床結果に及ぼす影響を調べる大規模かつ長期のRCTを求めているが、このアプローチも同様に実現不可能である。このような試験を行うには、何万人もの参加者を高塩分食または低塩分食に無作為に割り振り、介入を継続し、少なくとも5年間の追跡調査を行う必要がある47。このような試験デザインは、特に現在の食環境における低塩分食の継続の難しさを考えると、現実的ではない。公衆衛生の他の多くのテーマと同様に、異なる方法を用いた研究から矛盾した知見が得られることは予想される。結果を正しく解釈し、適切な行動を勧告するためには、研究方法と測定方法を批判的に分析し、証拠の全体像を検討することが不可欠である59。

希少疾病 – 疾患登録とその他の方法の重要性

60,61 サンプルサイズが小さく、ロジスティック上の制約があるため、これらの疾患のほとんどでRCTが実施される可能性は低く、実用的な情報は、さまざまな方法による異なる患者の治療を綿密に分析することで得られる可能性が高い。このようなアプローチは、多剤耐性結核の一般的な株の治療を成功に導く可能性が最も高いのは、イソニアジド、注射薬、フルオロキノロン系抗生物質であることを明らかにするために用いられた41。希少疾患の臨床治療法の開発に産業界のインセンティブを与えるために1983年に成立した希少医薬品法にもかかわらず、ほとんどの患者の選択肢は限られている。2010年に米国国立衛生研究所が主催したワークショップでは、研究者、擁護団体、利害関係者が参加し、希少生物試料のバイオリポジトリの集中データベースとともに、世界的な希少疾患患者の登録を行う動きがあった62。このような登録はRCTにつながる可能性があるが、十分な研究集団の規模を確保することが障害となる可能性がある。また、これらの登録を利用して、個人の治療や臨床状態に関する標準化された情報を含む詳細なケーススタディを収集し、特定の疾患とその治療に関する理解を深め、罹患した患者の健康を改善することも可能である。例えば、症例報告やケースシリーズから得られる臨床的特徴、治療、転帰に関するデータを標準化して集約することで、診断や治療を改善する方法が明らかになるかもしれない。

コストとインフラ – より現実的な研究デザインによる信頼性の高い結果

追跡期間が長い大規模な観察研究では、RCTでバイアスを最小化するのと同様の方法で、バイアスを最小化するように調整することができる。このような研究では、退役軍人健康管理局(VA)とメディケアのデータを用いて、2型糖尿病のセカンドライン薬であるスルホニル尿素薬とチアゾリジン系薬剤の治療成績を検討した63。この研究では、医師の処方パターンをRCTに近づけるために、スルホニルウレア系薬剤またはチアゾリジン系薬剤を投与する患者を、その医師が前年に処方した頻度に基づいて決定した(つまり、通常スルホニルウレア系薬剤を処方する医師の患者にはスルホニルウレア系薬剤を、通常チアゾリジン系薬剤を処方する医師の患者にはチアゾリジン系薬剤を投与した)。8万人以上の患者を最長10年間モニターした本試験は、糖尿病の第二選択薬の有効性を比較した過去のRCTの20倍の規模と、はるかに長いフォローアップ期間を有している。その結果、チアゾリジン系薬剤と比較して、スルホニルウレア系薬剤による治療では、回避可能な入院のリスクが68%、死亡のリスクが50%高くなることが示され、RCTの多くの限界を回避しつつ、臨床的な意思決定のための強力なエビデンスに基づく情報が提供された。

VAは、高血圧治療におけるクロルタリドンとヒドロクロロチアジドの使用を比較する新しいタイプの無作為化試験も実施している64。どちらも利尿剤で、50年以上前から使用されているが、このタイプの利尿剤を処方されている100万人以上の退役軍人の95%以上がヒドロクロロチアジドを服用しているのに対し、クロルタリドンを服用しているのは2.5%です65。しかし、心血管イベント66の予防や死亡率の低下には、2つの薬剤のうち、より効果の高いクロルタリドンの方が有効であるというエビデンスがある。これらの患者は、3年間の試験期間中、ヒドロクロロチアジド投与群とクロルタリドン投与群に無作為に割り付けられる。この試験デザインにより、インフラが簡素化され、従来の大規模なRCTにかかるコストが大幅に削減される64。米国では、ヒドロクロロチアジドの処方箋が年間約5,000万件発行されており、本試験で確認されたクロルタリドンの使用に伴う心血管イベントのわずかな減少であっても、心血管疾患の予防に大きな効果が期待される。

前進 – 臨床医学の “ダークマター “を克服するために

現代の医療行為の多く、そしておそらくほとんどにおいて、RCTに基づくデータが不足しており、行動のエビデンスとなるRCTが計画されていないか、完了する見込みがない。このような臨床医学の “ダークマター “は、ほとんどの症状において医師に大きな情報格差をもたらし、過去の慣習や臨床的な言い伝えへの依存度を高める4,69,70。より良い方法は、求めている健康上の成果を明確にし、RCTのデータとは別に、あるいはそれと比較して、厳密かつ客観的に評価できる既存のデータがあるかどうか、あるいは新たな研究(RCTまたはそれ以外)が必要かどうかを判断することである。

貴重な健康データを得るための新しい方法が次々と登場している。電子カルテからの情報や患者登録の拡大などの「ビッグデータ」に加え、患者の参加意欲や健康情報の共有が進んだことで、大規模な介入研究に有用なデータが得られるようになり、行動のためのより強力なエビデンスを得るために複数のデータソースを補完的に利用する新たな機会が生まれている71。さらに、RCTの有効性と効率性を高めるために、共同試験や適応型試験などの新しい戦略が実施されており、登録者数の増加、コストの削減、完了までの時間の短縮、治療から恩恵を受ける集団の特定などの効果が期待されている72-74。

健康への介入に関する研究には、唯一の最善の方法というものはない。臨床および公衆衛生に関する意思決定は、ほとんどの場合、不完全なデータを用いて行われる(表1)。研究方法の透明性を高め、主要な結果について標準的なデータ収集を行い、データ統合を改善するために新しいアプローチを用いることは、所見を解釈し、行動のためのデータを特定する上で重要なステップであり、時間の経過とともに結論が変化する可能性があることを認識する必要がある。より多くの研究やより良いデータを求める声は常にあるが、データを待つことは、行動を起こさないという暗黙の決定や、入手可能な最善の証拠ではなく過去の実践に基づいて行動することになりがちである。しかし、データが増えるのを待っていると、暗黙のうちに行動を起こさなかったり、利用可能な最善のエビデンスではなく過去の実践に基づいて行動を起こしたりすることが多くなる。

表1 様々な研究デザインの長所と短所、および政策や実務に影響を与える研究の例を示している

著者から提供された情報開示書は、NEJM.orgで本論文の全文とともに公開されている。

この記事で述べられている見解は著者のものであり、Centers for Disease Control and PreventionやDepartment of Health and Human Servicesの見解を必ずしも代表するものではない。

本論文の初期バージョンの作成と関連文献のレビューに協力してくれたKathryn Foti(M.P.H.),Drew Blakeman(M.S.),Robin Moseley(M.A.T.),および文献検索に協力してくれたJoanna Taliano(M.L.S.)に感謝する。

 

  • 翻訳記事では翻訳ソフトDeepLを使っています。 https://www.deepl.com/
  • 誤訳、文章省略、非リンク化の可能性があります。原文、引用先を参照してください。
  • 下線、太字強調は、管理人によるものです。(例外あり)
Alzhacker