測定方法は1つだけではない 無作為化された臨床試験にはその役割があるが、他の方法論も取り入れることで、研究者はより良い結果を得ることができると批判している。

強調オフ

EBM・RCT

サイトのご利用には利用規約への同意が必要です

無作為化された臨床試験にはその役割があるが、他の方法論も取り入れることで、研究者はより良い結果を得ることができると批判している。

www.apa.org/monitor/2010/09/trials

レベッカ・A・クレイ

ベン・A・ウィリアムズ博士は、無作為化比較試験(RCT)への不信感を抱いてた。彼は、治療法が確立されていない一種の脳腫瘍を患っていたのである。

カリフォルニア大学サンディエゴ校の名誉心理学教授であるウィリアムスは、様々なアプローチの無作為化試験が行われたが、いずれも失敗に終わったと言う。また、第2相試験では、いくつかの薬がごく一部の患者に効果があったものの、第3相試験で検証されていない治療法を手に入れるのは困難だと言う。

「医学は基本的に、この方法でなければ評価しないと言っています」とウィリアムズは言い、彼の担当医が、おそらく彼には効かないだろうが、効くかもしれない治療法を入手するのに苦労したことを語っている。「問題は、一律の考え方です」。

ウィリアムズと同様に、多くの心理学者や医学研究者が、米国国立衛生研究所や食品医薬品局などが臨床研究のゴールドスタンダードとしてRCTを前提としていることに疑問を持っている。RCTは、参加者を無作為に治療群と対照群のいずれかに割り当てる方法であるが、長所もあるが、見過ごされたり無視されたりする重大な限界もあるという。

例えば、実験参加者は一般的に人口全体を代表していないため、RCTの結果が一般的に適用されるとは限らない。また、仮に適用できたとしても、RCTでは、被験者のどの部分が実際に介入の恩恵を受けたかを知ることはできない。

このような批判者は、RCTを完全に否定しているわけではない。むしろ、疫学研究、シングルケース実験、ヒストリカルコントロールの使用、あるいは単なる臨床経験など、他の方法論による証拠で結果を補おうとしている。

長所と短所

RCTに強みがあることを否定する人はいない。

カリフォルニア大学マーセド校の心理学教授であるWilliam R. Shadish博士は,「無作為化試験には,他の研究デザインには見られない2つの特徴がある」と述べている。「無作為化試験は、偏りのない一貫した効果の推定値を得ることができる。」Shadish氏は、RTCを「ゴールドスタンダード」と表現することには抵抗があるようだ。

彼は、「無作為化試験が可能なら、ぜひやってみてほしい」と言う。

しかし、それは必ずしも可能ではない。その性質上、被験者を無作為に割り当てることができない質問もあると彼は言う。例えば、無作為化試験を行うことは倫理的に問題があるかもしれない。

また、RCTが可能であっても、研究者が求めている答えが得られない場合もある。

「RCTは、あなたが扱っているものが蛇足でないことを示すだけです」とWilliamsは言う。「RCTでは、どの患者がその治療法の恩恵を受けるのかという、重要な情報は得られない」とWilliams氏は述べている。

参加者間の異質性を考慮すると、統計的有意性を得るためには、RCTはかなり大規模なものでなければならないと彼は説明する。研究者が最終的に得られるのは、非常に多くの人々の「平均的傾向」であり、「個人として見た場合には、誰のこともあまり代表していないだろう」という指標なのだと彼は言う。

RCTの文脈を超えて、個々の患者に結果を適用することは、さらに問題となる。

ひとつには、RCTの参加者は「非常に稀な集団」であり、介入が最終的に対象とする実世界の集団を代表していない傾向があると、APAの科学部門のエグゼクティブディレクターであるSteven J. Breckler博士は言う。

「医薬品の臨床試験に参加する人たちを考えてみてください。おそらく、他のすべての治療法を試し、何らかの治療を必死に求めている患者です」と彼は言い、研究者たちは、併存する疾患などを持つ参加者を排除することで、さらに対象者を絞り込んでいく。「その試験結果は、あなたや私にも当てはまるのでしょうか?それとも、最初から試験に参加しなかった人たちの集団から得られたものなのでしょうか?」

ブレックラー氏によると、実験は一般的に、内的妥当性(介入に因果関係を辿ることができるかどうか)と外的妥当性(結果の一般化可能性)の間のトレードオフを伴う。

「人々が認識していないようですが、完璧なRCTは内的妥当性を厳密に考慮してデザインされているのです」と彼は言う。

RCTは、心理学的な介入と医学的な介入とでは、特に適していないかもしれないとBrecklerは付け加える。個人差が出にくい生化学的効果を持つ薬とは対照的に、心理学的介入は、性別、年齢、教育レベルなどの要素と相互作用する傾向があるという。

RCTの補完

誰も研究者にRCTをやめろとは言いいていない。むしろ、RCTを他の形式のエビデンスで補完することを推奨している。

「エビデンスに基づく実践は、非常に幅広く多様なエビデンスに基づいて行われるべきです」とBrecklerは言う。「RCTは1つの情報源であるが、他にもたくさんの情報源があります」。これらの情報源には、第2相試験データ、疫学的データ、質的データ、介入を行っている臨床家の現場からの報告などが含まれるとBreckler氏らは言う。

Williamsは、補足的な情報源として、ヒストリカルコントロールの使用を推奨している。

この方法では、研究者は、粗いベースラインを確立するために、以前の非ランダム化試験の結果を調べている。そして、その後に行われた非ランダム化試験の結果をその基準と比較するのである。

この方法では、多くの介入策を短期間で検証することができるとWilliamsは言う。例えば、膠芽腫の治療に関するRCTの失敗に直面した研究者たちは、過去の記録に目を向け、治療開始から6カ月後に疾患の進行が見られなかった患者の割合がわずか15%であったことを発見した。

「標準的な治療にこれを加えれば25%に、2つ加えれば35%になることがわかった。」

粗い比較であることは間違いないが、結果的には有効な研究方法であることがわかった。

FDAもこれに同意し、膠芽腫の治療薬をRCTではなく、複数の第2相試験で過去の標準よりも良い結果を得たとして承認した。

APAの元会長で、イェール大学の心理学と児童精神医学の教授であるAlan E. Kazdin博士は、シングルケース実験も重要なエビデンスのひとつだと言う。多くの被験者と少数の観察者を伴うRCTとは対照的に、シングルケースデザインは多くの観察者を伴うが、多くの場合、被験者は少数である。研究者は、単に事前と事後の評価を行うのではなく、個人、クラス、さらには学校全体の行動を長期的に評価する。

例えば、チック症の患者がいたとする。シングルケースデザインでは、研究者は患者を観察し、1時間あたりのチックの回数を測定する。その後、研究者は介入を行い、時間の経過とともに何が起こるかを観察する。

「治療前の評価と治療後の評価を行い、治療を受けたグループと受けていないグループを比較するだけでは、日ごと、週ごと、月ごとの変化の豊かさが失われてしまう」とKazdin氏は述べ、シングルケースデザインは単なるケーススタディではないことを強調している。

カズディン教授は、RCTに頼りすぎると、さまざまな貴重な情報を見逃すことになると考えている。例えば、アメリカの望遠鏡計画を考えてみてほしい。ハッブル望遠鏡は可視光を見ている。別の望遠鏡はX線を観測し、別の望遠鏡はガンマ線を観測する。ガンマ線を扱う望遠鏡もある。

「何かを研究するときの方法によって、得られる結果が変わります。」「そのため、できるだけ多くの異なる方法を使いたいと思っています」。*

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー