ランダム化比較試験におけるメカニズムと不確実性 Deaton and Cartwrightの解説

強調オフ

EBM・RCT

サイトのご利用には利用規約への同意が必要です

Mechanisms and uncertainty in randomized controlled trials: A commentary
on Deaton and Cartwright

pubmed.ncbi.nlm.nih.gov/29703448/

2018年8月

Etsuji Suzukia,b,∗, Tyler J. VanderWeelea,c

voxeu.org/content/problems-randomised-controlled-trials

1. 生物医学および社会科学では不確実性が蔓延している

人間の体は非常に複雑である。細胞の遺伝子装置でさえ、非常に複雑で自己制御的な生化学システムである。現在、多くのことが解明されているが、まだ多くのことが研究されていない。生化学系の決定論的な振る舞いは、しかし最終的には、量子力学の法則に支配された非常に多数のランダムな事象の集合的な結果である(Hanin, 2017)。人間はさらにもっと複雑である。不確実性は、自由な行動、原則に従うことも放棄することもできる自由意志や能力、理性的な生き物でありながら不完全な理性を持っていること、そして人間同士の相互作用における不確実性など、人間の本質に由来している。紛れもなく、人生は予測不可能なものである。生物学から人間の行動まで、不確実性と複雑性は生物医学と社会科学に蔓延している。DeatonとCartwright(2018)は、その不確実性と複雑性に直面して無作為化比較試験(RCT)ができることとできないことを広範囲に記述するという素晴らしい仕事をした。

無作為化は強力であり、Deaton and Cartwright (2018)が文書化したように、並外れた複雑さと大きな不確実性に直面しても、平均的な因果効果の推定を進歩させることができる。不確実性の問題に対処するためにRCTではできないことに関する彼らの議論の多くは、それ自体が十分に大きい試験によってほとんど回避されるが、多くの試験が小規模であることはもちろんであり、彼らが提起する懸念の多くは慎重に考え、評価しなければならない。ここでは、RCTにおけるメカニズムの問題と、そのような試験結果の相互予測、そこからの推定、およびそこからなされる推論との関連性に焦点を当てたいと思う。

2. ランダム化比較試験におけるメカニズムと十分な原因

Deaton and Cartwright (2018) は、「生物学における因果プロセスの説明を理解する上で、メカニズムは特に重要である」と書いている。メカニズムの意味は分野によって実質的に異なるかもしれないが、メカニズムの概念を注意深く精査することで、生物医学や社会科学において不確実性やランダム性が横行している理由を理解するためのさらなる洞察を得ることができる。この点では、十分原因(sufficient cause)モデルが有用なフレームワークとなっている。このモデルはRothman(1976)によって疫学の分野で説明され、生物医学における因果関係の理解を形成していた。同様のモデルは、哲学(Mackie, 1965)、法律(Wright, 1988)、心理学(Novick and Cheng, 2004)にも存在する。このモデルでは、因果関係は、それぞれが結果をもたらすのに十分な、異なる因果メカニズムの集合体として概念化される。これらの因果機構は「十分原因」と呼ばれ、各十分原因は最小限の条件、すなわち「構成原因」からなり、特定の因果機構の構成原因がすべて存在するときには、その因果機構が作動し、必然的に結果が生じることになる。

重要なことは、十分原因モデルは、因果関係が多因子現象であることを明確にしていることだ。私たちが研究しようとしている健康上または社会上の結果を生じさせるのは、多くの条件の組み合わせである。ほとんどの集団保健の現場では、結果的に「原因」を特定しようとすることは意味がなく、むしろ「原因」を研究することになる(VanderWeele, 2017)。さらに、特定の原因メカニズムが作用するために多くの条件が必要な場合、病気の発症を防ぐためには、そのうちの1つだけを排除すれば十分な場合もある。このように、十分な原因に複数の条件が必要な場合、それらは十分な原因という意味で効果的に相互作用し、それぞれが特定のメカニズムを作動させるために他方を必要とするのである。このようにして、病気を大幅に減らすのに十分な数の原因を研究し、特定することができるのである。同じ十分原因の中に多くの原因が存在する場合、それらのいずれかを排除すれば、定義上、その十分原因は機能しなくなり、「寄与割合」(attributable fractions)「病因分画」(etiologic fraction)の重要な区別が生まれる(Greenland and Robins, 1988; Suzuki et al, 2012)。十分な原因の枠組みの中で、我々は通常、対象となる健康アウトカムが発生する時点で存在しなければならない、あるいは発生していなければならない不特定の事象、条件、および特性を表すために、1つの構成原因を含める。未知の原因の必要性または測定されない成分の原因は、不確実性が生物医学および社会科学において猛威を振るっていることを思い出させてくれる。また、交絡や共変量のバランスの概念を区別し、関連付けるためにも使用できる(Suzuki er al)。 DNAベースのタイピングの時代になっても、個人における十分な原因や因果関係のメカニズムのセット全体を観察しようとどんなに熱心に努力しても、それは不可能である。実際、1人の個体における1つの十分原因の中のすべての構成原因を特定することは、人間の手の届かないところにある。その上、個人における十分な原因の構成は、瞬間ごとに変化する可能性があり、個人はいくつかの十分な原因のリスクにさらされたり、影響を受けたりする。このように、時には圧倒されるような概念化は、生物医学や社会科学において、個人内の変化だけでなく、個人間の変化も多く存在するという事実をよく表している。

このように因果関係を多元的に理解することで、因果システムの複雑さを把握することができる。RCTでは通常、1つの原因の効果を検証するが、それは他の多くの原因の存在または不在の文脈の中で行われる。この複雑さを理解することで、他の構成要素の原因の分布が集団によって異なれば、平均的な因果効果も異なることがわかる(Rothman, 1976)。さらに、集団内の異なる個人における基本的な構成要素の原因のパターンが異なれば、効果の不均一性が生じる。関心のある結果の因果関係に関与する可能性のある構成因が多数あることから、効果推定値を外挿することが困難であることも明らかである。

3. ランダム化比較試験におけるメカニズムとパスウェイ

メカニズムの別の理解は、因果事象の連鎖に関するものである。すなわち、治療Tは、ある変数Mを変化させ、それが結果Yに影響を与える。その変数Mは、結果Yに対する治療Tの効果の媒介者であると言われることがある。「媒介分析」(mediation analysis)と表現されることもある分析手法は、このようなメカニズムや経路、因果連鎖を評価し、媒介者を介して作用するいわゆる「間接効果」と、媒介者とは独立した「直接効果」の大きさを推定しようとするものである(MacKinnon, 2008; VanderWeele, 2015)。このような媒介分析の手法は、経済学ではあまり発展していないが、心理学(Baron and Kenny, 1986)や社会科学では何十年も前から使われている。最近では、統計学や疫学において、反実例や潜在的なアウトカムの枠組みの中で発展し、位置づけられている(Pearl, 2001; Robins and Greenland, 1992; VanderWeele, 2015)。このような媒介メカニズムは、同様に一連の十分な原因という観点からも定式化することができる(Hafeman, 2008; Suzuki er al 2011; VanderWeele, 2009)。

ポテンシャル・アウトカムの枠組みの中で媒介メカニズムの質問を組み立てることで、RCTがメカニズムの理解に何をもたらし、何をもたらさないかが明確になる。現在では、治療Tの完璧で大規模なRCTであっても、これらの媒介の疑問を評価するためには、さらに検証不可能な仮定をしなければならないことがよく知られている(Pearl, 2001; Robins and Greenland, 1992; VanderWeele, 2015)。具体的には、たとえ治療Tが無作為化されていても、直接効果や間接効果を評価するためには、媒介者と結果の交絡を調整するのに十分な共変量をコントロールしなければならないということだ(Judd and Kenny, 1981; Pearl, 2001; Robins and Greenland, 1992; VanderWeele, 2015)。治療法Tは無作為化されていても、媒介者Mは一般的には無作為化されていない。媒介、メカニズム、間接効果について語るとき、私たちは因果関係を主張することになるが、その際、関連性が治療法Tに関してだけでなく、媒介者Mに関しても因果関係があると解釈できるかどうかを考慮しなければならない。Deaton and Cartwright (2018)が提起した複雑さは、さらに悪化する。進歩することもあるが、完璧で大規模なRCTからでさえ、媒介についての推論は一般的には暫定的なものに過ぎない。

しかし、そのような媒介分析自体がRCTに何をもたらすのであろうか?まず、関連するメカニズムを特定できれば、なぜ特定の治療が成功したのか、あるいは失敗したのかを理解するのに役立つかもしれない。

ある治療法が成功したのか、失敗したのかを理解する助けになるかもしれない。それは、理論を強化し、確認する、または代わりに反論するのに役立つ。特定の治療法が失敗した場合、その治療法がほとんど効果を発揮しなかったのは、仮説されていた主要なメカニズムを変化させることができなかったからなのか、それとも実際に仮説されていたメカニズムに影響を与えたが、そのメカニズム自体は結果にほとんど影響を与えなかったのかを理解するのにも役立つ。また、メカニズムを理解することで、治療が結果に与える因果関係をより強く主張できる場合もある。治療法が結果に関連する他の多くの変数を変化させたことがわかっていれば、因果効果の推定値を不確実性のために偽りであると説明することは難しくなる。また、後述するように、メカニズムを理解することは、RCTの結果を他の集団に外挿する場合にも役立つかもしれない。因果効果のメカニズムを理解していれば、同じメカニズムが他の集団や文脈でも機能していると思うかどうか、あるいはその証拠があるかどうかを問うことができる。

4. ランダム化比較試験とメカニズムから得られる知識

メカニズムを理解することで、知識と推論の幅広い構造の中でRCTをよりよく位置づけることができるかもしれない。RCTの結果から何がわかるのであろうか?うまく実施され、意図的または非意図的な分析エラーがなく、正直に報告されていれば、しばしばかなりの不確実性を伴うが、研究対象のサンプルに対する因果効果の偏りのない推定値を得ることができる(Suzuki er al)。 しかし、Deaton and Cartwright (2018)が指摘するように、我々はしばしばそれ以上のことを知りたいと思う。私たちは外挿したいー多くの場合、因果効果の推定値の一般性についての議論を通じて、あるいは、数値的なトランスフォーム/トランスポーテーションを通じて(Stuart er al 2018)。私たちは、私たちの推定値、あるいは少なくとも効果の方向性が、集団や設定を超えて一貫しているかどうかを知りたいのである。媒介という意味でのメカニズムの理解が深まれば、効果の方向を新たな集団に外挿する際に、より確信が持てるようになるかもしれないし、十分な原因という意味でのメカニズムの理解が深まれば、因果効果の大きさを異なる集団に外挿する際に、より謙虚になれるかもしれない。

メタアナリシスは、時に私たちを一歩先に進めることができる(Borenstein et al 2009; DerSimonian and Laird, 1986)。十分な数のデザインされたRCTがあれば、「メタアナリシスで採用されたタイプの設定からランダムに抽出された新しい設定と集団では、その集団の因果効果は少なくとも95%の確率でxとyの間になると予想される」というような記述ができることがある(IntHout et al 2016;Riley et al 2011)。しかし、多くの場合、このような声明を生み出すためにメタ分析に含まれた研究の種類と分布にはかなりの曖昧さがあり、したがって、このような声明が目下の新しい設定に本当に関連しているかどうかに関しては、かなりの不確実性が残っている。さらに、メタアナリシスから得られる予測区間が広すぎて、意思決定の優先順位や費用対効果の分析にあまり役立たないこともよくある。私たちは、効果の大きさに関する知識に対して、謙虚な姿勢を取り戻している。

このような状況が、Deaton and Cartwright(2018)が触れている、設定を超えて外挿できる可能性のある効果測定法を探し出すという問題の動機となっているのかもしれない。彼らは、様々なレベルの自己負担を伴う医療費の弾力性について、おそらく十分な正当性を持たずに他の人が行った方法についてコメントしている。生物医学の世界では、多くの病気のプロセスにおいて、曝露と病気の結果に関連するリスク比は集団間で均質であるという考えが広まっている(Fletcher and Fletcher, 2005; Schulz et al 2010)。社会科学者は、疫学者がなぜリスク比を使うのか疑問に思うことがある。それはおそらく、少なくとも理由の一部である。この主張を裏付ける証拠は、同質性の検定が比の尺度よりも差の尺度でより頻繁に棄却されることを示唆するメタ分析の調査から得られるのが一般的である(Deeks, 2001; Engels et al 2000; Sterne and Egger, 2001)。) しかし、このような証拠は、両方の測定値が異質で、間違いなく同じ程度であっても、これらのテストの検出力が設定によって劇的に異なる可能性があるため、浮いている(Poole er al 2015)。

より説得力のある証拠は、多数の被曝を同時に注意深くモデル化した場合に得られるものであり、そのようなモデル化によって、1つの被曝が他の多くの被曝の層に及ぼす影響は、リスク比の尺度では実際に定数に近いことが多いことが示唆されている(Maas er al)。 もしこれがすべての関連する測定されていない共変量にも当てはまるのであれば、確かに集団間でのリスク比の同質性も示唆されるだろう。しかし、現在のところ、このような種類と強度の経験的な証拠はまだ比較的限られている。さらなる研究により、リスク比やその他の効果指標が設定を超えて一定であると期待することが合理的な場合とそうでない場合を明確にできるかもしれない。生物学的システムにおけるある種のメカニズム的パターンは、それ自体が同質のリスク比やリスクの差異を生み出す可能性があると提案されている(Thompson, 1991; VanderWeele and Knol, 2014)。これは究極的には、因果関係の有無だけでなく、その大きさを推定するのにも役立つ知識である。しかし、このような知識を確立するには、まだまだ長い道のりがありそうである。そして、このような同質性のパターンは、社会的相互作用や社会的曝露の意味が文脈や文化によって異なる可能性が高い社会科学の現場よりも、現象を支配する比較的普遍的な法則がある生物医学の現場でより一般的であることが判明するかもしれない。このような背景がなければ、複数のRCTを用いて得られた知識であっても、余計なことをしたり、一般化できるかどうかについて、大きな不確実性が残ることになる。

5.不確実性と認識

不確実性はしばしば好ましくないが、不確実性について知らないままでいることはさらに好ましくない。Deaton and Cartwright (2018)の論文にあるように、不確実性を理解し、RCTに関する数多くの潜在的な誤解を理解するように、私たち一人ひとりが常に努力すべきであることは疑いのない事実である。そうすることで初めて、不確実性が蔓延していても、研究者はより信頼性の高い因果推論を行うことができるのである。私たちは、このような認識が進歩に不可欠であると強く信じているが、それにもかかわらず、RCTは生物医学および社会科学における知識の蓄積に不可欠な資産であり続けると信じている。

DeatonとCartwright(2018)は結論として、質問形式で提示された次の2つの課題に答えることを主張している

「もし、あなたが新しい薬を処方されるのであれば、それがRCTを経たものであってほしいと思いませんか?」

そして、

「OK、あなたはRCTの問題点をいくつか強調したが、他の方法にはそれらの問題点のすべてに加えて、それぞれに問題点がありますか?」

この2つの質問に対して、私たちは明確に肯定的な回答をする。すべてのRCTが観察研究よりも望ましいわけではなく、RCTはDeaton and Cartwright (2018)に記されているように、誤解や潜在的な問題にさらされているが、不確実性を補い、確信のなさを確保し、結論への信頼を築き、ひいては科学的知識を継続的に発展させる上で、無作為化の力は今後も重要であると考えている。

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー