コンテンツ

‘Methodolatry’, RCTs, and the Limits of Reductionism: Part 2

‘Methodolatry’, RCTs, and the Limits of Reductionism: Part 2

www.alineanutrition.com/2019/11/22/reductionism-rcts-part2/

100%確実性の証明が存在しない限り、「証明」という言葉が意味するのは、実際には、与えられた結論に到達することを裏付ける十分なデータである。「証拠」とは、私たちが結論を出すための情報やデータにすぎない。それが「十分」であるかどうかは、我々がすでに知っていること、そして我々が何を立証しようとしているかに依存しており、存在する経験的検証のモデルとの相対的な関係である[すなわち、コホート研究 vs. RCT]。したがって、因果関係の「証明」は完全に相対的なものであり、さまざまな「十分性」のレベルは、さまざまな目的を満たすことができる。ここでの究極の証明基準は、利用可能な証拠から関連性と結論を導き出す能力だ。

しかし、原因についての誤った仮定と方法論的偏見は、栄養学に多くの問題を引き起こし、証拠に基づいて結論に到達するまでのプロセスを却下した。これらの問題は両方とも、この記事のこの第2部で説明する。

3）RCTと因果関係についての誤った仮定で方法論の結果

パート1で議論したように、「因果関係」の観点から見た栄養学への制限は、RCTは医薬品、すなわち標的とされた薬物動態および薬力学的プロファイルを有する単一の化合物を試験するようにデザインされていることだ。このデザインは、単一のエンドポイントに対する単一の栄養素の影響を、多因子性疾患プロセスに対する複数の成分の複雑な食品マトリックスの影響、および全体的な食事パターンの正確な反映に常に適切に変換されるとは限らない。

おそらく、より広い栄養学的言説にとってより問題となるのは、「RCT」とラベル付けされた試験の結果は自動的に因果関係が反映されいるという仮定だ。これは単純に間違っている。強い内部妥当性を支える仮定や前提条件はさておくとしても、どの試験でも、単に状況/設定/特性に関して、介入Aが結果Bを引き起こしたことを示す因果関係を実証しているにすぎない（1）。

これは基本的なことだ。なぜなら、RCTが試験と回答を求めた目的、リサーチ・クエスチョンと仮説、およびRCTが持つ可能性のある方法論の制限に応じて、証拠が誇張または過小評価される可能性があるからだ。ただし、RCTの結果は因果関係を示しているというデフォルトの推定がある。栄養の文脈では、この推定はしばしば受け入れられない。栄養素サプリメントに対するRCTの帰無仮説は「栄養素Aは健康転帰Bに影響を与えない」であるため、帰無仮説を肯定することの必然的な効果は「栄養素の効果がない」ことを意味するはずだ。しかし、すべての栄養素が生物学的活性を持ち、健康状態に影響を与えるという経験的事実を我々は知っている（2）。

実際、RCTで単離された栄養素を試すという還元主義的なアプローチは、RCTが間違ったリサーチ・クエスチョンをテストした場合にどのような結果になるかを示す貴重な例である。抗酸化物質、ビタミンE、または長鎖オメガ3’sに関する多数の大規模試験の帰無所見は、栄養素が健康状態Xに影響を与えないことを反映していない。

実際、RCTで単離された栄養素を試すという還元主義的なアプローチは、RCTが間違ったリサーチ・クエスチョンをテストしたときにどのような結果が得られるかを示す高価な例だ。抗酸化物質、ビタミンE、または長鎖オメガ3系栄養素に関する多数の大規模試験の帰無所見は、その栄養素が健康結果Xに影響を及ぼさないことを反映していない。

テストされている実際の仮説は、栄養素の単離されたサプリメント – 多くの場合、合成 – フォームは、栄養素の総食事パターンのコンテキストで消費される栄養素と同じ生物学的効果を持っているかどうかだ。あるいは、ベースラインレベルYの文脈で栄養素Xの特定の摂取レベルが健康アウトカムZのリスクを増加させるか減少させるかということだ。それどころか、これらの試験の多くは、栄養素が生物学的範囲内でしか作用しないため、その効果は常に栄養素の健康効果を定義する非線形の正規分布と相対的なものであるという明白な事実を無視して、「サプリメントの投与量X」だけを試験したという正しいリサーチ・クエスチョンをもつことに失敗している。

図はJacksonら（N Engl J Med. 2006;354:669-83. 9年後には「有意差は認められなかった」が、「プラセボ群」では介入群と同様の総カルシウム摂取量の平均値が得られ、65%が少なくとも800mg/d以上のカルシウム摂取量を有していた。デザイン上無意味な例。

現実には、経験的検証のどのモデルも、尋ねられた質問、テストされた仮説、およびデザインを支える仮定と同じくらいにしか優れていないということだ。RCTの伝統的な強さは、それが因果関係を識別することができるということだが、これは偶発的な能力であり、生物医学的な生得権ではない。この後者の言葉遊びは無作為ではない。なぜならば、生物医学的モデルが、サブグループレベルでの参加者の交換可能性、明確に定義された介入とプラセボ、そして識別可能な効果の独立性を条件とした、現在のような完全な説明的RCTを生み出したからだ(4)。パート1で議論したように、これらの基準の多くは、結果が正であった場合でも、説明的RCTからの任意の結果は、実際には妥当性の観点から因果関係を示すポイントではないという実際の効果により、栄養学に関して達成することは実質的に不可能だ。

栄養科学のためのより重要なことは、それが食事と病気の関係になると、単純にA = Bのようなものは存在しないという事実だ。すべての食事と病気の関係は、生理学的プロセス上の食事の効果、全体またはその特定の特性によって媒介されている。添加糖と肝臓脂肪蓄積の関係は、特に、肝インスリン抵抗性とde novo リポジェネシスの増加への影響によって媒介されている。飽和脂肪と心臓病との関係は、他の変数の中でもLDL-コレステロールへの影響によって媒介される。したがって、すべての食事病の関係は、Bを介してA = Cとなる。B’に対する食事の影響は、食事のいかなる特性も単独では存在せず、与えられた特性と食事の他の構成要素との間には常に関係があるという事実に依存しているため、この方程式をさらに発展させることができる。これらの要因は、「moderating」(緩和)、「supporting」(支援)、または「mediating」(仲介)　要因[用語は互換性がある]と呼ばれているが、任意の因果関係(5)の操作に重要な場合がある。式は、次のようになる。A = C via B(M)、ここで「M」はAとCの間の因果関係の操作に影響を与える媒介因子を指す。例としては、塩、高血圧、および心血管疾患は、高ナトリウム食（A）が原因で増加した高血圧と関連する有害な生理学的効果（B)カリウム摂取量、フラバノイドの摂取量、年齢、およびストレス（M）のような他の要因によって媒介される可能性がある関係を介して、心臓病や脳卒中（C）のリスクを増加させる、といった関係がある。

この場合に注意すべき重要なことは、MによってAとCの関係が減衰したとしても、AとCの間に因果関係が存在することを無効にはしないということだ。これは、食事と病気の関係を見ているときにしばしば行われる推論の誤りだ。食事は真空中に存在したりはしない。媒介因子のどれもが、それ自体がCとの因果関係を持っている可能性があるため、それによって関係を無効にするものではない。

これらの要因は、多くの人がRCTの結果についてすぐに理解できる推論の基本だ。

無作為化自体が栄養の場合には、すべての未知の変数、あるいは既知の変数を制御するという仮定、例えば、関心のある結果にベースラインの栄養状態の影響は、多くの場合、層別化されていないか、または考慮に入れられていない。

あるいは、効果量が「真の」効果量であるという仮定、特にそれが疫学で観察された効果量と比較された場合、前者の結果がより信頼性が高く、「真」であることを支持する仮定。媒介因子を調整することでより正確な結果が得られるという仮定;効果修飾因子を考慮するのではなく、すべての媒介因子は交絡因子として扱われ、統計モデルではしばしば過剰調整の結果になることがある。

飽和脂肪と心臓病に関する多くの研究では、血中コレステロールとLDL-コレステロール値を調整しているが、これは過剰調整の例として挙げられる。

現実には、食事と病気の関係の間接的な因果関係を考慮すると、これらの仮定はすべて不安定だ。試験がRCTデザインを使用しているからといって、その母集団のサブグループからの結果が以下のようには考えられない。

a) 自動的に正しい。

b) 現実世界のその集団に適用可能（試験が現実世界で行われた場合は別であるが、その場合は「実用的」であり、強力な内部妥当性は厳密な方針ではない）。

c) デフォルトでは観察研究よりも正確な効果の推定値が得られる。

RCTの彼らの広範なエッセイ批評では、Deaton＆Cartwright（1）は、次のように述べている。

推定や内部妥当性の利点であるノンパラメトリックで理論のない性質が、その有用性を主張するために使われる場合、RCTは過大評価される。

構造がないことは、結果が得られた文脈以外で使おうとすると不利になることが多い;推定における信頼性は、使用上の信頼性につながることがある。

RCTの結果が、世界についてすでに持っている知識とどのように関連しているのかをまず理解しないと、試験結果の使い方を知ることはできない。そして、この知識の多くは他の方法から得られている。

一旦RCTが知識と推論のこのより広い構造の中に位置づけられ、それを強化するようにデザインされると、有効性の主張を正当化するためだけでなく、より一般的に科学の進歩のために、非常に有用なものになる。

累積的な科学は困難であり、私たちが行動したときに何が起こるかについての信頼できる予測も困難だ。

ここでのTL;DRは、因果関係を示すものとしてのデザインそのものに、証拠に基づいた言説があまりにも頼りすぎているということだ。

因果関係の推論はプロセスであり、既存のエビデンスベース全体の批判的な評価を通じて、経験的検証の異なるモデルから推論されることがある。デフォルトでRCTの結果を仮定して因果関係を均等にすることは、知的怠惰というだけではなく間違っている。

4）方法論的な偏見は、評価のプロセスよりも優先される。

科学における証明の究極の基準は、利用可能な証拠から関係性と結論を出す能力だ。これは、方法論的な偏見によって窒息させることができる評価のプロセスであり、Deaton & Cartwright (1)がこの問題に関連して引用を保証する用語がある。

経済学と同様に医学の多くの実践に反して、RCT と観察結果の間の対立は、例えば、それぞれで研究された異なる集団の異なる特性を参照することによって、説明される必要がある。

RCT の妥当性は、観察研究がなぜ異なる答えを発見したのかを理解するために役立つこともあるが、観察研究を単に RCT ではないから無効でなければならないという理由で却下するという一般的な慣行には根拠がない（あるいは言い訳になる）。

それは、集合的な知識が進歩するにつれて、新しい発見は、説明し、今では無効であると考えられている結果であっても、以前の結果と統合することができなければならないという科学的進歩の基本的な原則である;方法論的偏見は説明ではない。

研究デザインがさらなる分析によってエビデンスの調整を上回った方法論的偏見の典型的な例は、ホルモン補充療法を受けている閉経後の女性が心血管疾患のリスクを減少させていたという関連性を見いだした観察研究だ(6)。この問題に関するその後のRCTでは、HRTを服用している女性は心血管疾患のリスクが高いことがわかった。

エビデンスピラミッドのコホート研究よりもRCTの方が優れていることを考えると、観察研究は間違っていて、RCTは正しいというのが当面の前提であった。

実際、さらなる分析の結果、両方の研究は異なる患者集団を対象としており、研究対象となったそれぞれの集団のサブグループに対して、両方とも正しいことが明らかになった。この不一致は、閉経の開始時期とHRTの開始時期の不一致に関連していた。これらの要因を考慮した場合、観察的コホート研究とRCTの両方で同様の結果が得られた。

栄養学の例としては、疫学における食事性ビタミンE摂取量と神経変性疾患との関連性の不一致、およびRCTにおけるビタミンEの効果の全体的な欠如が見られる。

栄養疫学における観察は一貫しており、異なる集団で観察され、死亡したアルツハイマー病患者の脳内ビタミンE含有量の脳解剖研究などの機序論的研究によって支持されている(7,8)。しかし、ビタミンEの補給と認知機能の低下に関する数多くのRCTでは効果が認められていない(9,10)。

ビタミンEのRDAは15mg/dであるが、介入のポストホック解析では、ビタミンEのベースラインレベルがRDAの40%未満[<6.1mg/d]の人にのみサプリメントの効果が認められたことが明らかになった(9,11)。ベースラインレベルが低い被験者のみを対象とした試験が行われていれば、より均一性が得られ、結果はより一貫して肯定的なものになっていたかもしれない。

この前提条件を複雑にしているもう一つの問題は、ある病態の病態生理がより進行している人生の後半にサプリメントの栄養素を摂取しても、人生の早い時期に持続的な食事摂取によってその栄養素を摂取することの有益性を示す証拠にはならないということだ。

さらに、多くのサプリメント試験では、自然界でビタミンEを形成するトコフェロールとトコトリエノールの8つのアイソフォームのうちの1つである合成α-トコフェロールが使用されている特に関連性が高いのは、脳の剖検研究で、健康な脳で死亡した人の脳ではγ-トコフェロールが高いことが明らかになっていることだ(8)。

方法論的な偏見から、「ビタミンEは認知機能の低下に影響を与えない」という結論が導き出されているが、この結論は、他の調査ラインからのより広い支持と同様に生物学的な妥当性と矛盾している。

現実には、このリサーチ・クエスチョンに関連する矛盾は主にRCTから生じる。証拠のバランスについて議論の余地があるのは、RCTが間違った答えをもたらすことだ。正しくこの質問に答えるためには、RCTsの結果がその’真実’を反映しているという仮定をデフォルトとするのではなく、可能性のある最も近い近似の真実に近づくよう評価の全体的なプロセスに立ち返ることだ。

この問題は、両方のフレームワークが分離され区別されている場合には、柔軟性に欠け、証明の基準としての証拠の階層性に過度に依存していると考えられる。

因果推論の立証過程は総合評価のプロセスであり、満たすべき「証明」の基準は常に相対的なものだ。この点では、因果関係の観点からの結果の信頼性の高まりを反映しているだけのランキングシステムに依存することは、批判的評価における自己制限的な行動であり、[上記で概説した理由とパート1で]因果関係は、名目上、RCTの名をもつ試験では実証できないかもしれない。

これは、それぞれの研究デザインの使用と価値を見誤っている一方で、デザインのためだけに与えられた研究の結果を過小評価したり、過大評価したりする可能性があるからだ。

これらは、方法論的偏見の潜在的な限界であり、科学的評価のダイナミックで進化する重層的なプロセスであるものに対して、無生物で静的な構造として固定的に解釈される証拠階層である。このダイナミックなプロセスでは、それぞれのデザインにメリットがあり、エビデンスの全体的な評価に情報を提供するために異なる貢献をしている。

疫学研究における不一致の所見は、しばしば観察研究に対する批判を拡大させることにつながるが、RCTにおける不一致の所見におて、「ゴールドスタンダード」の指定が疑問視されることすらないことを考えてみてほしい。不整合は「説明されるか、隠蔽される」(12)のどちらかである。

公衆衛生政策は、RCTを含まない複数のエビデンスの並びを通して形成され、適用されることが多いことは一般的に見落とされている。それは評価のプロセスであり、エビデンスの階層がリサーチ・クエスチョンの評価に影響を与えるが、神聖であるべきものとは考えられず、リサーチ・クエスチョンがRCTでなければ回答が得られないという推定がないところにある。

公衆衛生の実践（民間の実践を含む）では、それは、利用可能な最高品質のエビデンスに基づいて意思決定を行うことを目的としたプロセスである。しかし、この記述だけでは、「質」と「エビデンスピラミッド上の最高」の関連性に基づく方法論的な偏見につながりがちだ。

実際には、利用可能な最高品質のエビデンスとは、有益な結果を達成するための行動を支持する現時点での最高の情報を意味している。利用可能な証拠に基づいて結論を出す能力は、一行の証拠だけで支えられることはめったにない。

他のものよりも一つのものに近視眼的に焦点を合わせることは、与えられたデザインが全体的な証拠写真を見るためのレンズに過ぎないという事実を見落とすことになるが、これはレンズが常に正しく、あるいは正しい問題に焦点を当てているとは限らない。

焦点を当てたレンズのこのアナロジーは、栄養科学の初期の栄養不足の焦点とは異なり、単一化合物の経路、短い潜伏期間、および対処した場合の迅速な回復を持たない現代の食事と病気の関係への科学的調査を検討するためには重要だ。

それらは長い潜伏期間、しばしば3〜40年以上、および複雑な病因によって特徴付けられている。RCTだけに焦点を当てていると、木を見て森を見通すことができず、森を見るということは、ほとんどの場合、一点集中の証拠が並んだエビデンスを取り入れることになる。

DeatonとCartwrightに倣って、RCTがない、または与えられた研究がRCTではなかったという理由で、研究や複数の調査ラインを却下する根拠はない。

結論

第一のポイントは、この小論が [両方の部分を通して]RCTを広く否定するものと受け取られてはならないという注意の言葉である。この論文の目的は、科学的評価の全体的なプロセスの中で、RCTにはそれなりの場所があるということである。

むしろ、このエッセイの目的は、栄養学の研究を解釈するあなたのものが心に留めておく必要がある基本的な違いのいくつかを強調することだ、RCTsの「正しさ」の中で、不当な強調、および多くの場合、盲信を置くことから生じる批判的評価のプロセスの過度の単純化に注意することであった。

これは、異なるソース（13）に添付された過度に単純化された差動値から発生する解釈、証拠の複数の行の合成、および適切な外挿のプロセスのナイーブな省略に対する注意である。

「エビデンスに基づく医療」の進化の初期の提唱者として、オースティン・ブラッドフォード=ヒルはかつて、「対照試験が研究を行う唯一の方法であるという信念は、振り子が振れ過ぎたのではなく、フックから外れてしまっていることを意味する」と述べている(14)。

因果関係を評価するためのブラッドフォード・ヒルの基準が1965年にあったように今日も説得力のあるままであることを考えると、健康科学の学生は、証拠の階層に依存するという単純さに誘惑されるよりも、そのようなツール上で批判的思考スキルを研ぎ澄ますために十分に役立つだろう。

Deaton & Cartwright (1)から再び引用する。

ゴールドスタンダードまたは「真実」の見方は、累積的な理解のプロセスにおいてRCTの結果を他の証拠と照合するという科学の義務を損ねるときに害をおよぼす。

科学的思考とは、「試験は無作為化されていたか？」ということだけではない。

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31