アルツハイマー病に関する無作為化対照試験の外部妥当性 虚弱性と生物学的老化のバイアス

強調オフ

EBM・RCT科学哲学、医学研究・不正認知症研究・試験

サイトのご利用には利用規約への同意が必要です

External Validity of Randomized Controlled Trials on Alzheimer’s Disease: The Biases of Frailty and Biological Aging

www.ncbi.nlm.nih.gov/pmc/articles/PMC5712065/

要旨

これまでのところ、アルツハイマー病に関するランダム化比較試験(RCT)の外部妥当性は、単一次元の変数のみを考慮して評価されてきた。それにもかかわらず、孤立した単一の特徴を見ることは、アルツハイマー病患者の複雑さを十分に理解することを保証することはできない。

二つの世界(研究と臨床)が同じタイプの患者を扱っているかどうかを理解する唯一の方法は、個人の生物学的年齢をより総合的に反映した多次元的なアプローチを採用することである。

本研究では、第Ⅲ相RCTの対象となったアルツハイマー病患者のサンプルの虚弱性/生物学的老化の尺度[虚弱性指数(FI)で評価]を、同じ臨床サービスを紹介しているが対象としていない患者と比較して比較した。「RCTサンプル」と「現実世界のサンプル」は、考慮されたすべての社会人口統計学的および臨床的変数について統計学的に類似していることが判明した。

それにもかかわらず、”現実世界のサンプル “は、より高いFIスコア[0.28(SD 0.1)対0.17(SD 0.1); p < 0.001,それぞれ]によって示されるように、「RCTサンプル」と比較して有意に虚弱であることが判明した。

さらに、FIと年齢の関係を評価する際に、相関関係は、「RCTサンプル」(スピアマンのr = 0.01; p = 0.98)ではほぼヌルであったのに対し、「実世界サンプル」(r = 0.49; p = 0.02)では統計的に有意であったことがわかった。

厳格すぎるデザインの適用は、RCTサンプルの代表性の低さをもたらすかもしれない。それは、「現実世界」で観察されたものとは生物学的に異なる条件の研究を示唆しているかもしれない。個人の生物学的年齢を捉えることのできる多次元尺度の採用は、臨床研究の外部妥当性の評価を容易にし、結果の解釈や臨床の場での翻訳を向上させることになるかもしれない。

キーワード

アルツハイマー病、虚弱性、無作為化比較試験、外部妥当性、加齢、ホリスティックアプローチ

序論

無作為化比較試験(RCT)は、医療介入の有効性と安全性・忍容性を確立するための金字塔である。RCTは、臨床結果や治療結果に関する情報を提供するだけでなく、外部からの妥当性や一般化可能なメッセージを可能な限り生成しようとするものでなければならない。言い換えれば、RCT の参加者の比較的小規模なグループから大規模な集団に翻訳可能な情報を提供すべきである(1)。残念なことに、RCT の典型的な硬直的で理想化された条件は、しばしば研究結果の「実世界」の臨床現場への移植性を損なうことがあり、最終的にはその有用性に影響を与えることになる。特に、RCTの適格性基準が選択的すぎる場合(研究の特定の側面に最大の焦点を当てるため標本化された集団の代表性や、結果の次の一般化可能性が問われることになる。

アルツハイマー病は、研究の優先課題として指摘されるようになってきている(2)。現在までに140件以上の第II-IV相試験が実施されており、疾患の臨床症状の改善や自然経過への影響を目的とした様々な介入の有効性が検討されている(出典:clinicaltrials.gov)。アルツハイマー病に関するRCTの外部的妥当性は繰り返し議論されてきた。具体的には、RCTに登録された患者と研究結果から利益を得るべき患者の集団との間にかなりの不一致が示されている(3, 4)。さらに、この2つの母集団の臨床的・薬理学的特徴の比較可能性については、相対的に情報が不足している(5)。同時に、アルツハイマー病に関するRCTは、関心のある集団を選択するために他の側面に特別な注意を払っているようである。例えば、性の分布に関しては、ほとんどのRCTで良好な代表性が報告されている(6)。

特定の社会統計学的因子(例えば、年齢や性別)や粗い臨床パラメータ(例えば、疾患数、併存疾患の種類、併用薬)に頼ることは、RCT参加者の健康状態の単次元的な(そして包括的ではない)評価を提供するだけである可能性がある。孤立した単一の変数を見ることは、アルツハイマー病患者の複雑さを十分に理解するレベルを保証することはできない。さらに、それはRCTsの参加者とアルツハイマー病患者の全体的な集団の間の公正な比較可能性を排除する。2つの世界(すなわち、研究と臨床)が同じタイプの患者を扱っているかどうかを理解する唯一の方法は、個人の生物学的年齢をより全体的に反映することができる測定/変数に依存した多次元的なアプローチを採用することである。

本研究では、第III相RCTの対象となったアルツハイマー病患者を対象に、同じ臨床サービスを紹介しているが対象としていない患者と比較して、生物学的老化[Frailty Index(FI)で測定]を評価した。

資料と方法

参加者

本解析は、2015年1月から 2017年1月までの間にローマ(イタリア)の「Sapienza」大学の神経・精神科に通院していたアルツハイマー病患者の臨床カルテをレトロスペクティブにレビューすることで行った。

以下のように同定された2つのグループの患者の臨床的特徴と社会統計学的特徴を比較した。

・RCTsサンプル」は、当科で進行中の2つの第III相RCT(いずれもアミロイドに対する受動的予防接種介入の有効性と安全性/忍容性を調査している)で共有されている以下の包含基準を満たす患者で構成された。(1)年齢が55歳以上90歳未満、(2)認知症の可能性が高いと診断されている[NIA-AA基準(7)]、(3)Mini-Mental State Examination(MMSE)スコアが20~26の範囲内、(4)重篤または不安定な病気を併発していないこと(治験責任医師の見解(5)アミロイドポジトロン断層撮影または脳脊髄液でアミロイド病理の存在と一致する陽性所見があること[すなわち、アミロイド病理学的な証拠を有する認知症の可能性が高いこと]、(5)アミロイドポジトロン断層撮影または脳脊髄液での陽性所見があること アルツハイマー病の病態生理学的プロセスの証拠を持つ可能性の高いアルツハイマー病認知症(7)]。
・現実世界 “サンプルは、任意のRCTsに登録されていない、私たちの記憶クリニックに通っているアルツハイマー病を持つ連続して選択された、年齢とMMSEのマッチした患者の同数によって構成されていた。RCTsサンプル」を選択した適格基準をできるだけ反映させるために、「実世界サンプル」には以下の包含基準が追加採用された。(1)年齢は55歳以上90歳未満、(2)アルツハイマー病認知症の可能性が高いと診断されていること(NIA-AA基準(3)MMSEスコアが20~26,(4)重篤な疾患や不安定な疾患を併発していないこと、である。
本研究は、国および機関のガイドラインに基づく正式な倫理的承認を必要としなかった。患者と介護者(必要に応じて法定後見人)は、収集したデータを研究目的で利用することを認める書面によるインフォームドコンセントを提供した(ローマの大学病院「Policlinico Umberto I」で要求されている)。今回の分析に使用したデータは、標準的な臨床ルーチンの一部として情報が記録されているカルテからのみ検索した。

有害度指数

標準的な手順(8)に従って、臨床カルテに記載されている変数から、年齢に関連した28の虚弱性(徴候、症状、判定された診断、障害を含む)を計算することにより、レトロスペクティブにFIを作成した(表1).1)。FIに含まれる各項目は、値が0の場合は虚弱性がないことを示し、値が1の場合は虚弱性があることを示すようにコード化されている。FIは、個人によって提示された虚弱性の数と考慮された虚弱性の数(すなわち、28)との比として計算された。したがって、FIは0(虚弱性なし)と1(すべての虚弱性)の間の可能性がある。

表1 28項目の「有害性指数」の計算に含まれる虚弱性

1. 高血圧
2. 自己免疫疾患
3. 肝疾患
4. 虚血性心疾患
5. TIA・脳卒中の歴史
6. 糖尿病
7. 局所的な神経学的徴候
8. 腎不全
9. 不整脈
10. 甲状腺の病気
11. 癌
12. COPD
13. 脂質異常症
14. 肥満(BMI≧30kg/m2
15. 低体重(BMI<18.5kg/m2
16. 尿失禁
17. うつ病
18. アパシー(NPI)
19. 不安(NPI
20. 睡眠障害
21. I日常生活動作(ショッピング
22. I日常生活動作(交通機関
23. I日常生活動作(医薬品
24. I日常生活動作(お金
25. 日常生活動作(トイレ
26. 日常生活動作(食べること
27. 日常生活動作(着付け
28. 日常生活動作(交通機関

日常生活動作、日常生活動作;BMI、体格指数;COPD、慢性閉塞性肺疾患;I日常生活動作、器材的日常生活動作;NPI、神経精神医学的目録。

統計解析

一変量解析は、”RCTサンプル “と “実世界サンプル “のベースラインデータを比較するために実施された。年齢とFIの関係の強さと方向性を評価するために、スピアマンの相関が使用された。

結果

全体的に、”RCTサンプル “と “現実世界のサンプル “は、考慮されたすべての社会人口統計学的および臨床的変数について統計学的に類似していることが判明した(すべてのp値 > 0.05; 表2)2)。それにもかかわらず、”現実世界のサンプル “は、より高いFIスコア[0.28(SD 0.1)対0.17(SD 0.1); p < 0.001,それぞれ]によって示されるように、”RCTサンプル “と比較して有意に虚弱であることが判明した(図(図1A).1A)。一貫して、「実世界サンプル」の患者の大多数(78.3%)は虚弱であった[すなわち、FI≧0.25(9)]のに対し、「RCTサンプル」では26.1%の虚弱有病率しか報告されていなかった(p<0.001)。2群間のFIの統計的に有意な差は、年齢と性別を調整した後でも確認された(データはリクエストに応じて入手可能)。

表2 「RCTサンプル」と「RCTサンプル」の間には

図1

最後に、2つのサンプルでFIと年齢の間の相関関係を検証した。相関は、「RCTサンプル」(スピアマンのr = 0.01; p = 0.98)ではほぼヌルであったが、「実世界サンプル」(r = 0.49; p = 0.02)では統計的に有意であった(図(図11B))。

考察

本研究では、虚弱状態/生物学的老化の観点から、RCTの対象となるアルツハイマー病患者と、同じ臨床環境で評価されたが対象とされなかった患者との間に著しい不一致が観察された。興味深いことに、第III相RCTに選ばれた患者のうち、虚弱と考えられるのは少数派であり、これらの患者はすべて(たとえ軽度であっても)あからさまな認知症の状態に罹患しているという事実にもかかわらずである。一方、標準的な臨床処置を受けている患者のほとんどは、関連する量の慢性的な障害を示した。特に注目すべきは、「RCTサンプル」における虚弱性と年齢の間に有意でない相関が見られたことである。年齢に関連した虚弱性の蓄積がないということは、研究された状態が自然な老化過程から分離されていることを暗黙のうちに示している。それは、加齢に起因する生物の蓄えの進行性の障害を考慮することなく、アルツハイマー病が研究されていることを意味する。このようなシナリオ(すなわち、自然なライフコースの影響を受けない病気)は、純粋に理論的なものであり、「現実世界」での再現性が難しいことは明らかである。

これらの結果は、アルツハイマー病に関するRCTから得られた知見の 「現実世界 」の臨床への適用性に疑問を抱かせることになる。特に、それはどのように複数のと相互作用する障害を持つ虚弱な被験者の集団に堅牢な個人の集団で得られた証拠を転送することが可能か?この不一致は、日常の臨床現場で試験された介入の有効性や安全性・耐容性にどのように、またどの程度影響を与えうるのであろうか?我々の分析は、日常診療で遭遇したアルツハイマー病の集団が、高度に選択されたRCT参加者との比較が不十分であることを確認している。実際には、同じターゲット条件が異なるアプローチを採用することで特定され、一方では確率基準(すなわち「現実世界」)に依存するのに対し、他方では特定の病態生理学的変化の生体内試験での実証を含む高レベルの特性評価が必要とされる。このような曖昧さは自動的に2つの設定で関心のある状態の表現型と生物学的特性に影響を与え、それらの比較可能性と一貫性に挑戦している。

我々のデータはまた、単次元変数の採用は、複数の年齢関連疾患の影響を受けた個人の内部特性を捉えるのに不十分である可能性があることを確認している。実際、収集した社会統計学的データと臨床データを単独で見ると、我々の2つの集団が類似していると推測され、適切な比較可能性と代表性という誤った結論を導く可能性がある。それとは異なり、個人の生物学的状態のより包括的な推定値を提供する多次元尺度(FIとして)を採用することで、2つのグループ間の実質的な不一致を明らかにすることができた。このような観点から、(虚弱な)高齢者の包括的な評価が必要であり、臨床や研究の基準を改善する可能性がある(10)。この文脈では、虚弱の状態は、すでにアルツハイマー病の典型的な病態生理学的修飾(例えば、アミロイド沈着)にリンクされている。しかし、実証された関連性が直接的(例えば、アミロイド沈着が虚弱性の原因である)または間接的(例えば、それらは両方とも年齢に関連する条件であるため、アミロイド蓄積が虚弱性に関連している)メカニズムに起因するかどうかはまだ不明である。実際、既存の文献は、アルツハイマー病につながる病態生理学的メカニズムにおける加齢過程の影響を入れ子にすることで非常に曖昧である。したがって、我々の研究では、臨床および研究の設定で使用されるアルツハイマー病の構成における「老化」の適切な考慮を検証するために虚弱性の尺度(生物学的老化を意図した)を使用した。

フレイルティの状態を測定するための複数の尺度が文献で利用可能である。我々は複数の理由からFIに頼ることにした。他のツールとは異なり、FIは個人の生物学的年齢の多面的評価を提供する。言い換えれば、それは健康状態の特定の領域または特性(例えば、身体機能)に焦点を当てているのではなく、生体に負担をかけている欠陥の包括的な重み付けを提供する。この文脈では、FIが虚弱状態に対する定量的(定性的ではなく)なアプローチに基づいていることにも言及することが重要である。これは、異なる目的のために収集された既に存在するデータの遡及的利用に頼って計算できることを意味する。このようなユニークな特徴により,すでに行われている臨床や研究の実践を修正する必要なく計算することができる(すなわち,事前に定義された質問や項目に基づくものではない)(10, 11)。

我々の研究にはいくつかの制限がある。サンプルサイズが限られているため、このトピックについて決定的な結論を出すことには同意できない。しかし、所見の強さと一貫性は、偽陽性の結果がないことを示唆しているかもしれない。我々は、限られた数の特定のRCTに登録された患者(すなわち、2つ)を考慮した。それにもかかわらず、資格基準は、この分野で進行中の大多数のRCTで考慮されているものと類似していた。我々の研究でFIを計算するために使用された虚弱性の数(すなわち、28)は、標準的な手順(すなわち、30)で推奨されているものよりも低かった(8)。我々の研究のデザインでは、観察された違いを説明する可能性のある特定の要因(例えば、RCTでより健康な人を採用するための研究者の暗黙の傾向、RCTに参加する患者の意欲など)の寄与を調査することができないであった。

結論として、RCT(特に生物学的に高齢者を対象に実施されたもの)では、あまりにも厳格なデザインを適用すると、参加者の代表性が低くなり、本来の「現実世界」の臨床集団を反映していないものになってしまう可能性がある。人の生物学的年齢を捉えることのできる多次元尺度(FIのような)の採用は、臨床研究の外部妥当性の評価を容易にし、暗黙のうちに結果の解釈と臨床の場での翻訳を改善する可能性がある。

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー