研究の設計・実施・評価における内的・外的・生態的妥当性
Internal, External, and Ecological Validity in Research Design, Conduct, and Evaluation

強調オフ

EBM・RCT

サイトのご利用には利用規約への同意が必要です

www.ncbi.nlm.nih.gov/labs/pmc/articles/PMC6149308/

2018 Sep-Oct

チッタランジャン・アンドラーデ

概要

信頼性と妥当性は、研究機器の望ましい心理的特性を示すものである。また、妥当性の概念は、調査研究とその結果にも適用される。内的妥当性とは、研究の設計、実施、および分析が、研究課題に対して偏りなく答えているかどうかを示すものである。外的妥当性とは、研究結果が他の文脈に一般化できるかどうかを調べるものである。特に生態学的妥当性は、研究結果が現実の環境に一般化できるかどうかを調べるものであり、生態学的妥当性は外的妥当性のサブタイプである。これらの概念を例示しながら説明することで,内的妥当性,外的妥当性,生態的妥当性を考慮することが,研究の設計や実施,さらには発表された研究の良し悪しを理解する上で重要であることを理解していただきたい。

キーワード CATIE、生態学的妥当性、外的妥当性、内的妥当性、信頼性

CATIEは外的妥当性を持っていたか?

その答えは、「イエス」でもあり「ノー」でもある。CATIE[1]は、有効性研究、つまり実社会の設定に関連する研究として設計された。CATIEで得られた知見は、米国での臨床実践に関連するものであるが、インドでの関連性には疑問がある。その理由の一つは、CATIEが実施された米国では、主要評価項目である「全原因による治療中止までの期間」は、実質的に患者の影響を受けているのに対し、家族が治療を監督するインドでは、介護者の判断が大きいことである。もう1つの重要な理由は、臨床現場での医療提供システムが両国で著しく異なることである。したがって、CATIEは米国の臨床現場では外的妥当性が高いが、インドではそうではない。

信頼性と妥当性

信頼性と妥当性は、評価尺度やスクリーニングツールなどの機器に適用される概念である。妥当性とは、ある機器が、その機器がすべきことをどれだけうまくやっているかを示すものである。例えば、うつ病のスクリーニングを行う機器が、高い感度と特異性を持っているかどうか。信頼性とは、結果が得られる一貫性のことである。例えば、うつ病の重症度を評価する機器を、同じ患者に1時間以内に2回実施した場合、得られたスコアはよく似ているか?信頼性と妥当性の種類は、研究用および臨床用機器の望ましい心理的特性を表している[2,3]。 妥当性は、実験室での研究や臨床研究、そしてその結果にも適用できる。

内的妥当性

内的妥当性とは、研究の計画、実施、分析の方法が、研究の質問に対する信頼できる答えを可能にするかどうかを調べるものである。例えば、不適切な無作為化、患者や評価者の不注意による盲検化解除、レスキュー薬の過剰使用、データの欠落などはすべて、無作為化比較試験(RCT)の結果や結論の忠実性を損なう。つまり、RCTの内的妥当性が損なわれてしまうのである。内的妥当性は判断に基づくものであり、計算された統計ではない。

内的妥当性とは、系統的な誤差(バイアス)がどの程度存在するかを調べるものである。このような系統的な誤差は、選択バイアス、パフォーマンスバイアス、検出バイアス、離脱バイアスなどによって生じる可能性がある[4]。 内的妥当性が損なわれた場合、分析計画を変更するなどして改善できることもある。しかし、例えばRCTで二重盲検法による評価が得られなかった場合のように、バイアスが致命的になることもある。

外的妥当性

外的妥当性とは、研究結果が他の文脈に一般化できるかどうかを検討するものである[4]。研究はサンプルを用いて行われるが、サンプリングが無作為であればサンプルは母集団を代表しているので、研究結果はサンプルを抽出した母集団に有効に一般化できる。しかし、結果は他の集団には一般化できないかもしれない。そのため、社会人口統計学的な制限を設けた研究、重症患者や自殺傾向のある患者、人格障害や薬物使用障害、医学的合併症のある患者を除外した研究、同時治療を認めない研究などでは外的妥当性が低くなる。また、数ヶ月から数年の治療を必要とする患者を対象とした短期研究では、外的妥当性が制限される。外的妥当性は、内的妥当性と同様に判断に基づくものであり、計算された統計ではない。

生態学的妥当性

生態学的妥当性とは、研究結果が現実の環境に一般化できるかどうかを問うものである[5]。 外的妥当性との違いは?外的妥当性とは、研究結果が、研究対象者とは異なる特徴を持つ患者や、異なる方法で治療を受けた患者、より長期間追跡調査を受けた患者に一般化できるかどうかを問うものである。一方、生態学的妥当性は、研究結果が日常生活における臨床実践のような自然な状況に一般化できるかどうかを具体的に検討するものである。したがって、生態学的妥当性は、外的妥当性のサブタイプと言える。ある機器の生態学的妥当性は、その機器で得られた評価と、自然主義的な実践や日常生活における適切な尺度との間の相関として計算することができる。研究の生態学的妥当性は判断であり、計算された統計量ではない。

考察

生態学的妥当性はもともと、現実の状況に一般化する必要のある実験室での研究の文脈で用いられていた[5]。したがって、向精神薬によって生じる神経心理学的および精神運動学的障害の実験室での研究は、生態学的妥当性に乏しい。なぜなら、リラックスして安静にしている健康な被験者を制御された環境でテストした場合、ストレスを受けた患者が日常生活で直面する要求とはまったく異なるからである。実際、これらの認知テストや精神運動テストは、特にコンピュータを使ったタスクに基づいている場合、日常生活にはないものである。それでは、さまざまな神経精神疾患の動物モデルを用いた研究が、臨床現場の患者にとってどれほど生態学的な妥当性を欠くことになるだろうか。動物モデルで効果のある薬が、ヒトでは失敗することが多いのは、このためである[6]。

最後に、研究を適切に計画・実施し、発表された研究のメリットや応用を評価するためには、内的妥当性、外的妥当性、生態学的妥当性の概念を十分に理解する必要がある。

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー