医学の原理主義者たち

コンテンツ

除外基準 RCTは現実の患者さんを対象としているのか？
ゴールドスタンダードとエビデンスのヒエラルキー
RCTにも悪影響を及ぼす証拠の階層化の考え方
症例とアネクドート（逸話）について

訪問者数： 2,752

Medicine’s Fundamentalists

https://www.tabletmag.com/sections/science/articles/randomized-control-tests-doidge

ランダム化比較試験の論争。個別化医療を実現するためには、なぜ観察研究、事例研究、さらには逸話が必要なのか？

by ノーマン・ドイジ（Norman Doidge）

2020年8月14日

その研究が無作為化されていない場合は、読むのをやめて次の記事に進むことをお勧めする。How to Practice and Teach EBM

新しい治療法が有用であるかどうかは、大規模な無作為化比較試験（RCT）で肯定的な結果が得られなければわからない、と言われることが多くなったのはなぜであろうか。また、慢性疾患を患っていた患者さんが、他の治療法では何年も失敗していたのに、新しい治療法で突然良くなったとしても、個々の症例は「単なる逸話」であり、何の意味もないと言われることが多いのはなぜなのだろうか。

実際、COVID-19の危機に際しては、「無作為化比較試験のみが有用である」という言葉がお決まりのように使われている。この言葉は、あたかも医学界の主流であるかのように語られている。他の種類の研究が発表されると、RCTでない場合は「欠陥がある」とか「致命的な欠陥がある」と言われる（特に解説者が結果を好まない場合はそうではない）。その意味するところは、RCTは医学の真実を明らかにしたり、真実でないことを暴くことができる唯一の信頼できる方法論的機械であるということである。しかし、もしこれが自明の理であるならば、なぜ主要な医学雑誌は他の研究デザインを掲載し続け、しばしばそれらを優れた研究として賞賛し、医学部ではなぜ他の方法を教えるのであろうか？

それは、RCTが非常に優れた発明であるにもかかわらず、RCTがすべての状況で優れているわけではなく、多くの状況で劣っているからである。「RCTだけが重要である」という主張は、実際には主流ではないし、もしそうであったとしても、RCTの限界がより明確に理解されるようになってきているため、急速に衰退している。2017年の『New England Journal of Medicine』に掲載された、元CDC長官のThomas R. Frieden医学博士による、現在の公衆衛生政策に通常入るエビデンスについての考え方についての記事を紹介する。

無作為化比較試験（RCT）は長い間、治療効果に関するデータの理想的な情報源であると推定されてきたが、決定的な行動を起こすためのエビデンスを得るのに他の方法が関心を集めており、異なるデータ源の長所を活用し、限界を克服するための新しいアプローチが求められている。この論文では、公衆衛生の観点から、RCTとそれに代わる（時には優れた）データソースの使用について説明し、RCTの主な限界を示し、健康上の意思決定のために複数のデータソースの使用を改善する方法を提案している。RCTは、その長所にもかかわらず、大きな限界がある。

実際、これが現在の「主流」の立場であり、主流の立場が非常に理にかなっているケースでもある。CDCのトップは「主流」と言っても過言ではない。

しかし、「RCTでしか決められない」という考えは、私がRCT原理主義者と表現するものの特徴的な態度でもある。ここで言う原理主義者とは、一連の信念への揺るぎない執着と、ニュアンスを欠いたある種のリテラルマインドを示す人のことで、この場合、RCTを医療における客観的真実の唯一の源と見なしている（原理主義者はしばしば自分の核となる信念を見なすように）。多くの原理主義者がそうであるように、この場合、権威ある立場の支持者を装うことが多いのであるが、実際には彼らの立場はそうではないかもしれない。また、核となる信念は、カテキズムのように、時には何度も繰り返され、反対の信念は異端のように扱われる。RCT原理主義者が売り込んでいるのは、科学的な態度ではなく、特定の種類の問題のために設計されたRCTというツールを、唯一のツールとして使用することを強要しているのである。この場合、RCTはRandomized Control Trialsではなく、「Rigidly Constrained Thinking」（硬直した思考回路）（1990年代に統計学者のDavid Streinerが作った言葉）の略だと理解するのがよいだろう。

研究は疑問を投げかけるものである。その質問に答えるために、どのような研究やツールを用いるかを決定するには、質問とその背景を理解することが常に不可欠である。RCT論争」という言葉があるが、どちらの側もRCTの美点を否定していないが、一方の側である原理主義者は、理由は後述するが、他の研究の美点を否定している。RCT原理主義者は、ハンマーを持っている人の典型的なケースであり、すべてのものはそれゆえに釘でなければならないと考える。非原理主義者の立場は、RCTは研究者のツールキットに貴重なものを加えたものであるが、素晴らしい新しいハンマーを手に入れたからといって、電気ドリルやドライバー、ノコギリを捨てるべきではないということだ。

そこで、まず「無作為化」対照試験の理論的根拠と、当初理解されていたその真の強みについて、簡単におさらいしてみよう。これは、無作為化をしないとどうなるかということで説明するのが一番わかりやすいであろう。

例えば、ある病気に対する薬やその他の治療法の影響を評価したいとする。RCTが開発される前は、ある病気の人たちを集めて薬を投与し、別の病院で同じ病気で薬を投与されていない人たちを探して結果を比較し、どちらのグループが優れているかを観察していた。これは「観察研究」と呼ばれ、さまざまなバージョンがある。

しかし、すぐに科学者たちは、この結果が意味を持つのは、2つのグループが、病気の重さや、病気の進行に影響を与える他の多くの要因の点でよく一致している場合だけだと気づいた。

もし、2つのグループが異なっていたら、より良い結果を出したグループが薬のおかげなのか、それともそのグループに有利な何かがあって、より良い結果を出したのかを見分けることはできない。例えば、年齢がCOVID-19による死亡の大きな危険因子であることがわかっている。おそらく、年齢を重ねるにつれて免疫力が低下し、高齢者はCOVID-19に悩まされる前から他の病気にかかっていることが多いからである。一方のグループは平均年齢60歳で、全員が薬を手にし、もう一方のグループは平均年齢75歳で、薬を手にしなかったとする。結果を分析して比較したところ、若いグループの方が生存率が高かったとする。

単純な研究者は、「COVID-19の死から患者を守る薬の力」を測定しているつもりかもしれないが、実際には、患者を守るための「若さ」の相対的な役割を測定していたのかもしれない。科学者たちはすぐに、このデザインには欠陥があると結論づけた。なぜなら、より良い結果が年齢によるものなのか、それとも薬によるものなのか、合理的な自信を持って知ることができないからである。

年齢は、”交絡因子 “と考えられている。年齢がグループ全体の研究結果に影響を与えることもあるため、混乱を招くことから交絡因子と呼ばれている。現在、COVID-19でわかっている他の交絡因子には、研究の時点で病気がどの程度進行しているか、糖尿病、肥満、心臓病、そしておそらくその人のビタミンDレベルなどがある。しかし、まだ知られていない他の多くの交絡因子があるかもしれないし、おそらくあるであろう。例えば、その人の一般的な体力、家の中の換気など、役割を果たしていると思われるものの、はっきりとはわからない潜在的な交絡因子もある。

ここで役に立つのが無作為化である。無作為化比較試験では、十分な数の患者さんを、治療群と非治療群（「プラセボ」または「砂糖の錠剤」）のいずれかに無作為に割り振る。このとき、治療法以外のすべての要素は、2つのグループの生活に影響を与えないようにする。このように多数の患者さんを無作為に治療群と非治療群に振り分けることで、年齢などの既知の要因だけでなく、まだ解明されていない謎の要因も含めて、それぞれの交絡因子が両群に同じ確率で現れることを期待している。観察研究では、ある程度の努力をすれば、「グループマッチドデザイン」で、我々が理解している交絡因子の少なくとも一部を一致させることができるが（例えば、両グループの年齢や疾患の重症度が同じになるようにする)我々が理解していない交絡因子を一致させることはできない。一般的にRCTが有利だと考えられているのは、この点である。

このようにRCTが優れた手法であるにもかかわらず、なぜわざわざ観察研究を行うのかと疑問に思うかもしれない。

医学の世界では、無作為化比較試験（RCT）よりも観察研究の方が明らかに優れている場面がいくつもある。例えば、ある病気の危険因子を特定したい場合などである。例えば、クラックコカインの使用が子供の脳の発達に悪い影響を与えると考えられる場合、RCT（大人数の子供を対象に、半数にクラックコカイン、残り半数にプラセボを無作為に処方し、どちらのグループの脳機能が優れているかを調べる方法）を行うことはできない。その代わりに、クラックコカインを摂取したことのある子供と、摂取したことのない子供を観察研究で追跡し、どちらのグループが良い結果を出すかを調べるのである。すべての研究は疑問を投げかけ、その背景に存在している。そして、その疑問に答えるために使用するツールの選択には、道徳的な背景が関係している。それがヒポクラテスの101である「危害を加えない」ということである。

さて、危険因子の研究は、治療法の研究とは大きく異なると言うかもしれない。しかし、それほど違いはない。道徳的にも、方法論的にも、非常に似通った問題があり得るのだ。

1980年代に突然、説明のつかない理由で乳児がベビーベッドで大量に死亡していることが臨床医に知られるようになり、「乳児突然死症候群」、「SIDS」、または「ベビーベッド死」という新しい疾患が発見された。「親が子を殺しているのではないか」「感染症ではないか」など、さまざまな説が飛び交った。ニュージーランドでは、死亡した乳幼児とそうでない乳幼児の生活要因を観察・比較した大規模な観察研究が行われた。その結果、死亡した乳児は腹ばいで寝かせることが多かったという。あくまでも観察結果である。しかし、それだけではなく、仰向けで寝かせることが有効ではないか、ベビーベッドで仰向けに寝かせることは避けるべきではないかと考えられたのである。驚いたことに、乳幼児の死亡率は劇的に減少した。まともな人道的人なら、こうは言わないであろう。「RCTを行い、交絡因子を排除して、これを最後に確実に解決すべきだ。半分の子供を腹這いに、もう半分の子供を背中這いにするように無作為に割り当てればいい」。それは非良心的なことであった。観察研究で得られた証拠は十分なものであった。

繰り返しになるが、すべての研究には背景があり、疑問に答えるための手段なのである。SIDSに関する差し迫った疑問はそうではなかった。SIDSの喫緊の課題は、「SIDSのすべての原因について絶対的な確信を得るにはどうすればよいか」ではなかった。それはどうすれば乳児の命を一刻も早く救うことができるのか？今回のケースでは、観察研究がその答えになっている。

SIDSの話は、危険因子の研究と新しい治療法の研究が、その治療法によって命が救われるかもしれない場合に、道徳的な観点からどれほど近いものであるかを見ることができるケースである。子供をお腹の上に乗せるのはSIDSの危険因子。仰向けにするのはその治療法である。研究対象者を危険にさらして傷つけてはならないという道徳的な問題は明らかである。

同様に、致命的な病気に対する最も有望な治療法を差し控えることもまた、道徳的な問題である。重篤なCOVID-19患者にとって、ヒドロキシクロロキンとアジスロマイシンの併用療法が最も有望な治療法であると考えたフランスの研究者たちは、まさにこのような立場をとっており、RCT（患者の半数に薬を投与しないことを意味する）を行うことは非良心的であると主張していた。RCT原理主義者は、彼らの研究を「欠陥がある」「ずさんだ」と呼び、方法論が弱いことを示唆した。これに対してフランスの研究者たちは、「私たちはまず医師であり、彼らは死に至る病を克服するために来ているのであって、研究対象になるために来ているのではない。無作為に割り振って、半分の人に「すみません、今日はあなたのラッキーデーではない、あなたは非治療群です」と言うことはできない。

新しい治療法を評価する上で、観察研究には他にも利点がある。観察研究は、一般的にRCTよりもコストが低く、より迅速に開始し、より迅速に発表することができる。これは、病気についてほとんど理解されていない新型パンデミックのように、情報が緊急に必要な場合に役立つ。RCTは、道徳的な問題もあり、倫理的な承認を得るのに時間がかかる）。観察研究は、患者が大量に死亡し、病院のスタッフが人々を生かすことに追われているような状況でも実施しやすいものである。観察研究では、カルテに書かれた観察事項を過去にさかのぼって利用することができる。このような場合には、スタッフが用意した薬や治療法に患者がどのように反応したかという最初の観察結果を、可能な限り体系的に記録することが重要だ。

除外基準 RCTは現実の患者さんを対象としているのか？

しかし、RCTの概念的な核心にも問題がある。RCTのデザインでは、「交絡因子」を単に無作為化によって治療群と無治療群の間でバランスを取らなければならないものとしてではなく、最初から排除しなければならないものとして捉えている場合が多い。最終的な結果の解釈をより確かなものにしたいなど、さまざまな理由から、試験開始前に既知の交絡因子を積極的に排除し、特定の交絡因子を持つ患者をそもそも試験に参加させないようにするのである。そのためには、「除外基準」と呼ばれる、研究に参加することを拒否する理由をたくさん用意しておく必要がある。

したがって、うつ病のRCTでは、通常、うつ病のみを発症し、交絡因子となりうる他の精神疾患を発症していない患者を対象としている。つまり、うつ病であっても、アルコール依存症でもなく、違法薬物を使用しているわけでもなく、人格障害でもない人を対象にしている。また、積極的に自殺を考えている人は除外する傾向がある（自殺を考えている人は、高価な研究を完了できない可能性があるし、自殺の危険性が高い人にプラセボを投与するのは倫理的に問題があると考える人もいる）。他にも、試験に使われる薬にアレルギーがあることがわかっている場合など、さまざまな除外理由がある。

しかし、問題はここからである。これらの除外理由が積み重なると、多くの、もしかしたらほとんどの現実のうつ病患者がこのような研究から除外されることになる。つまり、この研究のサンプルは、実際の患者さんを代表するものではない。これでは、少数の人をテストして（これは経済的に可能です)そこから他の集団へと推定するという、研究調査の「サンプル」のそもそもの目的が損なわれてしまう。同様に、うつ病と薬に関する多くの研究は、学期末の論文でAではなくB+を取ったばかりの大学生のように落ち込んでいる人を対象としている。これが、多くの薬（または短期的な治療法）が、短期的な研究ではうまくいっても、患者が再発してしまう理由である。

もしあなたが製薬会社（このような研究のほとんどにお金を出している）で、新薬のテストをしているのであれば、除外基準は、病気の患者を除外すれば、その薬が実際よりも強力に見えるように有利に働くようにすることができる。（特に、その薬でお金を儲けることを第一に考えている場合には、これは良いトリックだと思う）。

これは思い込みの問題ではない。RCTが一般的に代表的なサンプルで構成されているかどうかというこの問題は、研究されている。あるRCTの重要なレビューによると、71.2%が実際の臨床現場での患者さんを代表しておらず、研究対象となった患者さんの多くは実際の患者さんよりも病状が軽いことがわかった。この事実に加えて、最も信頼され、引用されている雑誌に掲載された、いわゆる最も優れたRCTの多くが、その生データを別のグループに渡して所見の再確認を求めたところ、35%は再現できないという事実から、実際にはRCTは完璧とは言い難いことがわかる。研究の数値や測定値の再分析という単純なことが再現できないという結果は、研究における他の潜在的な問題への対処にさえ着手していない。著者は、適切な質問をし、適切なデータを収集し、信頼できる検査を行い、患者を適切に診断し、適切な投薬量を用い、十分な期間、十分な数の患者を対象としたのであろうか？そして、多くのRCTがそうであるように、最も典型的で最も病的な患者を除外したのか？

なお、他の研究デザインにも除外基準はあるが、以下に説明する理由から、RCTに比べて問題が少ないことが多い。

ゴールドスタンダードとエビデンスのヒエラルキー

では、「RCTはゴールドスタンダードであり、その下には観察研究があり、一番下には症例報告があり、その下には逸話がある」という「エビデンスの階層」における最高のエビデンスであるとも言われるのはなぜであろうか。

それにはいくつかの理由がある。

まず1つ目は、先日学んだことである。RCTは、ある集団の少数のサンプルに治療を施し、その結果を見て、その結果をより大きな集団に外挿することができる、完全に信頼できる研究方法だと考えられてた。しかし、それは仮定に過ぎず、研究対象となる患者が非典型的であることが多いことがわかった今、RCTから一般化することには非常に注意を払わなければならない。このきまり悪さは、かなり最近の知見であり、RCTがゴールドスタンダードだと言っている人たちは、まだ十分に考慮していない。

2つ目の理由は原理主義者が古い科学に頼っていたことである。RCTは無作為化して交絡因子を排除するため、治療法の効果を定量的に推定する上で信頼性が高いと主張していた。

しかし、RCTが観察研究よりも普遍的に優れていて信頼性が高いかどうかを知りたい科学者は、この問題を主張するだけではなく、実際に科学的に研究するはずである。そして1980年代、チャルマーズらは1960年代と1970年代に行われた研究を調査し、その結果を発表した。その結果、同じ治療法についてRCTと観察研究の両方が行われた場合、観察研究では56%の確率で肯定的な結果が得られたのに対し、盲検RCTでは30%しか得られなかった。このことから、観察研究は新しい治療法の効果を誇張しているのではないかと考えられた。

観察研究とRCT研究の結果を比較した他の3つのレビューでも同じような差が見られたため、研究者たちはRCTの方が研究対象の治療に対する研究者のバイアスを検出するのに優れている可能性があり、したがってより信頼性が高いと結論づけた。医薬品の科学的研究の多くは、その医薬品を製造する製薬会社が費用を負担しているため、研究にバイアスがかかっていても不思議ではなかった。これらのレビューは、RCT原理主義の基礎の多くを形成した。

RCTが実施され、発表されたからといって、それが有効性を誇張していないと仮定する理由にはならない。

しかし、問題は、これらの研究が1960年代から 1970年代に行われた研究のレビューであるということだ。観察研究の研究者がこの問題に気づくと、彼らはゲームを強化し、保護措置を改善した。

2000年には、イェール大学とアイオワ大学の研究者が、1990年代に行われた数百のRCTと観察研究の結果を比較した新しいレビューを行った。その結果、観察研究の方が治療効果が高いという傾向はなくなっていた。RCTと同じような結果が得られたのである。これは重要な発見であったが、医学のカリキュラムには十分に組み込まれなかった。

RCTの話が出てくるのには、もう一つ理由がある。RCTが新薬を試験する際に規制機関から好まれる試験のタイプになったことで、RCTが脚光を浴びるようになり、製薬会社はゲーム性を高め、RCTで試験する薬の効果を誇張するための多くの独創的な方法を学んだのだ。

この問題については、何冊もの本が書かれているが、中でもBen Goldacreの「Bad Pharma: How Drug Companies Mislead Doctors and Harm Patients」は秀逸である。薬を市場に出すためには、薬の効果を示す2つのRCTが必要なので、これらのテクニックは、多くの研究を行い、良い結果が得られないものは発表しないというものである。しかし、ネガティブな結果の研究をすべて消してしまうよりも、もっと巧妙な手法がある。研究は発表するが、やっかいなデータは隠す、良いデータは有名な雑誌で発表し、悪い結果は無名の雑誌で発表する、短期的な副作用は調査せず、長期的な副作用はほとんど調査せず、質問もしない、あるいは測定尺度を弄って、臨床的には何の違いもないのに、患者が統計的には意味のある利益を得ているように見せる、などの方法がある。もし研究を行って重要な指標で悪い結果が出たとしても、それを報告せずに、自分に有利な小さな結果を見つけて、その利益だけを報告するように研究の目的を遡及的に変更する。研究者と被験者に箝口令と守秘義務のサインをさせる。製薬会社に論文のゴーストライターをさせ、表を作らせ、生のデータを見ることのない学者に署名させる。このようなことは日常茶飯事だ。

これらのトリックは、薬の承認を得るためにしばしば使用され、成功を収めている。なぜなら、パンデミックでは、病気が広範囲に及ぶため、新薬は大手製薬会社に何十億もの利益をもたらし、彼らは多くの脚本を持っているからである。数多くのRCTの中から 2つのRCTを選んで薬を進めると、プロパガンダキャンペーンが始まる。ゴールドクレアが示すように、製薬会社はマーケティングに研究の2倍の費用をかけている。つまり、繰り返しになるが、RCTが行われて発表されたからといって、それが有効性を誇張していないと考える理由にはならない。

しかし、このような不正なルールに従わない研究グループがある。それは、すでにジェネリック医薬品を対象としたRCTである。このようなケースでは、製薬会社が大金を稼げるかもしれない薬のライバルとしてジェネリック医薬品を持っている場合、そのジェネリック医薬品を悪者にする方法がある。もしジェネリックが4週間で効果を発揮するのであれば、3週間の試験で自社の薬を対抗させる（自社の薬のプラシーボ効果はまだ切れていない）。もしビタミンが薬を脅かしているのであれば、そのビタミンに対して薬をテストしてみよう。RCTであることが重要なのだ。

このような状況にもかかわらず、RCTの支持者は、他のすべての条件が同じであれば、RCTは常により信頼性が高いと教えている。そして、RCTが観察研究よりも優れていた有名なケースをチェリーピックし、観察研究が優れていた、あるいは少なくとも状況に適したツールであったケースを無視して教えている。彼らは「RCTは観察研究より優れている」という露骨な立場をとっており、「他の条件が同じであれば、多くの状況でRCTは観察研究より優れているが、すべての状況ではない」という、より合理的で、正確で、穏健な立場をとっていない。

「All else being equal」（他のすべての条件が同じなら）というフレーズは非常に重要だ。なぜなら、多くの場合、all else is equalではないからである。単純に「RCTはエビデンスに基づく医療のゴールドスタンダードである」と繰り返すと、素朴な聞き手には、RCTであれば良い研究であり、信頼性があり、再現性があるに違いないと思われてしまう。ほとんどの研究には多くのステップがあり、たとえ無作為化の要素があったとしても、1つか2つのステップでデザインが悪くなり、誤った情報につながってしまうことがある。さらに、非常に不愉快なことに、RCTはしばしば再現できず、互いに矛盾することが多いという事実がある。多くの場合、RCTには多くのステップがあり、大手製薬会社はシステムを利用することに非常に長けているからである。金のように、価値があるが、変幻自在であることがわかる。問題の多くは、これらの研究で認められているよりも、患者がはるかに異なっており、これらの複雑さが研究デザインでうまく扱われていないことだ。

RCTにも悪影響を及ぼす証拠の階層化の考え方

現在のエビデンスに基づいた医学の「エビデンスの階層」への愛着についての奇妙な点の一つは、科学的に証明された再現性の危機の意味を無視したまま進んでいることである。確かに、再現性の危機があるという事実は、今では広く教えられ、知られているが、原理主義者にとっては、その「危機」は基本的な前提を見直す必要がないかのようである。再現性の危機は、通常のビジネスから切り離され、RCTの傲慢さに置き換えられている。

皮肉なことに、RCTの素晴らしさは、研究の結果に及ぼす理解できない交絡因子の影響を中和するために考案された手法であり、したがって、認識論的な謙虚さから始まるのである。RCTは、発見としては、人類の素晴らしい認識論的成果の一つであり、統計学的ソクラテスのようなもので、知恵は「私が知らないことは何でも、私が知っているとさえ思わない」（Apology, 21d）という考えから始まることを発見した。

しかし、原理主義的な動きに取り込まれたその美しい考えは、覆されてしまった。RCT原理主義者が他の研究デザインを卑下する方法は、それらすべてのデザインをRCTの非常に現実的な強みで判断することである。この誇張は、彼らが議論する際に使ううんざりするような言葉にも暗示されている。RCTは「ゴールドスタンダード」であり、他のすべてのものが測定される基準であり、真の価値の源なのである。これらの他のデザインは、交絡因子を排除する点でRCTに匹敵するであろうか？いいえ、それは劣っている。これは、RCTに認識論的な限界がないと考えている限り、うまくいく。このような態度の問題点は、RCTのデザインが改善されないことを事実上保証していることである。実際には、原理主義者が他の研究の利点についてもっと注意深く考え、それらを取り入れたり、より洗練された方法でそれらと一緒に仕事をしようとすれば、RCTは最も早く改善されるであろう。これは、「利用可能なすべての証拠」というアプローチが必要であることの別の言い方である。

症例とアネクドート（逸話）について

さらに気になるのは、発見の方法としての症例を軽視したり、科学に証拠として提供できるものを軽視したりすることである。例えば、神経学の分野では、フィニアス・ゲイジのような個々の症例が前頭葉について教えてくれたし、H.M.のような症例が記憶の役割について教えてくれた。

卑下の仕方はこうだ。「症例は逸話であり、逸話の複数形はデータではなく、ただのたくさんの逸話である。」

まず第一に、症例は逸話ではない。医学書における逸話とは、通常、数センテンス、せいぜい1パラグラフ程度のもので、「50歳の女性がX病を呈し、Yの薬で10日間治療を受け、図7にX線写真の前後を示し、劇的に改善した」というように、1つのポイントを強調するために、多くの重要なディテールが削られている。その意味で、逸話は、具体的で生き生きとした細部の多さに依存する症例とは正反対のものである。

症例（ケースヒストリー）（特に古典的な神経学や精神医学の場合）は何ページにもわたって書かれる。それは、カナダの医師、ウィリアム・オスラーが指摘したように、理解しているからである。”優れた医師は病気を治療するが、偉大な医師は病気を持つ患者を治療する」。そして、その患者さんとは、長所、短所、他の病気、他の薬、精神的サポート、食事、運動習慣、悪い習慣、遺伝、過去の治療歴など、すべてが結果に影響する。良い医療を実践するためには、これらすべてを考慮に入れなければならない。患者さんは、これらの詳細のうちの1つではなく、部分の総和を超えた全体であることを理解しなければならない。このように、真の患者中心の医療は、必然的にホリスティックなアプローチを目指す。つまり、症例は逸話ではなく、実在する人物の具体的な描写であり、要約データセットとは最もかけ離れた生き生きとしたものなのである。

典型的なRCTは、何百人もの患者についてのいくつかのデータポイントを記述する。典型的な症例は、一人の患者について、おそらく数百のデータポイントを記述する。それは劣っているのではなく、異なっているのである。また、その構造（患者の症状、客観的徴候、主観的体験、詳細なライフヒストリー、病気を良くするもの、悪くするものなど、症例報告に含まれるもの）は、何世紀にもわたって開発されたものである。

逸話にもそれなりの意味がある。方法論者は、医師が患者に特定の薬やサプリメント、治療法を与えて良くなったと主張すると、「それは何の証明にもならない」と言うのをよく耳にする。「それは単なる逸話だ」と言うのをよく耳にする。問題は、この “just （単なる）”という言葉にある。科学者が「just」という言葉を前に付け加えたからといって、何かが無意味になったり、何も起こらなくなったりするわけではない。この言葉は、その逸話については何も語らず、話し手が大きな数の集合を好むことについて多くを語っている。

しかし、逸話は非常に意味のあるものであり、新しい治療法によって初めて人生が変わった場合だけではない。逸話に無関心であることは、例えば製薬会社にとっては非常に都合が良いことだ。もし、あなたが医師で、バランス感覚の優れた患者さんにゲンタマイシンなどの抗生物質を投与したところ、その抗生物質がバランス器官を傷つけたために、突然、バランス感覚を失ってしまったとしたら、製薬会社は、それは「単なる」逸話だと言うことができる。それは重要ではない。実際、このようなケースは非常に稀である。しかし、私たちが副作用について知るのは、まさにそのような逸話によるものなのである。その理由の一つは、（上で述べたように）新薬のRCTのほとんどが、そのような種類の質問をしないからである。

正直に言うと、エビデンスに基づく医療は、大部分がまだ願望である。それは理想なのだ。

だからこそ、私がとっているアプローチは、患者さんの健康を考える経験と投資のある、訓練された医師のほとんどがとっているアプローチであり、「利用可能なすべての証拠に基づくアプローチ」と言えるかもしれない。つまり、それぞれの研究デザイン、その長所と短所を知り、自分の目で見て、自分の治療を求めている特定の患者から聞いていることと、すべてを合わせなければならないのである。近道はない。

現在のCOVID-19の状況におけるこのアプローチの意味するところは、多くの人が主張しているように、COVID-19の治療法を決定するのに、単に待望のRCTだけに頼っていてはいけないということだ。なぜなら、最終的に医師は病気を治療するのではなく、病気を持つ患者を治療するのであり、その患者はそれぞれ異なるからである。

これから行われるRCTでは、最終的にCOVID-19には1つの薬が「ベスト」であると推奨されるかもしれない。それは何を意味するのだろうか？誰にとってもベストなのだろうか？そうではない。それは大規模なグループにおいて、他のアプローチよりも多くの人を助けることができたということだ。

多くの人にとってどの薬が最適かという情報は、もしあなたが貧しい国の公衆衛生の責任者で、1つの薬しか買えない場合に非常に役立つ。貧しい国の公衆衛生担当者が、1つの薬しか買えない場合には、最も多くの人に効く薬を選ぶことができる。

しかし、様々な薬を購入するための十分な資金がある地域のために発注する場合は、別の質問に興味を持つ。ほとんどの人に効くが、すべての人に効くわけではないXという薬の恩恵を受ける人だけでなく、できるだけ多くの病気の人をカバーするためには、何を用意すればいいのか？例えば、ある薬が10%の人にしか効かないとしても、その人の命は救われるのだとすれば、手元に置いておくべきであろう。少数の人を助ける薬は、研究されていないかもしれないが、他の薬が失敗した場合、それを試すべきである。

第一線で活躍する医師は、そのような薬を手に入れたいし、必要としている。多くの人を助ける薬に患者がアレルギーを起こしたらどうしよう？では、他にどんな薬を試せばいいのだろう？あるいは、もし、勧められた薬が、COVID-19以外の疾患で患者が生きていくために必要な薬との相互作用があるとしたら？

このような問題には非常に多くの組み合わせがあり、そのどれもが研究されていないため、患者のことをよく知っている医師でなければ、十分な情報に基づいた判断を下すことができない。このような問題は、医師のチャットラインで発生するもので、「心臓病で、A、B、Cの薬を服用していて、腎臓病でDの薬を服用している患者がいるが、COVID-19の薬Eにアレルギーがある。」

エビデンスに基づいた医療では、このような個々の複雑な事情はともかく、最も基本的な治療法のいくつかをRCTや観察研究で研究していない。したがって、最も賢明な選択肢は、患者さんを知る専門家ができるだけ柔軟に、できるだけ多くの薬にアクセスできるようにすることだ。正直に言うと、エビデンスに基づく医療は、大部分がまだ野心的なものであり理念的なものだ。臨床家は自由度を必要とし、患者はそれをもっていると想定している。しかし今、RCT原理主義者たちは、いくつかの薬についてRCTが行われていないことを利用して、それらへのアクセスを制限しようとしている。彼らはあまりにも行き過ぎている。これは、命を犠牲にした認識論的な思い上がりであり、”Absence of evidence is not evidence of absence “（証拠がないことは、ないことの証拠ではない）という古い格言を思い起こさせる。考えられるすべての可能性に対して最良の研究がなされていない限り、医学は芸術であり科学であることに変わりはない。

では、このように臨床家に自由裁量権を与えることは、私が科学を信じていないことを意味するのだろうか？

私が「信じる」といつ言ったのか？

それは科学的な言葉ではない。科学は道具だ。私は道具を崇拝しない。むしろ、その仕事に適したものを見つけようとする。あるいは、複雑な仕事の場合、特に医学の場合は、私たちは皆違っていて、皆複雑なので、適切なもの、複数のものを探すのである。