『医療ニヒリズム』(2018)
Medical Nihilism

強調オフ

医療・製薬会社の不正・腐敗相対主義、ニヒリズム

サイトのご利用には利用規約への同意が必要です

Medical Nihilism

academic.oup.com/book/6511

要旨

本書は医療ニヒリズムを擁護するものであり、医療介入の有効性をほとんど信頼すべきではないという見解である。失敗した医療介入の頻度、医学研究における誤ったエビデンスの程度、多くの介入の理論的根拠の薄さ、医学における経験的手法の曖昧さを考慮し、最善の帰納的枠組みを用いるならば、医療介入の有効性に対する信頼は低くあるべきである。第I部では、理論的・概念的な基礎を明確にし、有効性に関する新しい説明の基礎となるハイブリッドな疾病理論の擁護を提示し、これを薬理学的科学や医療化などの問題に適用する。第II部では、医学研究の詳細を批判的に検討する。ランダム化試験やメタアナリシスなど、医学研究において最も優れた方法であっても、その方法はまどろっこしく、さまざまなバイアスに悩まされる。医療介入の有効性を測定する方法は、組織的に利益を過大評価し、害を過小評価する。第III部では、医療ニヒリズムの論拠と、この立場が医学研究と実践にもたらすものを要約する。医療ニヒリズムを注意深く評価するために、議論を形式的に述べる。メディカル・ニヒリズムは、医学研究は修正されるべきであり、臨床診療はその治療的アプローチにおいてより積極的であるべきではなく、規制基準は強化されるべきであると示唆している。

目次

  • 謝辞
  • パーランス
    • 1.はじめに
      • 1.1 医学的虚無主義
      • 1.2 現在の自信
      • 1.3 医学的虚無主義の簡単な歴史
      • 1.4 根拠に基づく医療
      • 1.5 主要な議論
      • 1.6 マスターアーギュメント
      • 1.7 虚無主義の後
  • 第一部 概念
    • 2. 医療介入の有効性
      • 2.1 有効性と疾患
      • 2.2 自然主義
      • 2.3 規範主義
      • 2.4 ハイブリッド主義
      • 2.5 消極主義
      • 2.6 結論
    • 3. 有効性と医療化
      • 3.1 序論
      • 3.2 有効性のレベル
      • 3.3 有効性の範囲要件
      • 3.4 あらゆる錠剤に対する病気
      • 3.5 過剰診断と過剰治療
      • 3.6 規範を目指して
      • 3.7 異議
    • 4. 魔法の弾丸
      • 4.1 序論
      • 4.2 魔法の弾丸
      • 4.3 魔法のない医学
      • 4.4 非特異性
      • 4.5 複雑さ
      • 4.6 結論
  • 第二部 方法
    • 5. 階層の崩壊
      • 5.1 証拠の階層
      • 5.2 証拠の利用者は証拠のトークンを利用する
      • 5.3 異なる仮説タイプ、異なる階層
      • 5.4 証拠の評価と統合
      • 5.5 トップの問題
      • 5.6 階層の放棄
      • 5.7 議論
    • 6. メタアナリシスの可塑性
      • 6.1 メタアナリシス
      • 6.2 制約と客観性
      • 6.3 制約の失敗
      • 6.4 メタアナリシスは可塑性がある
      • 6.5 ヒル戦略
      • 6.6 結論
    • 7. 医学的証拠の評価
      • 7.1 品質評価ツール
      • 7.2 評価者間信頼性
      • 7.3 ツール間信頼性
      • 7.4 証拠の意義の決定不足
      • 7.5 結論
    • 8. 有効性の測定
      • 8.1 序論
      • 8.2 計器
      • 8.3 測定
      • 8.4 外挿
      • 8.5 規制における測定
      • 8.6 結論
    • 9. 害の虚ろな追求
      • 9.1 序論
      • 9.2 害の操作化
      • 9.3 人間初めて、二度と見られない
      • 9.4 臨床試験と権力の乱用
      • 9.5 今すぐ飛び込め、後で見る(ただし、あまり見ない)
      • 9.6 データの秘密主義
      • 9.7 結論
  • 第三部 証拠と価値
    • 10. バイアスと不正行為
      • 10.1 序論
      • 10.2 バイアスの種類
      • 10.3 出版バイアス
      • 10.4 不正行為
      • 10.5 利益相反
      • 10.6 バイアスの形式化
      • 10.7 議論
    • 11. 医学的虚無主義
      • 11.1 序論
      • 11.2 棄却された医療介入
      • 11.3 医学の最も暗い秘密
      • 11.4 マスターアーギュメント
      • 11.5 異議
      • 11.6 結論
    • 12. 結論
      • 12.1 やさしい医療
      • 12.2 方法論的詳細の微調整
      • 12.3 研究の優先順位の再考
      • 12.4 規制と帰納的リスク
      • 12.5 医学研究の革命
      • 12.6 医術と人間愛
  • 付録1. ベイズの定理とスクリーニング
  • 付録2. 測定尺度
  • 付録3. RDのRRに対する認識論的証明
  • 付録4. RDのRRに対する意思決定理論的証明
  • 付録5. 有効性の測定のモデリング
  • 参考文献
  • 一般的な索引
  • 薬物の索引

ジェイコブ・ステゲンガ

謝辞

ナンシー・カートライトは、本書に最も顕著な影響を与えた。彼女自身の仕事の厳しさは常に刺激となり、彼女の牧歌的なケアは、本書を数え切れないほどの言葉にできない方法で育んでくれた。デニス・ウォルシュは、執筆を始めるための時間と自信を与えてくれた。Alex Broadbent、Jonathan Fuller、Maël Lemoine、Anna Vaughnには、この原稿の様々な段階の大部分を精読し、質問し、批判してくれたことに感謝している。

また、特定の章については、多くの方々から貴重な解説と議論をいただいた。Anna Alexandrova, Hanne Andersen, Richard Ashcroft, Peggy Battin, Ken Bond, Frédéric Bouchard, Craig Callender, Martin Carrier, Nancy Cartwright, Hasok Chang, Rachel Cooper, Heather Douglas, Marc Ereshefsky, Martyn Evansに感謝する、ルイス・フローレス、レスリー・フランシス、フェルミン・フルダ、ジェームズ・ガードナー、ベアトリス・ゴロンブ、サラ・グリーン、マルタ・ハリーナ、ジョン・ホッジ、ベネット・ホルマン、ジェレミー・ハウイック、フィリップ・ヒューマン、フィリス・イラーリ、スティーブン・ジョン、サーナ・ジュコラ、アーロン・ケンナ、ブレント・キウス、ジェイムス・クルーガ、アダム・ラ・カゼ、エリック・マーティン、リア・マクリマンズ、ボアズ・ミラー、イライジャ・ミルグラム、デヴィッド・モハー、ピーター・モムチロフ、ロバート・ノースコット、ルーン・ニルプ、バーバラ・オシマニ、ウェンディ・パーカー、アーニャ・プルティンスキ、ダーシャ・プルス、グレゴリー・レーディック、イサク・レコード、フェデリカ・ルッソ、サイモン・シェイファ、Samuel Schindler, Jonah Schupbach, Miriam Solomon, Jan Sprenger, Georg Starke, Veronica Strang, James Tabery, Eran Tal, Mariam Thalos, Aleksandra Traykova, Jonathan Tsou, Denis Walsh, Sarah Wieten, Torsten Wilholt, John Worrall, and Alison Wylie. また、多くの大学や会議の聴衆にも感謝している。長年にわたって多くの対話者を持つことのリスクは、ここですべての人に感謝することを忘れがちであることである。もしそうであったなら、本当に申し訳ない。

ブレント・キウス博士(精神医学)は私の医学哲学セミナーに参加してくれたし、ベンジャミン・ルイス博士(精神医学)はユタ大学神経精神医学研究所で患者との臨床を見学させてくれた。ベアトリス・ゴロム博士(内科)は、医療介入の有害性を評価する際の問題点を教えてくれた。ディック・ゾウトマン博士(感染症学)は、多様なエビデンスを統合することの実際的な難しさを初めて私に教えてくれた。Luis Flores博士(精神医学)、医療政策アナリストのKen Bond、疫学者のDavid Moherは、特定の章について文書による解説を行った。Samuel Brown博士(集中治療)、Howard Mann博士(放射線)、Jeffrey Botkin博士(小児科および研究倫理)、Willard Dere博士(個別化医療)には、本書のいくつかの一般的なテーマについて貴重な議論をいただいたことに感謝している。

本書の一部は、過去の出版物に掲載されている。第2章のバージョンと第3章の一部は、『生物学・生物医学の歴史と哲学の研究』(以下、研究C)(2015a)に「医療介入の有効性」として掲載された。第5章の一部を「Down with the Hierarchies」として『トポイ』(2014)に掲載した。第6章のバージョンは、Studies C (2011)に「メタアナリシスはプラチナスタンダードなのか」として掲載されたものである。第7章のバージョンは、「Herding QATs」として出版された: 医学におけるエビデンスのための品質評価ツール」(Classification, Disease, and Evidence): New Essays in Philosophy of Medicine (2015b)に掲載された。第8章のバージョンは、『研究C』(2015c)に「Measuring Effectiveness」として掲載された。第9章のバージョンは、Perspectives on Science (2016)に「Hollow Hunt for Harms」として掲載された。付録4は、『Philosophy of Science』(近刊)の論文「Three Arguments for Absolute Outcome Measures」においてJan Sprengerと共同で作成した。第8章と第12章の一部は、「Drug Regulation and the Inductive Risk Calculus」として Exploring Inductive Risk (2017)に掲載されている。私は、これらの論文の論点を改善・明確化し、首尾一貫した全体の部分として統一するために、これらの論文から広範囲に手直しし、切除し、資料を追加した。第1章、第4章、第10章、第11章、第12章、および付録の技術資料の大半は新規に作成したものである。

本書は、カナダ政府が運営するバンティング博士研究員プログラムのフェローとして、トロント大学の科学技術史・哲学研究所に在籍していたときに書き始めたものである。この寛大な支援に感謝したい。この2年間の私の研究が、1型糖尿病の生物学的基礎と有効な治療法を発見した科学者、フレデリック・バンティングの名を冠したプログラムの支援を受けていたのは、歴史的な偶然である。多くの命を救い、深い苦しみを軽減したバンティングの偉大な功績は、私たちが医学に期待することのできる基準を引き上げてくれた。

本書の大半は、ユタ大学、ビクトリア大学、そしてケンブリッジ大学に在籍していたときに書いた。最終的な仕上げは、ダラム大学の高等研究所でのフェローシップ期間中に行った。川沿いの道、中世の石畳の道、森の中の小道など、こののどかな環境は、初期の医療ニヒリストであり西洋医学の象徴的存在であるヒポクラテスが主張した「歩くことは最高の薬」という言葉を試すのに適していた。

用語解説

科学哲学者が書いた医学研究の本は、必然的に医学と哲学の両方の専門用語に依存する。そのような専門用語については、適宜説明するようにしている。

医薬品に言及する場合、私は通常、その学名を使用し、括弧内にその商品名を記す。通常、後者の方がより馴染みがある。多くの医薬品は複数の商品名を持っているが、私は通常、1つの商品名のみを記載する。

P(X)は「Xの確率」、P(X|Y)は「Yが与えられた場合のXの確率」を意味する。例えば、P(rain today) = 0.6は「今日雨が降る確率は0.6」、つまり「今日雨が降る確率は60%」、P(rain today|I’m in Seattle) = 0.8は「私がシアトルにいるとすると今日雨が降る確率は80%」である。

私は以下の略語を使う。

  • ADHD 注意欠陥多動性障害
  • BMJ ブリティッシュ・メディカル・ジャーナル(旧名称、現在は単にBMJと呼ばれている)
  • CDER 医薬品評価研究センター(Center for Drug Evaluation and Research)
  • CML 慢性骨髄性白血病
  • DSM 精神障害の診断と統計マニュアル
  • EBM エビデンスベーストメディシン
  • EMA 欧州医薬品庁(European Medicines Agency)
  • FDA 食品医薬品局
  • HAMD ハミルトンうつ病評価尺度
  • NHLBI 米国国立心臓・肺・血液研究所
  • NICE National Institute for Clinical Excellence
  • NIH 米国国立衛生研究所(National Institutes of Health)
  • NIMH 米国国立精神衛生研究所(National Institute of Mental Health)
  • NNT 治療に必要な数
  • PPAR ペルオキシソーム増殖剤活性化受容体
  • QAT 品質評価ツール
  • RCT ランダム化比較試験
  • RD リスク差
  • RR 相対リスク
  • RRR 相対的リスク低減
  • SEU 単純外挿、ただし
  • SSRI 選択的セロトニン再取り込み阻害剤

第1章 はじめに

1.1 医療ニヒリズム

現代医学は素晴らしい。何千年にもわたる病気の原因や治療法の研究の継承者として、多くの苦しみを軽減することができる。患者は、その製品、治療者、機関に大きな信頼を寄せている。研究、規制、そして主要な商品である医薬品の消費に巨万の富が費やされている。しかし、このような成功や多くの人々の信頼にもかかわらず、私は本書で医療ニヒリズムを擁護する。医療ニヒリズムとは、医療介入の有効性をほとんど信じるべきではないという考え方である。

一見すると、医療ニヒリズムは不合理である。現代医学には、抗生物質のような単純な薬から冠動脈バイパスのような高度な手術に至るまで、驚くべき介入、まさに奇跡がたくさんある。また、ワクチン反対運動などの危険な運動や、ホメオパシーなどのあり得ない代替医療を推進する人たちが、医療ニヒリズムに近い考え方をすることが多い。最後に、もし医療ニヒリズムが本当なら、私たちが日常的に行っている多くのこと(高価な薬を誠実に飲むこと、健康保険制度に加入すること、新薬の研究など)は、むしろおかしなことになってしまうだろう。つまり、医療ニヒリズムは、一見すると、飲み込むには奇妙な薬に思える。しかし、私は、医療ニヒリズムが現代医療を考える上で正しい考え方であると主張する。

線維筋痛症や関節炎のような不思議な痛み、多くの致命的な癌、パーキンソン病のような多くの神経疾患、うつ病や双極性障害のようなほとんどすべての精神疾患、そして風邪のような最も単純でどこにでもある病気でさえも、治療法がない病気について考えてみよう。あるいは、選択的セロトニン再取り込み阻害薬、スタチン、2型糖尿病治療薬など、広く消費されているがほとんど効果がなく、多くの有害作用がある医療介入を思い浮かべてほしい。本書での私の主張は、これらを例にとっているが、私が注目したのは医学研究の方法論である。

臨床科学者が医学的介入を検証するために採用している最良の方法(ランダム化比較試験やメタアナリシスなど、医学における研究方法の最高峰と言われるもの)は、実際には、しばしば言われるほど優れてはいない。そのため、このような手法で得られたエビデンスの多くには懐疑的であるべきである。このようなエビデンスは、医療介入が効果的であることを補強するために用いられることが多いので、このようなエビデンスの信憑性を疑うことは、医療介入が効果的であるという事例を弱めることにつながる。とはいえ、医学における多くのエビデンスは説得力がある。こうしたエビデンスは、非常に優れたランダム化比較試験やシステマティックレビュー(通常、問題となっている医療介入のメーカーから独立した学識経験者によって行われる)から得られ、基礎科学研究によって情報を得ている。そして、こうしたエビデンスが、私たちが最もよく使う医薬品が本質的に効果がないことを示す場合が非常に多い。

そして、高度な訓練を受けた良心的な医師と、十分な知識を持った患者によって保持され、コスト重視の医療システムによって実施されるこのような信頼が、なぜしばしば誤った方向に導かれるのだろうかと思うかもしれない。私が主張する医療ニヒリズムは、この問題に対処するための一助となるものである。医学研究のデザイン、実施、分析、解釈、出版、マーケティングには多くの細かい選択があり、そのような選択は様々な方法でなされる可能性があり、これらの決定は調査中の医学的介入に関する適切な証拠とみなされるものに影響を与える。もう一つの説明は、同じように説得力があり、私が医学研究の方法に焦点を当てたことを補完するもので、効果的と思われる医療介入を販売するための素晴らしい経済的インセンティブに訴えるものである。このようなインセンティブは、方法の可撓性のために証拠をある方向または別の方向に曲げることができる場合、そのような曲げは非常に頻繁に医療介入を支持する方向に、そして真実から遠ざかるようにすることを意味する。ジャーナリストや医師たちは、金銭的なインセンティブが実行された科学に影響を与えることを明らかにし、良い仕事をしてきた。しかし、医学の手法がそのような影響を許すほど柔和であることを示す研究はあまり行われていない。私は、科学哲学者として、この点に注目し、医学研究の方法が可鍛性であり、その可鍛性が医療介入の有効性を誇張する一因となっていることを論じることにする。

医療ニヒリズムとは、単に、ある特定の医療介入に対する信頼性が低いことを主張する厳しい懐疑主義ではない。むしろ、医療ニヒリズムは、より一般的なスタンスである。医療介入はケースバイケースで経験的に評価されるべきものであることは事実であろう。しかし、そのような評価は、失敗した医療介入の頻度、医療研究における誤解や不一致の証拠の程度、多くの医療介入が基づいている大雑把な理論的枠組み、医療における因果関係の仮説を保証するために採用された非常に優れた経験的手法の可撓性を含めて、広く解釈されなければならない。もし私たちが、証拠、不安定な方法、背景となる理論にもっと批判的かつ広範に注意を払い、最善の帰納的枠組みで推論するならば、医療介入の有効性に対する信頼は低くなるはずだ。

私は、科学哲学のツールを使って、各章で焦点を絞ったテーゼを擁護し、それらを総合して、本書の全体的な主張を支持する。第1部の各章は、理論的・概念的な基礎を明確にするものである。第2部の各章では、医学研究の方法の詳細な要点が批判的に検討されている。第3部の各章では、医療ニヒリズムの議論と、それが医療研究と実践にもたらすものを要約している。

本書は、哲学的手法を科学研究に応用し、医療に関するラディカルな立場を擁護するものである。しかし、本書は、科学的なツールや知見を哲学的なトピックに適用することによって、第二の(そして第二の)意味での科学哲学の著作である。例えば、第2章では、健康と病気のハイブリッド理論を擁護している。第7章では、証拠が特定の信念を唯一正当化するとする「認識論的一意性」と呼ばれる考え方を批判している。科学哲学では、科学の多くの局面において、事実と価値観が表裏一体であるという考え方が生まれてきている。本書の論考はこれを支持するものである。第1部では、私が精緻化した疾病理論には経験的要素と規範的要素の両方が必要であり、第2部では、社会的価値が帰納的推論に浸透しうることを示し、第3部では、医療ニヒリズムの観点から研究、診療、規制を再考する際の価値の役割について言及する。本書を通して、私は科学的推論を形式的な哲学的ツールでモデル化することによって得られる洞察を説明する。

より一般的には、本書は文脈に応じた区分けの練習となる。科学哲学者たちは、良い科学と悪い科学、あるいは疑似科学を区別することを長い間試みてきた。哲学者たちの高邁な野望は、一般的で文脈のない方法で、良い科学と悪い科学を区別できる原理を明確にすることであった。しかし、この野望を実現するためには、そのような原理がことごとく反例に直面することになる。ポパーの「偽証主義」の原則は、こうしたアプローチの中で最も有名なものであろう。ポパーによれば、優れた科学とは、正確な予測を行う理論を開発することであり、優れた科学活動とは、そのような予測、ひいてはそれに対応する理論に反論するための厳格な試みである(Popper, 1959 [1935] )。通常の科学はパラダイムに基づいており、パラダイムがない状態での経験的な事実収集は科学ではない、とKuhnは述べている(1962)。最近、Hoyningen-Huene (2013)は、科学の特徴はその体系性であると主張しているが、体系性は科学的な試みにとって必要でも十分でもないと批判している。知的な行き詰まりのように見えることから、多くの哲学者は、一般的で文脈のない区分の原理を開発する試みをあきらめている。しかし、このような行き詰まりから、特定の領域や文脈において信頼性の低い科学を識別することができないということにはならない。このような文脈に基づく区分けは、本書の中心的な野心である。

本書は、科学における技術的な細部に焦点を当てることで、科学哲学の現代的な議論に貢献するものである。しかし、本書の第一の目的は、科学哲学のツールを用いて、医学に関する急進的な立場を擁護することである。ゴッドフリー・スミスの言葉を借りれば、本書は「自然の哲学」の仕事であり、科学を生のままではなく、哲学のレンズを通して評価し、そのメッセージが何だろうかについて最も説得力のある見解を決定するものである(2009)。同様に、チャンの言葉を借りれば、本書は「補完科学」の作品である。科学で当然とされている考え方を批判的に再考し、自然に対する理解を深め、おそらくは私たちの生活を向上させることを目的とする(2004)。この作品は、自然哲学または補完科学の作品であり、その対象は、私たちの最も重要な機関の一つであり、最も資金が投入されている科学の一つであり、私たちの社会の最も脆弱で弱いメンバーが依存している実践である。

医療ニヒリズムを慎重に評価するために、本書の最後に、私は形式的な用語で議論を述べる。ある医療介入が有効であるという仮説に対して、平均して低い事前確率を割り当てるべきであること、その仮説に対する証拠を提示された場合、その証拠の可能性を低く見積もるべきであること、同様に、その証拠に対する事前確率を高く見積もるべきであることを説得的に説明できる。ベイズの定理を適用すると、医療介入の有効性に関する仮説の証拠が提示されたとしても、その仮説に対する信頼度は低いはずだ。つまり、私たちは医療ニヒリストであるべきなのである。マスターの主張は、単に演繹的な定理の形をとっているため、妥当だ。しかし、それは健全なのだろうか。本書の大部分は、概念的、方法論的、経験的、社会的な考察を幅広く用いて、その前提を論証している。

私がベイズ装置を使用するのは、本書の主要な論点を明確にし、各章レベルの論点を統一するためだ。このツールは哲学者がよく使うものだが、私の読者には馴染みのない人もいるかもしれないので、付録1にその簡単な概要を記した。この概要は、このエレガントなツールにまだ触れたことのない学生にも参考になるはずだ。しかし、本書は形式哲学の著作とは程遠いものである。私は形式化を必要に応じてのみ使用し、形式的な作業の大半を付録として配置している。さらに、確率の基本的な性質や統計の基礎に関する議論については、ほとんど立場を取らないようにしている。ただし、マスターの議論では、仮説の事後的な妥当性を評価する際に、仮説の事前確率をできる限り考慮すべきであると仮定している(一部の熱心な頻度論者もこれを認めている)。医学的ニヒリズムに対する私の主張は、統計学や科学的推論に関する特定の学派に忠実であろうとなかろうと、説得力を持つものである。ベイズ主義はよく知られた問題に悩まされているが、ここでは、そうでなければばらばらで複雑な議論を統一して明確にするためにのみ使用する。本書は、科学的実践の方法と結果を、そのような活動が行われる社会的結びつきに注意を払いながら批判的に検討するという点で、フェミニスト科学哲学とより共通するところがある1。

私の立場は、エビデンスに基づく医療に対するアンチテーゼとして、あるいは他の批判的な医療観を支持するものと解釈されるべきではない。それどころか、その逆である。私たちが信頼すべき医療介入は、厳密な科学によって正当化されたものであり、それのみである。しかし、この厳密な科学への訴えを正確に判断することが難しいため、医療ニヒリズムは科学哲学の対象になっている。医療ニヒリズムに似た考え方は、反精神医学運動、特定の医療行為に反対する宗教、ホリスティック医療や代替医療運動など、医療に対する批判的な視点に共通するものである。私は、これらの意見に賛同するつもりはない。医療に批判的な立場を取ることは、医療に批判的な他の立場とのアライメントを意味するものではない。実際、私の主張のほとんどは、医療そのものよりも、これらの運動の多くに強く当てはまるものである。

さらに、私がここで提起する批判的な議論のいくつかは、反省的な疫学者や医師によってなされてきたものである。医学ニヒリズムを支持する医師、疫学者、科学ジャーナリストによって書かれた著作は膨大である2。これらの思想家は気難しい部外者ではなく、むしろ世界で最も著名で尊敬される医師や疫学者の一人なのである。例えば、ある一流医学雑誌の元編集者は、「近年、本当に重要な薬はほんの一握りしか市場に出ていない」と主張し、大半は「有益かどうか疑わしい薬」であると述べている(Angell, 2004b)。また、疫学者であるジョン・ヨアニディスの立場を考えてみると、彼の重要な論文のタイトルが示唆している: 「発表された研究結果のほとんどが偽りである理由」(Why Most Published Research Findings Are False)(2005b)という重要な論文のタイトルが示唆している。別の著名な医学雑誌の現編集者は最近、現代の医学について次のように語っている: 「小さなサンプルサイズ、小さな効果、無効な探索的分析、明白な利益相反のある研究に悩まされ、重要性の乏しい流行の追求に執着し、科学は暗闇へと向かっている」(Horton、2015)。薬理学の一流の教科書でさえ、「現在の医薬品の不十分さ」を論じている(Dutta, 2009)。本書では、これらが医学的ニヒリズムの根拠ある記述であることを示す。

いくつかの反論が予想される。確かに私の見解は、医学全体への不信を正当化するものではないだろう。重大な事故が起きたとき、集中治療室よりマシな場所はないだろう。頭痛にはアスピリン、多くの感染症には抗生物質、一部の糖尿病患者にはインスリンなど、本当に驚くべき医療介入は一握りで、その多くは70年から90年前に発見されたものである。しかし、医療消費量(患者数、医療費、処方箋の数)を測定すると、最も一般的な治療法、特にここ数十年で導入された治療法は、医療ニヒリズムの根拠として説得力がある。最終章では、最も顕著な反論に対して、医療ニヒリズムを明確に説明する。

おそらく最も激しい反論は、医療ニヒリズムは一般的かつ経験的なテーゼだが、私はこのテーゼに有利と思われる一握りの例を選んだだけであり、それらの場合でさえ、経験的証拠は医療ニヒリズムをストレートに支持するものではなく、過剰な悲観的観点からのみ支持される。もし私が、この後の章の例に基づいて帰納的な議論を提供するとしたら、実に弱い議論を提供することになるであろうことは同意する。特定の医療介入や介入のクラスについてこのような帰納的な議論を行うには、非常に経験的な詳細が必要であり、おそらくジャーナリストのような説明のコツが必要だろう。しかし、そのようなことは私の議論ではない。私は、抗精神病薬、抗うつ薬、スタチン、血圧降下剤、糖尿病治療薬など、さまざまな医療介入について他者から提供された詳細な議論から学ぼうとしてきた。これらの結論は、私が説明のために採用した限定的な例よりもはるかに広範に適用されるものである。もちろん、私が慎重に例を選んだことを否定するつもりはない。最も広く処方されている医療行為に焦点を当てることで、医療ニヒリズムが、今日最も使用されている医療行為に関する説得力のある見解であることを示したいと思う。

ニヒリズムにはいくつかの意味合いがある。その第一は実存的なもので、ある特定の種類の価値、抽象的な善、あるいは人生における意味の形式が存在することを否定するものである。実存的ニヒリズムは形而上学的なテーゼであることもあり、疑惑の存在や宇宙の他の側面は実際には存在しないとする(これは問題の存在に関する「反立体主義」と呼ばれることもあり、もちろん「無神論」のような特定の存在に関する形而上学的ニヒリズムのための特定の用語もある)。実存的ニヒリズムは認識論的なテーゼであり、宇宙のある側面についての知識は不可能であるとする(これは「懐疑論」と呼ばれることもある)。実存的ニヒリズムは、宇宙のある側面について広く信じられている信念が、利用可能な証拠に基づいて正当化されないとする、正当化論的なテーゼであることもある。ニヒリズムのもう一つの主な意味合いは感情的なもので、実存的な否定に関連する絶望感である。私がこの言葉を使うことで、本書のさまざまな部分で、さまざまな意味合いが引き出されるはずだ。「ニヒリズム」という言葉を医学に適用することには、歴史的な先例がある。「ニヒリズム」という用語は19世紀に初めて哲学に導入され、数十年のうちに「治療的ニヒリズム」という用語が、当時の薬物を「海の底に沈めるべき」(1860)としたホームズのような著名な医師の見解を表すのに使われるようになった。この歴史的な先例については、§1.3で述べる。

ニヒリズムは、19世紀の西洋思想において、より一般的に著名な見解となった。19世紀末のフリードリヒ・ニーチェの主要な哲学的プロジェクトは、このようなニヒリズムを診断し、最終的に治療することだった(Reginster 2006)。上記のように、ニヒリズムとは、特定の重要な思想や物や価値が客観的な地位を欠き、実現できないとする見解である。これは根本的に、医療介入に関してここで主張されているテーゼである。医学の最高の価値は、病気の症状を取り除くことであり、理想的には病気そのものを取り除き、それによって健康を達成することであると言える。医療ニヒリズムは、この価値が実現できないことが非常に多く、医療介入に対する信頼は一般的に客観的な地位を欠いていると考える。ニーチェが提案したニヒリズム克服の戦略は、実現できない価値を再評価することであった。本書の最終章では、医学の研究と治療について、そのような試みを試みている。

医学は広大な領域であり、多くの目的と、その目的を達成するための様々な手段がある。私は「医療ニヒリズム」という言葉を、19世紀の治療ニヒリズムと同調させるために使っている-本書で擁護する論文は、治療介入に関するものが中心である。しかし、この論文はさらに具体的で、最近の世代で最も広く使われている治療的介入の種類、すなわち医薬品に焦点を合わせている。ほとんどの場合、私は外科的介入や診断機器など、医学で使用されるその他の種類のツールについては論じない(時折、そうした例を引き合いに出すことはあるが)。医学史家のロイ・ポーターは、「医学の卓越性は、病人を快方に向かわせる能力においてのみ、僅かながら存在する。これは昔からそうであったし、今日でもそうである」(1999)。つまり、医学は治癒能力以外の理由で重要な社会制度であった(そして現在もそうである)。しかし、医学の中心的な目的は、病気を治すこと、あるいは少なくとも病人のケアを提供することであり、この目的を達成するために用いられる介入策の最も顕著なクラスは、今日、医薬品である。これが「医療ニヒリズム」の主題である。とはいえ、医療ニヒリズムの主張の一部、特に第2部の主張は、医学研究の手法に焦点を当てたものであり、これらの章の考察は、医薬品に関する懸念だけでなく、医学一般に適用される。

本書は、3種類の読者にとって価値あるものである。本書は主に科学哲学の著作であるため、プロの哲学者や哲学を学ぶ学生に関連するものである。全体的なテーゼは、もちろん医学研究と実践に関わる見解であるため、医学者、医師、資金提供機関、医学生、政策機関が私のテーゼを説得力のあるものと考えてくれることを期待している。最後に、私たちの社会は医療を貪欲に消費するようになったので、医療ニヒリズムというテーゼは、この食欲に貢献するすべての人に関係するはずだ。本書は、哲学者、医師、そして患者を対象としている。

このような対象読者のリスクは、本書が哲学的な中身を薄くしすぎる一方で、非専門家にとっては厚すぎることである。しかし、医師や疫学者の多くは、自分の専門分野の基礎的な問題に関心を持っており、本書がその関心を呼び起こし、それによって医学研究が直面している課題に対する批判的な研究を動機付けることを期待している。患者は、効き目があり、害の少ない医療介入を行うことに深い関心を寄せている。医療情報が広く行き渡った今日、患者は以前にも増して情報を得ることができるようになった。本書は、そうした情報を活用するための重要な基礎となるものである。また、私の関心は医学研究の詳細にあるが、本書は何よりも科学哲学の著作である。つまり、本書は、哲学の専門家の内外を問わず、多くの人にアピールするものである。

本書の意義は、明白であろうと思う。中心的な章では、医学研究の方法の欠点を明確にし、最後の章では、臨床、医学研究、政策に対する実際的な意味を強調する。

1.2 私たちの現在の自信

医療ニヒリズムは、医療介入にほとんど自信を持つべきでないとしているので、医療介入に対する私たちの自信が実際に高いことを示すのに役立つだろう。医療介入の有効性に対する私たちの一般的な信頼は、さまざまな方法で測ることができる。現在、最も頻繁に処方され、最も売れている医薬品のクラスは、コレステロールを下げるスタチン、血圧を下げる様々な種類の薬、2型糖尿病患者の血糖値をコントロールする薬、そしてうつ病の選択的セロトニン再取り込み阻害薬である(こうしたリストはインターネットで簡単に入手できる)。これらの薬物は、年間数千万回処方されている。

HorwitzとWakefield(2007)は、米国では、ある月に女性の10%、男性の4%が抗うつ薬を使用していると指摘している。うつ病の治療を受けている人は、1987年に比べて1997年には4.5倍も精神医薬の介入を受けており、1990年代には米国で抗うつ剤への支出が600%増加した。最も広く使われているクラスの医薬品に費やされた金額は、最近の5年間で2倍になった(Moynihan & Cassels, 2005)。1990年から2000年にかけて、オーストラリアの若者の抗うつ剤の使用量は10倍になり、カナダ人のコレステロール低下剤の使用量は300%増加した。コレステロールを下げる薬は、年間250億ドル以上の収益を上げている。このような現象により、製薬業界はあらゆる産業の中で毎年最も収益性の高い産業となっている。

このように医薬品が急速に普及した背景には、医薬品の効果に対する一般的な信頼があり、その信頼はますます高まっているように思われる。シャノン・ブラウンリーは、現代医学が「最先端の技術や治療法にアクセスできる人なら、ほとんどどんな病気でも治せる」ことに同意するかどうかを尋ねた調査について述べている(2008)。このような奔放な楽観論は、回答者の3分の1以上によって表明された。これは、現代医学の治療法がいかに少ないかを考えると、特に顕著である。医学の最も素晴らしい成果のひとつである1型糖尿病の治療薬としてのインスリン(本書の中で私が取り上げた例)でさえ、この恐ろしい病気の治療法ではない。医学の世界では治療法はほとんど存在さない。しかし、多くの人々が、利用可能な治療法でほとんどすべての病気を治すことができると考えている。

このような自信は、医療介入が新規のものである場合に特に顕著である。患者や処方する医師は、新しい薬を好む。英国で最も売れている10種類の薬のうち、8種類は過去10年間に発売されたものであり、英国で最も売れている50種類の薬のうち、20年以上前から発売されていたものは2種類だけであった。新薬は長い間、臨床でテストされていないため、時間の試練に耐えることができない。しかし、私たちが最もお金をかけているのは、これらの薬なのである。これは、新薬が特許で保護されているため、メーカーが競争なく好きなだけ薬代を請求できるという事実にも起因している(この点については第12章で説明する)。しかし、処方箋の数の多さにも表れているように、私たちの新薬に対する熱意は高いのである。

医学的介入に対する信頼の高まりは、製薬会社の巧妙で粘り強いマーケティング戦術によって説明されることもある。1976年、メルク社の退任する最高経営責任者は、健康な人のための薬を作ることで、「すべての人に売る」ことを目指すと表明した(Moynihan & Cassels, 2005に引用)。何万人もの製薬会社の代表者が、雇用主が製造する医療介入に対する医師の信頼を高めるために、定期的に医師と関わっている。今日の医学研究の大部分は民間企業によって資金提供されており、これらの産業界の研究スポンサーは、エビデンスがどのように生成され、解釈され、公表されるかをコントロールしている。標準的な手順は、医療介入の有効性に対する信頼を高めるために最も適した方法で研究結果を利用することである。

医療介入に対する信頼が明らかに高いことのもう一つの可能性は、ほとんどの人が実験計画の基本的な側面を理解しておらず、したがって医療研究の欠点も理解していないことである。全米科学財団は、米国住民を対象に、科学的概念の理解度について調査している。その調査項目のひとつに、科学に関する簡単だが基本的な質問がある。この質問には2つのパートがある:

(1) 2人の科学者が、ある薬が高血圧に効くかどうかを知りたいと考えている。1人目の科学者は、高血圧の人1,000人にその薬を飲ませ、そのうちの何人が血圧が下がるかを確かめたいと考えている。2人目の科学者は、500人の高血圧の人に薬を与え、別の500人の高血圧の人には薬を与えず、両方のグループの何人が血圧の値を下げるかを見たいと考えている。この薬を試すには、どちらがより良い方法だろうか?(2)なぜ、この方法で薬を試すのが良いのだろうか?

悲しいことに、2012年には、この2つのパートに正しく回答した人は3分の1しかいなかった(NSF, 2014)。(第10章では、この問題で問われた特徴も含め、医学研究における実験デザインの主な特徴の根拠について述べている)。ある実験がもっともらしく(ある実験はありえない)なる理由についての理解を欠くと、人々は医学研究の信頼性を正当化するよりも高く評価してしまう可能性がある。本書が、医学の研究手法に関するリテラシーを高める一助となれば幸いである。

要するに、私たち(患者、医師、政策立案者)は、多くの尺度で、医療介入の有効性に高い信頼を寄せている。しかし、これは常にそうだったわけではない。医療ニヒリズムは、つい最近まで、広く受け入れられてきた考え方であった。

1.3 医療ニヒリズムの簡潔な歴史

医療ニヒリズムは古くからある考え方で、数千年にわたり西洋文化の中心的存在によって表現されていた。芸術家、劇作家、エッセイストは特に医療に批判的であったが、医師は最も率直な医療ニヒリストの一人であった。以下では、医療ニヒリズムの著名な宣言を歴史的に簡単に概観してみたい。それは、多くの病気の治療不可能性、多くの医療介入の非効果性、そして医療における金銭の腐敗的影響である。この後の章では、何世紀も前の医療ニヒリズムの主張が、現代的な装いで再び登場する。

古代の哲学者ヘラクレイトスは、医者は病人を拷問し、「治すと主張する病気と同じくらい悪い」と主張した4。聖書には、「多くの医者から多くのことを受け、持てるものをすべて使ったが、何もよくならず、むしろ悪くなった」(マルコ5:25-7)女性の記述がある。バージルの『アエネーイス』(紀元前25年頃)には、aegrescitque medendoというセリフがあり、「薬が病気を増やす」、「治療によって病気が悪化する」という考えを表すのに使われてきた。西洋医学の象徴的存在であるヒポクラテスは、当時の医学の多くがいかに効果がないかを認識しており、「何もしないことも良い治療法である」という言葉を残している。

医学的ニヒリズムの宣言は、近世ヨーロッパではどこにでもあった。シェイクスピアの戯曲には、医師とその「フィジック」(薬)に対する注射がたくさん登場する。例えば、マクベスが医者に「病んだ心、悩める脳、悲しみで重くなった心を治すことができるか」と尋ねると、医者は「患者は自分自身を治さなければならない」と主張する(1606年頃)。マクベスは、「薬など犬にくれてやれ、私は何もしない」と言い返す。シェイクスピアの医療ニヒリズムは、『アテネのティモン』(1605年頃)ではより大胆なものとなっている: 「医者を信じるな、その解毒剤は毒であり、彼は人を殺す」医者は「苦い薬」を与えるものだが(『ヴェローナの二紳士』1590年頃)、「死は医者をも捕らえる」(『シンベリン』1611)のである。

シェイクスピアの同時代人たちもこれに同意した。劇作家のボーモントとフレッチャーは、「医学は病気よりも悪い」(『愛の妙薬』1612)と書いている。トーマス・デッカーは『正直な娼婦』(1605年頃)の中で、「医者にかかるより決闘する方が安全だ」と述べている。ベン・ジョンソンは『ヴォルポネ』(1606)の中で、医者は治療する病気よりも危険だと書いている。医者は「人を殺す前に皮を剥ぐ」のだ。また、17世紀のイギリスの作家マシュー・プライアーは、「cured yesterday of my disease, I died last night of my physician ”という辛辣なセリフを書いた。このような医療ニヒリズムは劇作家だけでなく、例えば、フランシス・ベーコンがこう言っている: 「医学は、(私たちが言ったように)労働よりも公言され、進歩よりも労働された科学である:労働は、私の判断では、むしろ進歩よりも円環にあった。私の判断では、その労苦は、むしろ進歩よりも円環の中にあったのである」(1605)。

それから約1世紀後、作家たちは医学にこれほど感銘を受けることはなかった。17世紀末のジョン・ドライデン(チェスタートンのジョン・ドライデンへの手紙より)は、病気を人為的に軽減することは原理的に不可能であるとする疾病理論に基づく医療ニヒリズムを表現している(2世紀後には、医師のジェイコブ・ビゲローが「自己限定」疾病理論で同じ考えを表明している):

野原で狩りをした方が、買わずに済む健康が手に入る、

吐き気をもよおすために医者にかかるより。

運動で治す賢者は、運動に依存する

神は決して人間のために作品を作らなかった。

このような医療ニヒリズムの原則に加え、ドライデンは医療行為にも深い疑念を抱いていた。以下はその一節である(『To John Dryden, Esq』より):

医者が殺すことを学ぶ以前は、私たちの先祖はそうして生きていた、

そして、その週ごとの請求書を掛け合わせた。

つまり、治療の原理的な無駄(「神は決して人間のために作品を修復するようには作らなかった」)、薬の効果のなさ(「医者が殺すことを学んだ」「吐き気のする草案」)、そして堕落させる金銭的動機(「週刊誌の請求書」)である。

近世の医学に対する疑念は、イギリス人に限ったことではない。デカルトは、「現在行われている医学は、ほとんど役に立たない」(1637)と主張したが、もし医学が近代的な科学的原理に基づいて行われるようになれば、もっと役に立つようになるだろうとデカルトは期待した。モンテーニュは、いくつかのエッセイで医学的ニヒリズムを表明している。ヴォルテールもまた、医学についてあまり良いことは言っておらず、後に病気の自己限定説と呼ばれるようになる見解を示している: 「医学の技術は、自然が病気を治す間に患者を楽しませることにある」デイヴィッド・ウートンの著書(2006)には、「ヒポクラテス以来、害をなす医師たち」という副題がついている。1833年に印刷された画家オノレ・ドーミエのリトグラフには、棺桶の中で死んだ患者を見ながら、「なぜ私の患者は皆このように死んでいくのだろう・・・」と思い悩む医師が登場する。「 私は患者を出血させ、浄化し、薬漬けにすることで最善を尽くしているのだが. 私には理解できない!」モリエールの戯曲のいくつかは医療に対する風刺であり、医療行為に言及することは、モリエールにとって皮肉や暗いユーモアの機会である。

1860年、ハーバード大学医学部の学部長であったオリバー・ウェンデル・ホームズ(シニア)は、マサチューセッツ医学会での講演で、「現在使われている医学書全体を海の底に沈めることができれば、人類にとってはすべてが良くなり、魚にとってはすべてが悪くなるだろう」と述べている5。その数十年前、同じく著名な医師でハーバード大学教授のジェイコブ・ビグローは、ほとんどの病気は「自己限定性」であり、ほとんどの病気の経過はその性質によって決まり、この経過は医学的介入によって影響を受けることはないと主張した(1835)。ホームズもビグローも、医学的ニヒリズムから緩和を排除していた。ホームズはアヘンが海の底に沈むことを望まず(「創造主自身が処方しているようだ」)、ビゲローは苦しみを和らげるために医療介入は必要ないと指摘した: 「枕をひっくり返したり、季節に応じた水を患者に与えたりすることで、その苦しみを和らげることができる」のである。これは、第12章で私が「優しい医療」と呼んでいるものを示している。

19世紀の医学的ニヒリズムは、医学界以外の学者によっても表明された。ニーチェは、短い生涯で多くの病気に悩まされたが、「大衆医学と大衆道徳は共に属するものであり、現在もそうであるように、異なる評価をされるべきでない」。トルストイは、このような懐疑的な考えをより端的に表現している: 「医者たちは彼を治療し、血を抜き、薬を飲ませたが、それでも彼は回復した」(『戦争と平和』1869)。

1920年代から1950年代にかけての抗生物質やインスリンの大成功に伴う医学の進歩に対する自信の後、1960年代から1970年代にかけては、医療ニヒリズムが復活した。実際、医療ニヒリズムは1970年代に隆盛を極め、技術開発、制度的権威、資本主義に反対する、より一般的な感情とも一致した。例えば、イリッヒ(1975)は医療ニヒリズムのようなテーゼを主張し、医学や学問の内外で大きな影響力を持った。イリッヒは、「現代医療は健康の否定である。 現代医療は健康の否定であり、治すよりも病気にする人の方が多い」と主張した。同様に、マキューン(1976b)は、寿命の伸びとそれに伴う人口の増加は、ワクチン接種、検疫、薬剤などの公衆衛生技術によるものではなく、社会経済的平等の向上による栄養の増加によるものだと、歴史的記録をもとに主張した。

ミシェル・フーコーは、イリッヒの議論について、イリッヒが引用した医療介入の無効性や有害性を示すとされる経験的証拠の多くは、医療介入の有効性そのものに問題があるというよりも、医師の無知による誤り(誤診など)、他の種類の人的誤り(過剰投与など)、制度的問題(過剰治療をもたらす行政要因など)により説明できると述べている(2004 [1974] )。前者の問題をフーコーは単に「異所性」と呼び、後者の問題をフーコーはより興味深いものとして「積極的異所性」と呼んだ: 「診断の誤りや物質の誤飲によるものではなく、物質そのものの作用による薬物の有害な作用」である。基本的な異所性(iatrogenicity)と積極的な異所性(positive iatrogenicity)を区別することは重要である。現代の医療ニヒリズムは(上記で明確にした医療ニヒリズムの歴史的バージョンの一部とは異なり)、医療介入とその介入を研究するために採用した研究方法についての論文であり、医師の能力に関するものではない。

例えば17世紀において、医学には病人を元気にする能力がほとんどなかったと主張するのは、一つのことである。しかし、現在もそうであると主張するのは、まったく別の話である。このような過去の医療ニヒリズムの表現に対して予想されるのは、このような歴史的文脈では懐疑的な見解が正当化されたが、かつて医療ニヒリズムを動機付けた問題は現在では解決されているというものである。この10年間で、医学的ニヒリズムの側面が数多く表明され、その多くが著名な医師や疫学者から発信されていることは、先に述べたとおりである。このような最近の医療ニヒリズムの主張に対して、「今日こそは」という回答の1つは、医療介入を検証するために科学的方法が適切に適用され、より効果的な医療介入が数多く存在し、これらの医療介入は政府の熱心な規制によって安全性と効果が保証されていると主張することであろう。エビデンスに基づく医療運動の高まりと、生物医学に費やされる素晴らしい資源-この反応は続いている-により、医療ニヒリズムは、医療の歴史に関するテーゼとしてのみ通用するものとなっている。本書の中心的な論点は、このような対応がなぜ説得力を持たないかを示すものである。1.5節では、これらの論点を簡単に概観する。しかし、その前に、現代のエビデンスに基づく医学の基本的な輪郭を理解するのに役立つだろう。

1.4 エビデンスに基づく医学

ランダム化比較試験(RCT)は、20世紀後半に医療介入の有効性を検証するための重要な手法となり、しばしば医学研究のゴールドスタンダードと言われるようになった。最初のRCTは20世紀初頭に心霊現象に関する仮説を検証するために行われたが(Hacking, 1988)、すぐに医学的な文脈に適用され、現在ではエビデンスに基づく医療と呼ばれるようになったものの絶対的な中心であるとされている。

無作為化試験の基本的なデザインは単純で、研究のために集められた被験者のうち、ある者は実験的治療を受けるように割り当てられ、他の者はプラセボまたは競合する治療を受けるように割り当てられる。RCTの重要な特徴は、この被験者の割り付けが無作為化されていることで、特定の被験者のグループへの割り付けがランダムに決定される。無作為に被験者を割り当てることで、2群間の被験者が、試験で測定される結果に影響を与える可能性のある特性に関して、平均的に類似していることを保証することを意味する。興味のあるパラメータの測定は、通常、介入を行う前、試験中、そして試験後に再度行われる。そして、各群のこれらのパラメータの平均値を比較し、パラメータの値が群間で異なる場合、介入はそのパラメータの値を変化させる因果的能力を持つという推論がなされるかもしれない。本書のいくつかの章、特に第2部の章は、RCTの細かい詳細について述べている。試験のデザイン、実施、分析、解釈、発表には多くの選択肢が必要であり、医学研究者はその方法の詳細を実施する際に大きな自由度を有している。

無作為化試験は、規制において重要な役割を担っている。米国食品医薬品局(FDA)が新薬を承認するためには、通常、その薬がプラセボよりも優れていることを示唆する2つのRCTが必要である。この基準の問題点の一つは、FDAが、この2つの陽性試験以外に、薬についてどれだけの試験が行われたかを考慮していないことである(第8章と第12章では、こうした薬事承認に関する規制基準を批判的に検討する)。多くの場合、肯定的な研究は発表され、否定的な研究は発表されないため、薬の有効性に関する公的記録は体系的に歪んだものとなってしまう。この現象は出版バイアスと呼ばれ、出版バイアスの偏在はいくつかの章での私の議論を支えている。

現代のエビデンスに基づく医療(EBM)は、医療介入の有効性を検証するための無作為化試験の重要性を強調している。実際、医学者はしばしば、無作為化試験が医療介入を検証するための最良の方法であり、非無作為化試験デザインは信頼すべきではないと考えている。EBMの原則を明確にした研究者は、「エビデンスヒエラルキー」を開発した。これは、系統的エラーからの解放を前提とした手法のランク付けである。ランダム化試験は通常、これらのエビデンスヒエラルキーの最上位または最上位に近い位置にある。このことは、近年、特に科学哲学者から多くの批判を招いている。第5章などでは、エビデンス・ヒエラルキーに対する批判の一部を明らかにし、第2部の残りの部分では、医学研究の方法に関する他の問題点を明らかにし、これまであまり批判的な関心を持たれてこなかった。

ここ数十年、医療介入の有効性を検証するための一般的な方法として、メタアナリシスが台頭してきた。メタアナリシスとは、複数の無作為化試験や他の種類の研究の結果を定量的に要約したものである。現在では、メタアナリシスはその性質上、個々の試験よりも優れた方法であり、実際に医療介入を検証するための究極の基準であるとする意見が多い。このため、EBMではメタアナリシスをエビデンスヒエラルキーの最上位に位置づけることが多い。第6章では、メタアナリシスは多くの人が言うほど優れた方法ではなく、個別臨床試験と同様にメタアナリシスも変化しやすいものであることを論じる。

EBMのエビデンスの原則には同意できない部分もあるが、第2部で述べた私の主張の趣旨は、EBMの中心的な動機、すなわち、医療介入の有効性を評価する際に問われるべきエビデンスの基準を高めることに合致している。初期のEBM運動がそうであったように、医療介入に高い認識基準を課す結果、有効とみなされる医療介入は少なくなる。医学研究の方法を詳しく調べると、医学的虚無主義という一般的なテーゼを支持することができる。

1.5 主要な議論

1.5.1 魔法の弾丸で病気を狙い撃ちする

効果的であるためには、医療介入は病気を対象とすることで人の健康を改善しなければならない。これらの概念-健康、病気、効果-は議論の的となる。第Ⅰ部では、病気とは何か、医療介入が有効であるとみなされるためには何が必要かを説明することで、本書の残りの部分の基礎を築いた。第2章では、自然主義、規範主義、ハイブリッド主義、排除主義といった代表的な疾病の説明のうち、ハイブリッド主義を擁護し、第3章では、この疾病の説明をさらに発展させて、医療化、過剰診断といった疾病帰属に関する現代の問題に適用する。ある状態が病気であるためには、その状態は構成的な因果的根拠を持ち、かつ害をもたらすものでなければならないとするのが、病気のハイブリッドな説明である。ハイブリッド主義の2つの要件は、医療介入が効果的であるとみなされるためには、疾患の構成的因果関係の基礎または疾患によって引き起こされる害のいずれか(または理想的には両方)を対象としなければならないことを意味する。これは、医療の2つの主要な目的であるケアとキュアに対する理論的裏付けとなる。もしある介入が、疾患の構成的な原因基盤または疾患によって引き起こされる害のいずれかを調整しないのであれば、それは効果的とは言えない。この基準に満たない医療介入はいくつかあり、その中には、間違いなく本物の病気ではない状態(「女性の性機能障害」とされるほとんどの事例や、批判者が不適切に医療化されていると主張するその他の状態など)に対する介入、病気の前の状態に対する多くの介入、絶対効果量が小さいいくつかの介入(抗うつ薬など)などがある。

第2章は、この章の中で最も純粋に哲学的な章である。本書が進むにつれて、私の焦点は研究方法論に移り、終盤ではより経験的なものとなっている。哲学的な分析を好む読者もいれば、確固たる証拠を求めて焦る読者もいるだろうと予想される。本書はその両方を兼ね備えているが、部分的に強調するところが異なる。

前世紀に医療介入が掲げてきた理想は、「魔法の弾丸」のモデルに基づいている。効果的な医療介入-ペニシリンやインスリンなど-は、この比喩によってよく特徴づけられている。医療介入の魔法の弾丸モデルは、特異性と有効性という2つの原則を表している。魔法の弾丸モデルは、20世紀半ばに抗生物質とインスリンの導入とともに広まった。第4章では、薬力学の科学に基づき、多くの疾患の生理学的基盤の複雑さと、外因性の介入が私たちの生理学とどのように相互作用するかの連鎖的な複雑さを理解すれば、有効性への期待は緩和されるはずで、同時に、多くの「副作用」(私は、介入による意図しない有害作用に言及する「害のプロファイル」という言葉を好むので、このオーウェル的用語を引用した-これは第9章で議論する)が予想されると主張する。薬物が1つまたは少数の微小生理学的標的に介入し、それによって臨床的に重要で症状特異的な効果をもたらすことができるという期待は、私たちの医療介入の多くにとって、根拠のないものである。多くの医療介入の有効性が低いのは、これらの医療介入とその対象疾患が魔法の弾丸モデルの原則を満たしていないためであることが理解できる。本書の全体的なテーゼは、私たちは魔法の弾丸モデルをあまり重視せず、健康を改善するための他の種類の介入を開発すべきであると示唆している。

1.5.2 現代の研究手法の可鍛性

第2部の各章では、医療介入を検証するために使用される手法のきめ細かな分析が行われている。一言で言えば、これらの章では、そのような方法は可鍛性であることを示す。ランダム化試験やメタアナリシスの利点が言われているにもかかわらず、その設計、評価、解釈、公表には多くの細かい決定があることを示す。その結果、これらの方法は様々な方法で曲げることができ、そのような曲げ方は通常、医療介入の有効性を過大評価し、その害を過小評価する方向であることがわかる。

第6章では、同じエビデンスの異なるメタアナリシスが矛盾した結論に達することがあることを示す。メタアナリシスは、医療介入の有効性を評価するための客観的根拠を提供できない。なぜなら、メタアナリシスを行う際には、主観的な特殊性がその結果に影響を及ぼす可能性を広く許容する、数多くの決定がなされなければならないからだ。

例えば、医学者は医学研究、特に無作為化試験から得られる証拠の質を測定するために「質評価ツール」を採用している。これらのツールは、無作為化、被験者割り付けの隠蔽(「盲検化」と呼ばれることもある)など、医学研究のさまざまな方法論の詳細を考慮するように設計されており、バイアスを最小限に抑えるために関連する研究の他の特徴も考慮されている。このようなツールは、現在では数十種類もある。第7章では、品質評価ツールは互いに大きく異なり、二次的な経験則から、評価者間信頼性やツール間信頼性が低いことを示した。これは、私が「証拠能力の過小評価」と呼んでいる、より一般的な問題の一例だ。ある証拠の強さに関する意見の相違は、細かい方法論的特徴に対する異なる、しかし原理的には同じように良い重み付けに起因することがある。医学研究の可鍛性は奥が深い。

すなわち、優れた測定器の選択、適切な分析手段の使用、実験的な設定からより一般的でコントロールされていない設定に測定値を外挿する信頼できる方法の使用である。私は第8章で、実際にはこれらの課題のそれぞれが、医療介入の有効性を過大評価する一因となっていることを論じる。これらの課題は、修正原則を示唆している。臨床研究で使用される測定器は、患者に関連した疾患特異的なパラメータを測定すべきである。有効性は常に「絶対的」用語(「リスク差」などの指標を使用)で測定・報告されるべきであり、「相対的」用語(「相対的リスク減少」など)の指標を解釈する際には注意が必要である。私は、相対的な尺度の採用が、効果を誇張して主張することにつながる「基礎率の誤謬」を促進することを示す。これは、相対的尺度が広く報告されているため、深刻な問題である。最後に、研究の場から臨床の場への外挿は、対象集団において介入策が実験集団と同様に有効でない可能性があることをより厳密に考慮する必要がある。残念ながらこれらの原則はしばしば満たされず、その結果、医療介入の有効性が系統的に過大評価されることになる。

1.5.3 害、偏見、詐欺

医療介入の利益が系統的に過大評価されているのとは対照的に、第9章では、医療介入の害が系統的に過小評価されていることを論じる。この過小評価には、概念的、方法論的、社会的な数多くの要因が寄与している。私は、これらの要因を説明することで、このような過小評価の深さを明らかにする。研究において害が定義され、測定される方法は、害の過小評価に寄与している。薬物の有害性プロファイルを評価する基本は、「第1相試験」と呼ばれる、実験薬を初めてヒトに投与することから始まる。残念ながら、第1相試験の大半の結果は未発表のままである。無作為化試験は、エビデンスヒエラルキーの最上位に位置するにもかかわらず、有害性を過小評価するもう一つの重要な要因となっている。臨床試験の「検出力」とは、実験群と対照群の間にある一定の効果量の差を検出する試験の能力である。通常、検出力は医療介入の有益性を検出するのに適切であると考えられている。しかし、有益性を検出する試験の能力と有害性を検出する試験の能力を区別することは重要である。私は、後者を犠牲にすることで前者を最大化する傾向がある試験のいくつかの側面があることを示す。さらに、医学研究のあらゆる段階において、有害性の追求は秘密に包まれており、それが医療介入の有害性プロファイルを過小評価する一因になっている。

第10章では、医学研究に蔓延する多くのバイアスを概観する。これらのバイアスの中には、医学研究と規制の中に存在する素晴らしい金銭的インセンティブと利益相反によって悪化しているものもある。不正行為は、こうした誘因の極端な結果である。今日、医学研究における最も悪質な偏見である出版バイアスは、出版された研究記録を組織的に歪曲することによって、意図的に介入の有効性を誇張している可能性が非常に高いため、詐欺として適切に特徴づけられる。このようなケースはどこにでもある。偏見と不正の蔓延は、医療ニヒリズムの主な議論の前提の一つを支持するものであると私は主張する。バイアスの蔓延と、ある介入が一見効果的であることを示すための素晴らしい金銭的インセンティブが現在存在することを考えると、柔軟な研究方法の曲解は、ほとんど常に医療介入の効果を過大評価し、害を過小評価することに有利である。

上記の章での私の主張は、医学研究において最も広く採用されている方法の精査を伴うものである。この調査の結論は、多くの医学研究の結果に対する顕著な懐疑心である。しかし、これは医学における経験的知見をすべて否定することを意味するものではない。医学研究において、形だけの研究でも良いものと悪いものがある。良いものは、産業界から独立した学者によって行われ、産業界以外の資金源(例えば政府機関)から資金を受け、より良い方法論を採用している傾向がある。前述のように、今日の医学研究における顕著な問題の1つは出版バイアスであり、最高のメタアナリシスとは、すべての未発表データにアクセスすることによってこれを克服することができるものである。本書を通じて、私は経験的な知見に基づき、より信頼性の高い研究からのエビデンスに焦点を当てている。さらに、私は経験的研究の経験的研究である二次研究と呼ばれるものを利用している。例えば、産業界が出資するメタアナリシスでは、独立した学術研究者が行ったメタアナリシスと比較して、医薬品の有効性を示唆する可能性が圧倒的に高いことを示すメタアナリシスが存在する。このような2次研究は近年一般的になってきており、このような研究の結果は、(1次的で質の低い)医学研究の可撓性についての私の懸念を裏付けるものである。

1.6 マスターの主張

以上のようなバラバラの主張が、医療ニヒリズムを支持する主議論に集約されている。各章の論旨に一貫性を持たせ、本書全体の論旨に統一性を持たせるために、ベイズの定理の観点から主論を定式化する。つまり、ある医療介入が有効であるとする仮説をHとし、その仮説を支持する証拠をEとする。各章レベルの議論の結論は、平均してP(H)は低く、P(E|H)は低く、P(E)は高くあるべきだというもので、これについては11章で解説している。ある証拠が与えられたときの医療介入の有効性に対する信頼は、条件付き確率P(H|E)として表すことができ、ベイズの定理により、これはP(E|H)P(H)/P(E)と同等であるので、このマスターアクションの前提として、章レベルの議論の結論を合わせると、医療介入の有効性に対する信頼は低いはずである、という結論となる。

第11章では、前章までの議論に加え、このマスター・アベレージの動機付けとして、3つの広範な経験的現象を紹介する。第一は、効果がない、あるいは有害であるという理由で却下された医療介入の遍在である。このような拒絶された医療介入は、医学の歴史上容易に見つけることができるが、ここ数十年でも一般的である。医療ニヒリズムの動機となる2つ目の広範な経験的知見は、最も広く使われている医療介入の多くについて、利用可能な最善の証拠が、そのような介入は、全くないとしても、ほとんど効果がないことを示しているということである。医療ニヒリズムを動機づける第三の現象は、不一致の証拠が偏在していることである。多くの医療介入について、ある証拠はそれらが有効であることを示唆し、他の証拠はそうでないことを示唆している。第11章では、最も優れたランダム化比較試験、メタアナリシス、システマティックレビューのいくつかに依拠している。これらの経験的知見は、前章までの医学に関する原則的な議論と合わせて、医療ニヒリズムを正当化するものである。

医療介入に関するこの急進的な見解は、活発な反論を呼び起こす。予想されるいくつかの反論を検討することで、第11章を終える。

1.7 ニヒリズムの後で

医療ニヒリズムは、ある種の病気の治療方法を修正することを提案する。歴史上、治療に対する保守的なアプローチは人気があった。紀元前5世紀のヒポクラテスの書物には、多くの非薬物療法について書かれており、vis medicatrix naturae(自然の治癒力)に信頼を置いている。15世紀から19世紀にかけては、芸術家、作家、科学者、そして医師たちによって、数多くの不干渉主義が宣言された。一方、20世紀には、医療に対する積極的なアプローチが主流となった。現在では、主流医学に代わる代替医療として、カイロプラクティック、漢方薬、鍼灸などの介入療法が行われている。私は、このような後者の医療行為に使われることのある言葉、「La médecine douce」(優しい医療)を引用している。優しい医療とは、治療上の謙虚さを伴うものであり、穏健な形の不干渉主義である。本書を通じて提起された医療ニヒリズムの議論を踏まえ、私は、今日の医療はより攻撃的であるべきだと主張する。医療ニヒリズムの論拠は、最も広く採用されている医療介入について説得力があり、それに関連する病気については、より穏やかな医療を用いることができる。

医療ニヒリズムを支持する論拠、特に研究方法の可鍛性が強調された第2部の論拠は、医学研究の実施方法の修正を示唆するものである。本書で提起された問題に対する解決策は、医学研究の小手先の修正(データ収集に先立つ試験の登録や試験データのオープンアクセスなど)から、革命的な変化(医学研究の完全な社会化など)に至るまで、数多く提示されている。第12章では、医学ニヒリズムに合致する医学研究の再編成のためのこれらの提案のいくつかを述べる。例えば、医療介入の有益性と有害性の検出基準の厳格化、企業研究の精査、研究課題を「有益性の疑わしい薬」から、優しい医療に合致し、より大きな影響を与える可能性のあるプロジェクト、例えば食事と運動の重要性に関する研究や、顧みられない熱帯病に関する研究へとシフトすることである。医療ニヒリズムのテーゼを明確にすることで、人類が医療の芸術と科学を再考することから利益を得ることができればと願っている。

1 (Longino, 1990), (Solomon, 2001), (Douglas, 2009)などの著書がある。

2 最近の例としては、マーシャ・アンジェル(2004b)、モイニハンとキャッセルズ(2005)、カール・エリオット(2010)、ベン・ゴールドエーカー(2012)、ピーター・ゴーツェ(2013)の著書や、ジョン・ヨアニス、リサ・ベロ、ピーター・ジュニ、ヤン・ヴァンデンブロウケなどの疫学者による論文(本書で引用)。

3 (Moncrieff, 2013), (Kirsch, 2011), (Moynihan & Cassels, 2005), および (Gøtzsche, 2013)を参照。

4 Wootton(2006)が引用しているが、彼は医療ニヒリズムを表現した数千年にわたる多くの歴史的な文章を提供している。

5 Woottonは、「『治療的ニヒリズム』とは、従来の医学的療法のほとんどが効かないという信念で、1840年代には洗練された(特にパリの)医師たちの間で標準となった」と指摘している。治療的ニヒリズム」という言葉は時折使われるが、「医療的ニヒリズム」はより正確に私の論文を意味するものである。

管理

 

第9章 ホローハント・フォー・ハルムズ

9.1 はじめに

医療介入の有害な影響は、医学研究によって体系的に過小評価されている。この過小評価は、臨床研究の様々な段階を通じて存在する概念的、方法論的、および社会的要因の結果である。

医療介入の有害性を検出することの困難さは、有害性が臨床研究においてどのように概念化され、運用されるかに始まる(9.2節)。実験室研究の後、実験的介入の有害性プロファイルを評価するために第1相試験が実施される。残念ながら、第1相試験の大部分は未発表のままであり、医療介入の有害性プロファイルの全体的な評価を一般的かつ体系的に歪めている(9.3項)。介入が第1相試験で比較的無害と判断された場合、その介入はより大規模な第2相および第3相試験で検証される。無作為化試験は、有害性を追求する上で最も重要なハードルの一つである。ほとんどの無作為化試験は、医療介入の潜在的な利益を検出する感度が高いように設計されており、この感度は、介入の潜在的な害を検出する感度とトレードオフになっている。これは、臨床試験が通常、医療介入の効果に関する最良の証拠を生み出すと考えられていることを考えると、特に厄介である(ただし、第5章ではこの見解に対する批判を指摘する)。9.4節では、介入の害が過小評価されるような試験がデザインされるいくつかの方法を紹介する。医療介入が臨床現場での使用を承認されると、受動的監視の使用や、時には第4相試験で害が追及される。これには実用上も認識上も欠点がある(9.5節)。

有害性の追求は、有害性の過小評価を悪化させる社会的ネクサスに組み込まれている。医療介入の害に関するほとんどのエビデンスは、調査中の介入のメーカーが資金を提供し管理する試験によって作成され、その利益は介入の害のプロファイルを過小評価することによって最も良くなる。このことは、独立した科学者、政策立案者、一般市民が利用できるようにする害に関する証拠を広く制限することにつながり、このことが今度は医療介入の害のプロファイルを過小評価することに寄与している。規制当局は、介入の有害性プロファイルを適切に推定することを可能にする権限を持たず、有害性に関する関連エビデンスを秘密裏に覆い隠すことに頻繁に貢献している(§9.6)。第11章(§11.2)では、過剰な有害性のために市場から撤退した医薬品の例を数多く挙げている。

これらの概念的、方法論的、社会的要因の正味の効果は、私たちが利用できる医療介入は、実際よりも安全であるように見えるということである。もしこれらの要因が医学研究において緩和されていれば、介入の有害性プロファイルはより正直に表現され、現在よりも有害であるとみなされるはずだ。

9.2 害を運用する

医療介入の害は、もちろん介入の効果であり、介入の利益が効果であるのと同じだ。ある効果を害として(あるいは逆に利益として)解釈することは規範的判断であり、それゆえ社会的価値観に影響される(第2章参照)。このような判断は、必ずしも単純ではない。例えば、注意欠陥多動性障害(ADHD)の治療薬として処方されるメチルフェニデート(リタリン)は、その典型的な例だ。メチルフェニデートがもたらすとされる利益は、特定の社会的な結びつきに依存し、その害と概念的に絡み合っている。メチルフェニデートの経験的なテストでは、子供の体の動きや社会的な交流の頻度が緩和されることが示唆されており、これは過労の教師にとって利益とみなされるかもしれない。しかし、この効果は、子どもが動き回り、遊び、社交することを肯定的な行動と考える人からは、有害と判断される可能性がある。ある評論家は、メチルフェニデートのような覚醒剤は「教師には有効だが、子どもには必ずしも有効ではない」と述べている1。介入による同じ効果でも、より広い規範的コミットメントや社会文化的文脈によって、利益とみなされたり害とみなされたりする。しかし、医療介入の効果には、軽度の頭痛のような実体のないものから、死のような深刻なものまで、典型的なケースではほとんどあいまいなまま害とみなされるものが数多くある。

害は、しばしば有害事象と呼ばれる個別の結果と考えられ、それが極めて有害な場合は重篤な有害事象と呼ばれる。しかし、害は離散的なパラメーターの変化ではなく、連続的なパラメーターの小さな変化であり得る。離散的な事象は医療介入の潜在的な害のほんの一部にすぎないため、多くの害は事象として考えるべきではない。9.5で述べたように、危害データの大部分は受動的サーベイランスと観察研究によるもので、患者や医師が介入の効果を観察して危害と解釈し、そのように報告した場合にのみ、特定のトークンイベントをそもそも危害として検出することができる。小さな効果や一般的な効果は、報告されないことが多い。ある薬が原因で患者が数キロ体重を増やしたとしても、この効果は患者や医師が気づかないことが多く、たとえ気づいたとしても、患者や医師が体重増加の原因として薬を信頼できる形で評価できるわけがない。言い換えれば、そのような効果は、おそらく薬物の効果として帰結されないであろうし、もし帰結されたとしても、その帰結は信頼できるものではないだろう2。

用語の選択は、医療介入の有害性プロファイルを曖昧にする一因となる。介入の害に関する懸念は、しばしば「医薬品安全性」などの用語で言及される。医療介入の新たな種類の有害性の報告は、「安全性発見」の「シグナル」であり、それは「安全性報告」を通じて文書化される。例えば、FDAは、ペルオキシソーム増殖剤活性化受容体(PPAR)モジュレーター(後述)による死亡や脳卒中などの重大な害について語るとき、これらの事象を「臨床安全性シグナル」と呼び、このクラスのいくつかの薬剤は「臨床安全性」を理由に市場から排除された。害を指すのに安全という言葉を使うのは、おそらく医学界で最もひどいオーウェル的(ダブルスピーク)な言い回しであろう。さらに、医療介入に関する言説で採用されている「副作用」や「有害事象」といった、肺の崩壊、自傷行為、腱の爆発、死を意味する他の良さそうな言い回しは、医療介入の害の不透明さを助長するものである。

臨床研究において害がどのように定義されるかは、害の過小評価に寄与している。例えば、抗うつ剤が自殺念慮を引き起こす可能性があることが確立される前に、試験データのいくつかの分析では、これらの薬剤は実際にはこの恐ろしい害を引き起こさないことが示唆された。これらの試験データは、ハミルトンうつ病評価尺度(HAMD)を用いて測定された患者の転帰に関するものであった。第8章では、HAMDが抗うつ薬の効果を測定するための道具としては不十分であることを論じた。しかし、HAMDは自殺傾向など、抗うつ薬のある種の害を測定するには、さらに悪い尺度である。この尺度には、自殺傾向に関する質問が1つだけあり、以下のようになっている:

  • 0 = 存在しない。
  • 1 = 生きる価値がないと感じる。
  • 2 = 死を願う、または自己の死の可能性を考える。
  • 3 = 自殺願望のある考えやしぐさがある。
  • 4 = 自殺未遂(重大な未遂はすべて4となる)。

問題は、抗うつ薬によって、時々自殺を考える患者が、実際に自殺を試みることなく、深刻で頻繁な自殺念慮と自傷行為を起こすことがあり、この質問に対する患者の得点は変化しない(抗うつ薬の投与前と投与後の両方で、患者は自殺傾向について3点を受けるから)ことだ。HAMDはこのような害に鈍感である。このツールは抗うつ薬の試験で使用される主要な測定手段であるため、試験は抗うつ薬のこの害を組織的に過小評価する3。これは、臨床研究における害の運用方法が医療介入の害プロファイルの過小評価に寄与しうるという、より一般的な点を説明している。

有害性の定義が有害性の過小評価に寄与するもう一つの例は、かつて世界で最も売れた2型糖尿病治療薬であるロシグリタゾン(アバンディア)についてのものである。2007年までに、ロシグリタゾンが心血管疾患と死亡のリスクを高めるという証拠が積み重なった。ロシグリタゾンの製造元は、これを否定するために大規模な試験に資金を提供した4。この試験で測定された主要アウトカムは、すべての入院とあらゆる心血管系の原因による死亡を含む複合アウトカムであった。このアウトカムには、介入(ロシグリタゾンまたはコントロール)に関連していない可能性が非常に高い心血管入院が含まれており、したがって、どちらの介入にも起因しない入院と死亡が試験群間でほぼ同じ割合で発生し、入院は死亡よりもはるかに頻繁に起こるイベントであると推定できるため、両群でこのアウトカムの数が全体により多いため、群間で観察されたアウトカムにおける相対差が最小となった。つまり、ロシグリタゾンによる心血管疾患と死亡という注目すべき結果は、両群とも、より頻度の高い入院という結果を含むことで「水増し」され、群間の統計的有意差を検出する可能性が低くなったのである。

上記の例で示されたより広範なポイントは、医療介入の害は、それが適切に探索された場合にのみ発見されるということである。ある種の方法で害を操作すること-例えば、問題となっている害に鈍感な測定器や結果を採用すること-は、害を適切に探していないことに等しい。

9.3 ファースト・イン・ヒューマン、二度と見られないもの

第1相ファーストインヒト試験とは、ある医療介入を初めてヒトに投与する実験である。一般に、医療介入はまず試験管内実験や動物実験で評価され、そうした実験によって介入がヒトに使用するのに安全で有効かもしれないと考える証拠が得られた場合、ヒトへの初回投与試験が行われる。このような試験は、第1相試験と呼ばれている。

このような試験は、被験者にとってリスクが高い。ある実験的分子の最近の第1相試験では、動物で安全とされる用量の500分の1という低用量がテストされた。6 この薬を投与された6人の男性は、すぐに激しい頭痛、背中の痛み、腸の痛み、下痢、発熱、血圧低下、肺の痛みを発症し、48時間後にはそれぞれが多臓器不全となった。

第1相試験のリスクにもかかわらず、医療介入の有害性を評価するための基礎となるため、第1相試験は重要である。第1相試験は、実験的介入を初めてヒトで試験するものであることから、有害性に関する重要なエビデンスを提供する。このような証拠は、明らかに調査中の特定の分子の有害性プロファイルに関連するが、このような証拠は、特定の分子が属するクラスの分子の有害性プロファイルにも関連し、より広くは一般的に薬物の有害性プロファイルにも関連するものである。分子xはT型分子のクラスの一員であり、このクラスはそれ自体、すべての薬物のクラスDの一員である、というものである。xに関する第1相試験からの証拠は、明らかにxの有害性プロファイルに関連するが、Tの有害性プロファイルにも(より間接的にではあるが)関連し、Dの有害性プロファイルにも(やはりより間接的に)関連する。したがって、第1相臨床試験から得られる証拠は、医薬品の一般的な有害性を知る上で非常に重要である。

しかし、残念ながら、このようなエビデンスが公に共有されることはほとんどない。第1相試験の大部分は公表されていない。7 どのような分子が第1相試験でテストされたかについての登録がないため、第1相試験のうち何割が公表されているかを正確に知ることは困難である。第1相臨床試験の出版バイアスに関する実証研究は、機関審査委員会(大学や病院の、ヒトを対象とする実験案を審査する委員会)の記録に依拠しており、第1相臨床試験の約95%は出版されていないようだ。上記のような、第1相試験での悲劇をきっかけに分子の有害性プロファイルを一般に知らしめるようなケースは、珍しい。危険性の低い有害性プロファイルを持つ実験的介入については、その有害性プロファイルについてほとんど知らない。なぜなら、大多数の分子の有害性プロファイルに関する証拠はほとんど発表されず、公表もされていないからだ。

第1相試験で明らかに有害でない分子は、通常、第2相試験や第3相試験でテストされる。したがって、より広い科学界は、そのような分子が第1相試験に合格したことを推測することができ、したがってその分子は少なくともある程度安全であると推測できる(ただし、以下に論じるように、この推測は不当である)。第1相試験で比較的有害と思われる分子が、さらなる試験でテストされることはほとんどなく、そのような第1相試験が発表されることもほとんどない。このような第1相臨床試験の出版バイアスは無駄である。先行する第1相試験が行われたxやクラスTの他の分子の有害性プロファイルを知らない将来の科学者が、xやクラスTの他の分子の有害性プロファイルを知りたいと思った場合、無駄な後続の第1相試験を行うことになりかねない。これはまた、後続の第1相試験で被験者に無用な害を与える可能性がある。しかし、第1相試験の出版バイアスは、これよりもっと深いところに帰結するものがあるのである。

ある分子(x)の有害性プロファイルを評価するとき、(xやより一般的なTの)有害性に関する過去の証拠を知らない場合、その分子が有害であるという事前確率は、あるべき値よりも低くなる(つまり、そうした証拠を知っていた場合の確率よりも低くなる)ことになる。第1相試験で安全と思われる分子は、より大規模で公的な第2相、第3相試験で評価される傾向があり、有害と思われる分子はそうではなく、ほとんどの第1相試験は発表されていないため、臨床使用のために試験されるすべての薬のうち、有害と思われる割合は実際のケースより低く、おそらくはるかに低いということになる。

このことは極めて重要であるため、より正式な表現でこの議論を再確認する。ここで、Kはxが有害であるという仮説であり、Eはxの有害性プロファイルに関する関連する新しい証拠である(Eは第1相試験や第3相試験のデータでもよい)。ある分子の有害性プロファイルに対する私たちの評価は、その分子が有害であるという事前確率であるP(K)に正比例する(付録1参照)。P(K)はどのように決定すればよいのだろうか?これは、科学的な方法論としては有名な難問である。しかし、この文脈では、少なくとも答えに対する明らかな制約がある。

xが有害である事前確率は、xとそれに似た他の分子(T型の分子、より広くはすべての薬物Dを含む)に関する過去の証拠に依存する。私たちは、xとTとDの有害性に関する過去の証拠のごく一部にしかアクセスできない。上述の出版バイアスが蔓延していることを考えると、私たちがアクセスできない証拠は、アクセスできる証拠よりもKを確認する可能性が高くなる。つまり、私たちのP(K)の評価は、出版バイアスのために人為的に低くなっており、もし私たちが関連するすべての証拠にアクセスできたなら、より高く、より正確になるはずだ。このことは、同時に、P(K|E)に直接良い影響を与えるだろう。これは一般的な議論である。したがって、すべての薬物について、ある特定の薬物が有害である確率の推定値は、第1相試験から得られたすべての関連する証拠を入手した場合の推定値よりも人為的に低くなっている。この問題の程度を推定するのは困難だが、第1相試験の出版バイアスの頻度を経験的に推定すると、極めて深刻であると思われる。

xの有害性プロファイルを評価するための適切な参照クラスは何だろうか?xを同種の他の分子とだけ比較すべきか、T型のすべての分子と比較すべきか、あるいはすべての薬剤Dと比較すべきか。P(K)の評価に関する質問と同様に、これは科学的方法論にとって有名な難問である。しかし、この文脈でも、答えには簡単な制約がある。xはT型の他の分子と密接な類似性があり、D型の他の分子と広範な類似性があるため、xの有害性プロファイルを評価する際には、少なくとも出版バイアスによって現在可能なよりも多くのTおよびD型の分子の有害性プロファイルを考慮する必要がある。そして、上記のように、TとDの有害性プロファイルに関する出版バイアスは、系統的に有害性を過小評価する方向に偏っているため、より適切な参照クラスでxの有害性プロファイルを評価できれば、xの有害性プロファイルはより正確に評価され、xは他のものよりも有害に見えることになる。

ロシグリタゾンは、遺伝子発現を制御するペルオキシソーム増殖剤活性化受容体(PPAR)と呼ばれるタンパク質の調節剤であることを想起してほしい。近年、50種類以上のPPARモジュレーターが臨床試験に失敗し、その多くはPPARモジュレーターによる害に起因している。例えば、PPARモジュレーターは、げっ歯類において、多くの種類の腫瘍や心臓毒性を引き起こすことが判明している。実験的介入の有害性プロファイルの推定は、このような背景知識を考慮に入れるべきである8。

xが有害である事前確率の評価に影響を与えるべきもう一つの要因は、xが正常および病的メカニズムに介入する方法に関する背景知識である。PPARモジュレーターはまた良い例だ。与えられたPPARモジュレーターは何十もの遺伝子の発現に影響を与える可能性があり、したがって、このような薬剤を使用することで多様な効果を期待できるはずだ。しかし、第4章で述べた医薬品の作用の連鎖的な複雑さを思い出してほしい。私たちの正常な生理学において複雑な因果関係があるため、多くの医薬品が多数の有害な作用をもたらすと予想される。このような薬物の作用の連鎖的な複雑さに関する知識を考慮することで、薬物の有害性プロファイルの推定を高めることができるはずだ。

本節の議論を踏まえると、第1相試験で得られたエビデンスから比較的安全と思われる医薬品が、臨床試験や市販後調査(第2〜4相)で得られたエビデンスから比較的有害と見なされるようになる例が見られると予想される。そして、これはまさに私たちが観察していることなのである。PPARモジュレーターのクラスだけでも、このような例はたくさんある。トログリタゾンは肝障害を引き起こすと思われるため、いくつかの法域で撤回され、テサグリタザールは血清クレアチニン上昇を引き起こすと思われるため、いくつかの法域で撤回され、ピオグリタゾンは膀胱癌を引き起こすと思われるため、いくつかの法域で撤回されており、ムラグリタザールは心臓発作、ストローク、死亡を引き起こすと思われるのでいくつかの法域では撤回されている10。

9.6で述べるように、他の種類の研究の出版バイアスは、医療介入の害の体系的な過小評価にさらに寄与している。要するに、第1相試験からのエビデンスが利用できないことが、医療介入の害の系統的な過小評価に寄与している。

9.4 臨床試験と権力の濫用

しかし、そのような試験は、今日実施されているほとんどの試験よりも大規模かつ長期的でなければならず、他のよりきめ細かな方法論の変更を取り入れる必要があるだろう。実際には、無作為化試験は、医療介入の利益の検出に敏感になるように設計されており、害の検出には敏感であることを犠牲にしている。

この議論をするために、私は統計的検出力という概念を用いる。ある試験の統計的検出力は、いくつかの方法で特徴づけられる:試験からのデータの統計分析が誤った帰無仮説を棄却する確率、「タイプII」エラー(試験の実験群と対照群の間に差がないと誤って結論づけること)を回避する確率、検出されるべき差が本当にある場合に試験の実験群と対照群の間の差を検出する確率である。広義には、検出力とは、調査中の介入による効果が検出される場合に、その効果を検出するための試験の感度を意味する。試験の統計的検出力は、調査中の介入の効果量、試験の被験者数、データのばらつきという3つのパラメータに依存する。多くの医療介入は効果が小さく、試験の被験者数を増やすには費用がかかり、被験者は実験的介入に対して非常に異なった反応を示す可能性があるためだ。

臨床試験の設計者は、多くの方法で検出力を最大化しようとする。一つは、介入による効果が最も現れやすい被験者だけを含めることで、試験で観察される効果量を最大化することである。検出力に影響するパラメータのうち、試験計画者が最もコントロールしやすいのは、データの変動性である:変動性を最小化するために、試験計画者は比較的均質な被験者グループを含める。試験の結果に影響を与えうるパラメータ(年齢、性別、他の疾患の有無など)に関して被験者間の類似性が高ければ高いほど、データの変動性は少なくなる。最後に、費用がかかるとはいえ、試験には何千人もの被験者が含まれることが多い。(明らかに、新しい医療介入に効果がないと誤って結論づけるという誤りを避けるために、大きな金銭的動機がある)。

観察された効果量を最大化し、データのばらつきを最小化するために、臨床試験の設計者は、どの被験者を試験に含めるか、または除外するかを制約する様々な基準を採用する。例えば、高齢者、他の薬剤を使用している被験者、他の疾患を持つ被験者を除外するのが一般的である(8章参照)。被験者の登録後、データ収集の開始前に、被験者がプラセボや実験的介入にどう反応するかをテストし、プラセボでうまくいった被験者や実験的介入でうまくいかなかった被験者を試験から除外する12。

このような戦略の結果、臨床試験の被験者は、臨床での使用が承認された後に介入を使用する患者とは多くの重要な点で異なることになる。これらの違いのいくつかは、医療介入の有害性プロファイルに影響を与えることが知られている。高齢者、妊婦、他の薬剤を使用している患者(例えば)は、医療介入によって害を受ける可能性が高いが、それらはまさに試験から除外される種類の人々でもある。例えば、スタチンの最も一般的な害はミオパシーで、単なる筋肉痛や脱力感から、筋肉組織が死んで血液中にタンパク質(ミオグロビン)が放出され、腎不全や死亡を引き起こす重篤な状態である横紋筋融解症まである(他のスタチンによる害には、脳卒中、先天性欠損、糖尿、ガン、神経筋症状、神経損傷、肝機能異常、関節障害、腱損傷などがある)。このリスクは、女性、高齢者、感染症、発作、腎臓病などの疾患を持つ人々で高く、まさに臨床試験から除外される人々である。このような患者を除外する目的の一つは、薬の潜在的な利益を検出する能力を最大化することだが、このような患者の除外は、薬の潜在的な害を検出する能力を最小化することにもなる。これが第8章で指摘したリクルートバイアスである。

以下はその例だ。Worrall(2010)は、大規模なASSENT-2試験において、除外基準として 「患者を危険な状態に置くと治験責任医師が判断した他の障害」を挙げている。もちろん、これには倫理的な根拠がある。すなわち、実験的介入によって害を受ける可能性が高い被験者を保護するためだ。しかし、この除外基準は、実世界の臨床現場で介入を行った場合に生じるであろう介入の害を検出する試験能力を直接的に低下させるものであった。なぜなら、臨床現場では、患者が害のリスクを増大させる他の障害を抱えているのがまさにその状況だろうからだ。被験薬の効きが悪い被験者を除外するエンリッチメント戦略も、医療介入の害を検出する試験の能力を低下させる試験デザインの特徴である。なぜなら、実際に介入による害を経験する被験者が試験から除外されるからだ。

通常、臨床試験の検出力とは、有益性を検出する試験の能力を指す。しかし、医療介入の害は、利益と同じように、単に介入の別の効果であるため、試験のパワーは害を検出する試験の能力を指すこともある。私は、有益性を検出する試験の感度をpowerB、有害性を検出する試験の感度をpowerHと呼ぶことにする。PowerBとPowerHは互いにトレードオフの関係にある。臨床試験の設計者が、powerHを犠牲にしてpowerBを最大化する方法は数多くある。上記のように、ある種の患者を除外し、他の種の患者を含めることは、そのような戦略の1つである。その結果、有害性を検出する臨床試験の力(より広くは臨床試験の感度)は、有益性を検出する臨床試験の力よりはるかに低いことが一般的である13。

先ほどの例に戻ると、ロシグリタゾンが心臓発作や心血管疾患による死亡のリスクを高めることを示すメタ分析が行われた(Nissen & Wolski, 2007)。このグループが統合した個々の臨床試験は、このまれだが深刻な害を検出するのに十分な検出力を持つには、小さすぎた。RECORD試験は、ロシグリタゾンが心臓発作のリスクを増加させないことを示す試みであった(この試験については、第8章の外挿に関する考察の中で触れた)。この試験では、7つの組み入れ基準と16の除外基準が採用され、被験者の99%が白人であった。例えば、この試験の被験者(対照群とロシグリタゾン群の両方)の心臓発作率は、より広い対象集団における同等の人口集団(2型糖尿病の中年層)の心臓発作率より約40%低かったということである。

もし実験群の被験者が実験的介入の有害性によって試験から脱落した場合、脱落した被験者の有害性に関するデータが収集されないため、試験データの提示は介入が実際よりも安全であるという誤解を与える可能性がある。残念ながら、被験者の脱落の頻度に関する証拠はほとんどなく、被験者の脱落に関する不十分な報告はどこにでもあることである14。

介入の有害性を過小評価する原因となる試験の限界は、他に2つある:その規模と期間である。臨床試験は通常、介入の潜在的利益を検出するのに十分な数の被験者を登録する。それ以上の被験者を登録すると、費用がかさむ。しかし、この被験者数は、深刻ではあるが稀である害を検出するには十分でないことが多い。試験の規模は、検出力Hを気にすることなく、満足できる検出力Bを達成するように最適化される。試験の期間は、通常、医療介入の潜在的な利益を検出するのに十分な長さである。例えば、抗うつ薬の研究の中には、数週間しか評価しないものがある。より長い試験には費用がかかる。しかし、薬物の害の中には、何年も服用することで初めて明らかになるものもある。例えば、メチルフェニデートは、子供の成長阻害を引き起こすことが示されているが、これは薬物による治療を開始してから3年後に初めて判明する15。この2つの理由、すなわち試験の規模が小さいことと期間が短いことから、有害性の検出には通常、より大きく長い観察研究が頼りにされているが、以下に述べるように、観察研究にはそれ自身の実用的および認識的な欠点がある。

臨床試験は有害性を過小評価するため、臨床試験の結果、比較的安全と思われた薬剤が、臨床の場で使用されるとより有害であると思われるようになった例が見られるはずだ。このような現象は広く見られる。最悪のケースは、メーカーや規制当局によって医療行為が市場から撤去されるケースである。ここ数年の例では、バルデコキシブ(ベクストラ)、フェンフルラミン(ポンディミン)、ガチフロキサシン(ガチフロ)、ロフェコキシブ(バイオックス)などがある。また、臨床現場での有害性プロファイルが無作為化試験で示唆されたよりも悪いと思われるにもかかわらず、何らかの理由で市場に残されたケースもある(規制当局が、有害性プロファイルの評価が上がっても、その薬の利益-有害性プロファイルが良好であるとみなすことが多い)。例えば、セレコキシブ(セレブレックス)、アレンドロン酸(フォサマック)、リスペリドン(リスパダール)、オランザピン(ジプレキサ)、そして米国では本章の実行例であるロシグリタゾン(アバンディア)である(その他の例は§11.2参照)16。これらの薬のいくつかは、メーカーが薬の有害プロファイルを偽って軽視したために大規模訴訟の対象になってきた。医療介入の有害性を過小評価する原因となる臨床試験のもう一つの重要な特性は、臨床試験自体の方法論に内在するものではなく、むしろ臨床試験からのエビデンスが公に共有され、規制当局によって利用される方法についてである(9.6節を参照のこと)。

このセクションでは、臨床試験の2つの重要な方法論的特性、すなわちパワーBとパワーHが互いにトレードオフし、通常はパワーHを犠牲にしてパワーBを有利にし、このトレードオフは臨床試験の設計者が行う複数の細かい方法論の選択によって構成されていることを論じた。

9.5 今すぐジャンプし、後で見る(ただし、難しいことは考えないでほしい)

医療介入の有害性に関するデータの大部分は、ある医療介入が臨床使用として承認された後に実施された観察研究および受動的サーベイランスから得られている。これらの研究は第4相試験や市販後試験と呼ばれている。医療介入の有害性に関するデータの大半が市販後調査から得られるという事実は、重要な実用的帰結をもたらし、そのような調査が通常観察デザインであるという事実は、重要な認識的帰結をもたらす。

新しい医療介入が消費とマーケティングのために承認されるために乗り越えなければならないハードルは低い。例えばFDAは、新しい医療介入に何らかの有益な効果があることを示す2つのランダム化試験のみを要求しており、介入に関する試験がいくつ行われたかにかかわらず、またそのような試験のパワーHが通常極めて低いという事実にもかかわらず(この基準に対する批判は第8章と12章を参照)。したがって、新しい介入が一般的な使用として承認される時点では、その介入の有害性プロファイルに関する利用可能なエビデンスは乏しい。介入が臨床使用として承認された後、その害は受動的監視システムと観察研究によって評価される。このような介入は、典型的な患者によって消費され、その数はしばしば数百万人にのぼる。有害性に関するほとんどのデータが収集されるのは、新しい介入が実験的な設定ではなく、臨床的な設定で使用されるこの時点においてのみである。このデータは、薬の有害性プロファイルに関する研究の被験者となった患者から得られるものである。そのような患者は、知らず知らずのうちに、有害性を探すためのモルモットになっているのである。

市販後調査は、医療介入の害を著しく過小評価すると考える理由がある。ある実証的な評価では、過小評価率は94%とされている(これは(Hazell & Shakir, 2006)による広範な実証的調査に基づくものである)。

残念ながら、観察研究や受動的監視は無作為化デザインを伴わないため、一般的に無作為化試験と比較して否定される。医療介入の害に関するほとんどのエビデンスは非ランダム化試験から得られているため(特に稀な重篤な害)、EBMの支配的な見解はそれによって医療介入の害に関するエビデンスの大部分を否定している(これに対する批判は第5章を参照)。

この見解は規制当局にも影響を及ぼしている。例えば、この文章は、ロフェコキシブ(バイオックス)という医薬品に関する議会の公聴会での、FDAの上級疫学者の証言に由来している:

CDERの企業文化もまた、アメリカ国民を効果的に保護するための障壁となっている。この文化は、無作為化臨床試験のみが有用で実用的な情報を提供し、市販後の安全性は後回しにされると考える世界観に支配されているのだ18。

この証言で批判された考え方によれば、無作為化試験のみが介入の害に関する説得力のある証拠を提供でき、害に関するデータの大半は非無作為化試験から得られ、無作為化試験から得られる害に関するデータは、上に述べた理由で根本的に限られているため、米国の規制当局は、彼ら自身の考えでは、介入の害に関する信頼できる証拠が乏しいことになる。

Vandenbroucke(2008)は、有害性の追求においては、観察研究よりも無作為化試験の方が優れているという見解に対して議論を提起している。薬物の害は意図されたものではなく、しばしば未知の効果を持つため、医師はそのような効果に関して治療配分を偏らせることはできない(これは選択バイアスである-第10章参照)。したがって、選択バイアスは意図しない有害な効果については、意図する有益な効果ほど心配する必要はなく、観察研究に対する無作為化試験の中心的な利点の1つは、有害な効果を探す際に緩和される(Osimani, 2014)も参照)。つまり、観察研究では、一般的に薬物の有害性プロファイルを過大評価することはないということである。実際、観察研究が有害性プロファイルを過小評価することを示唆する経験的証拠もある。

あるグループは、有害性の徹底的な調査を含む大規模ランダム化試験から得られた有害性の推定値と同等の非ランダム化試験を比較し、非ランダム化試験は、平均して、同じ介入に関するランダム化試験と比較して、介入の有害性の推定値が保守的であることを明らかにした19。このような知見の理由の一つは、医師の指示に忠実なスケジュールで薬を服用する患者は、非遵守の患者よりも健康である傾向があり、したがって、より多くの介入を摂取する患者とより少ない摂取の患者の結果を比較する際に、交絡因子が存在することである。薬をより忠実に摂取する人は、より忠実に摂取しない人よりもたまたま健康である。いずれにせよ、より健康な人は、薬物療法を受けたときに、より良い結果を得、害を少なくすることができる。したがって、医療介入をより多く消費する患者を他の患者と比較する観察研究は、介入の利益を過大評価し、その害を過小評価する傾向がある。上記の理由から、規制当局が通常ランダム化試験による医療介入の害に関するエビデンスにアクセスできないとしても、非ランダム化試験によるエビデンスに頼ることができ、少なくとも平均的には、医療介入の害のプロファイルを過大評価していないと確信することができる。

しかし、規制当局がアクセスできる有害性に関する証拠は、明らかに秘密にしておくのに十分なものであり、このテーマについては次のセクションで触れる。

9.6 データの秘密性

医療介入の害に関する膨大なエビデンスは、秘密のベールに包まれている。臨床試験の費用を負担する企業は、臨床試験のデータを自分たちのものだと主張し、業界が支援する臨床試験に参加する研究者は、介入による害が疑われる場合でも、データを共有する能力を制約する契約上の箝口令に縛られていることが多い。

過去10年間にヨーロッパで販売された抗うつ剤であるレボキセチンを考えてみよう。最近、研究者が公表データと未公表データの両方にアクセスできるメタアナリシスが行われた。20 リボキセチンについて行われた13の試験のうち、74%の患者のデータが未公表のままであった。そのうち、7つの試験はプラセボと比較したもので、1つは肯定的な結果が得られ、この1つだけが出版された。他の6つの試験(肯定的な試験の約10倍の患者数)は無効な結果を示し、これらはいずれも出版されていない。レボキセチンを競合薬と比較した試験は、より悪いものだった。3つの小さな試験では、レボキセチンが競合薬より優れていることが示唆された。しかし、3倍の患者を対象とした他の試験では、主要評価項目でレボキセチンが競合薬より悪く、副作用もひどいことが示された。第1相試験と同様、第3相試験も出版バイアスが蔓延しており、その結果、医療介入の利益が誇張され(第8章)、害が過小評価されることになる。

ロフェコキシブ(バイオックス)の苦難は、このような秘密主義の顕著な例であり、後に公に暴露された。ロフェコキシブの製造元は、この薬の安全性と有効性を検証するためにVIGOR試験を実施した。現在では、この試験のブレイクスルー発表の際に、著者がロフェコキシブの心血管系の害に関するデータを隠したと広く考えられている。これは、この論文を掲載した雑誌(The New England Journal of Medicine)の編集者が、論文の著者のうち少なくとも2人が心血管系の有害性に関するデータを知っていたことを示す会社のメモを知った後の見解である。方法論的な問題は、企業(メルク社)と論文の著者によって、より微妙なものとして描かれている:心血管障害の分析は、特定の日に心血管障害データの収集を停止するというあらかじめ定義された計画に従ったものであり、したがって、このカットオフ日以降の2週間に集められたロフェコキシブに関する心血管障害の報告を含めることは、アドホックで不適切であったと主張した21)。科学哲学者の多くは、証拠を得るタイミングは、その証拠がどの程度確証的だろうかとは無関係であるとしている。しかし、少なくとも、カットオフ日以降に収集された心血管障害に関する特定の証拠については、公表することができたはずだ。しかし、そのようなデータは、あまりにも長い間、秘密にされてきた。

医療介入の有害性に関する証拠をめぐる秘密主義の例は、簡単に見つけることができる。ここでは、非常に広く使用されている薬剤の他の3つの例を紹介する。オランザピン(ジプレキサ)は、現在では極端な体重増加と糖尿病の併発を引き起こすことが知られているが、メーカーはこれを何年も隠していた22。パロキセチン(パキシル)のメーカーは、この薬の有害作用に関する証拠を何年も隠していたとして、大規模な訴訟で告発された。これらの有害性には、離脱症状や、子供や10代の若者における自殺傾向の増加などが含まれる。オセルタミビル(タミフル)の有害性に関する証拠は、近年、欧米諸国が大量に備蓄しているにもかかわらず、ほとんど発表されていない23。

本章で取り上げたロシグリタゾンは、有害性の証拠をめぐる秘密主義を示す顕著な例だ。この場合、規制当局自身がこのような秘密主義を助長している。ロシグリタゾンが心血管系に害を及ぼす可能性を示唆する試験がいくつか行われた後、スティーブ・ニッセンは製造元(グラクソ・スミスクライン社)にデータを要求したが、同社はデータの共有を拒否した。しかし、グラクソ・スミスクライン社は、パロキセチンに関する前述の訴訟により、すでに自社の試験データのレジストリを作成することを求められていたのである。ニッセンはこのレジストリから、ロシグリタゾンの42の臨床試験のデータを入手することができた。その結果、メタアナリシスでは、ロシグリタゾンは心血管イベントを43%増加させることが示された。メタアナリシスをNew England Journal of Medicine誌に投稿してから24時間以内に、査読者の一人が論文のコピーをグラクソ・スミスクライン社にファックスしていた。グラクソ・スミスクライン社の社内メールでは、ニッセンの発見が、数年前に行ったが発表していなかった自社の分析結果と類似していることが議論されている。FDAとグラクソ・スミスクラインは、ロシグリタゾンによる心血管系の害をすでに知っていたが、規制当局も企業もこの知見を公表していなかったのである24。

実際、規制当局はこのような秘密主義に対して無力であることが多いだけでなく、それに加担していることが多い。もう一つの例を挙げよう。ダイエット薬のオルリスタットとリモナバントのシステマティックレビューを行う研究者が、欧州医薬品庁(EMA)から未発表のデータを入手しようとした。EMAは、商業的利益と知的財産の保護を理由に、データの要求を拒否した。研究者たちは欧州連合オンブズパーソンに訴えたが、オンブズパーソンはEMAの悪政を認め、秘密保持のための主張は根拠がないと判断した。それでも、EMAは証拠を隠し続けた。そして、ついに研究者に60ページが送られた。しかし、この60ページは、EMAによってほぼ完全に編集されていた25。

規制当局がこのような秘密主義に加担しているのではなく、単に無能である場合もある。オセルタミビルは、その顕著な例だ。2009年にオセルタミビルのシステマティック・レビューを更新しようとしたとき、FDAの市販後有害事象報告システムには、ロシュ社の市販後調査システムよりも少ない神経精神的有害事象の項目しかないことがわかった。ロシュ社のシステムでは、1999年から2007年の間に2466件の神経精神医学的事象が記載され、そのうち562件が重篤な事象に分類されたが、FDAのシステムでは、いかなる種類の事象も1805件しか記載されていなかった(Doshi 2009)参照)。

医療介入の害に関する証拠の秘密が、警戒心の強い研究者によって脅かされると、メーカーは好戦的な対応をすることができる。ロシグリタゾンは、またしても良い例証となる。糖尿病研究者のJohn Buseは、ロシグリタゾンに心血管リスクがある可能性を主張する2つの講演を行った。グラクソ・スミスクラインは、彼を黙らせるために組織的なキャンペーンを実施した。この計画は、同社の研究責任者によって始められたようで、最高経営責任者(CEO)さえも認識していたようだ。同社はBuseを「Avandia Renegade」と呼び、Buseと彼の学科長との接触では、訴訟の脅威があった26。Buseは同社に対し、「call off the dogs」を求める書簡で返答した。後にブセは、グラクソ・スミスクライン社の圧力に屈したことを恥ずかしく思っていることを表明した。ニッセンのメタ分析が発表された2007年までに、FDAはロシグリタゾンが1999年の発売以来、約83,000件の心臓発作を引き起こしたと推定している。

試験データの秘匿の何が問題なのか?医学研究からのエビデンスは、きれいな水がすべての人に飲ませることができるように、間違いなく、すべての人が見ることができるようにすべき公共財である。Lemmens and Telfer (2012)は、医学研究の証拠へのアクセスは、健康への権利の基本的な要素であると主張している。医学研究からのエビデンスの秘密は、情報に基づいた意思決定(本章の文脈では、介入による明らかな害を最小化すること)を妨げ、それによって間違いなく基本的権利であるものを挫く。より端的に言えば、医師、政策立案者、患者は、医療介入の害に関する既存のエビデンスにアクセスできなければ、情報に基づいた治療の意思決定を行うことができない。

9.7 結論

医療介入の害は医学研究のあらゆる段階で組織的に過小評価されているため、政策立案者や医師は一般に医療介入の利益と害のバランスを適切に評価することができない。多くの人は、規制当局が医療介入の利益と害のバランスを適切に評価していると考えているようだ。残念ながら、これは真実とは程遠い。先に引用した有名なFDAの疫学者であるDavid Grahamは、「FDAの公式見解がどうであろうと、安全性はレーダースクリーンにはない」と主張している。「科学的には、FDAは統計を偏った方法で使い、患者の安全を犠牲にして産業界を優遇している」(2005)と述べている。この章では、規制当局が医療介入の利益と害のプロファイルを評価するまでに、介入の害が組織的に過小評価されてきたことを論じた。

医療介入の有害性を検出する問題のいくつかに対処するために、さまざまな解決策が提案されている。その中には、powerHを高めるために害の探索におけるエビデンスの質を高めることや、そのようなエビデンスが利用可能な場合のアクセス性を向上させることなど、明らかな候補がいくつかある。害の過小評価の理由の1つは、powerBとpowerHの間の基本的なトレードオフにあり、医療介入の害を検出する能力がこのトレードオフで犠牲にされることがあまりにも多い害に関するエビデンスが存在する場合、それはしばしば公に入手不可能である医療介入の害は、医学研究によって組織的に過小評価されている。一般に、医療介入は、あらゆる段階の医学研究の結果によって示唆されるよりも有害である。


1 (Whitaker, 2010)。残念ながら、私たちの最高の証拠は、メチルフェニデートがその子に効かないことを示唆している。幸福度の自己申告や学業成績の評価はメチルフェニデートによって改善されず、長期的には、メチルフェニデートはより悪い結果を引き起こす(9.4節参照)。

2 これは、原理的には、有益な小さな効果についても成り立つ。しかし、9.4節で論じたように、臨床試験は一般的に、害を検出するよりも利益を検出することに敏感になるよう設計されている。

3 抗うつ薬による自殺傾向の増加を検証するためにこの尺度を使用したひどい例は、(Beasley et al., 1991)で、「実質的な自殺念慮の出現」は、HAMD自殺傾向質問における得点が試験開始時に0または1から試験終了時に3または4に変化するとして操作されていた。当然のことながら、この試験はフルオキセチン(プロザック)の製造元であるイーライリリー社から資金提供を受けており、筆頭著者は同社の社員であった。

4 これはRECORD試験であった。

5さらに、アウトカムである「入院」は、明らかに患者が入院することに依存するが、これは健康上のアウトカムと同様に社会経済的な決定であり、この試験には多様な入院習慣を持つ数十カ国の患者が参加した。この多様性により、データにばらつきが生じ、たとえ差があったとしても、統計的に有意な群間差が検出される可能性は低くなる可能性があった。

6 この薬剤は、CD28-SuperMAB(TGN1412とも呼ばれる)と呼ばれた。この件に関する洞察に満ちた分析については、Lemoine (2017)を参照。動物における安全な投与量に対するヒト被験者に与えられた投与量は、このクラスの薬剤は種特異的であるため、実際にはCD28-SuperMABの動物モデルからの外挿に基づく推定であった。

7 これに関する実証的な証拠については、(Decullier, Chan, & Chapuis, 2009)を参照してほしい。

8 残念ながら、2型糖尿病研究の第一人者によれば、「遭遇した正確な毒性を詳述した論文はほとんどない」(Nissen, 2010)し、「失敗した製品の安全性所見を公表しないという業界共通の慣習があるため、毒性に関するデータはほとんど公開されていない」(Nissen & Wolski, 2007)。

9 (Nissen, 2010)の言葉を借りれば、こうである: 「これらの薬剤の作用は予測不可能であり、異常な毒性をもたらす可能性がある」

10 ここでいう「撤回」とは、指摘された有害性に基づいて、特定の薬剤が国の管轄区域から削除されたことを意味する。これらの薬剤の中には、一部の管轄区域でまだ入手可能なものもある。

11 マイケル・ローリンズは、有名な「ハーヴェイアン・オラショ」でこう述べている: 「有害性の評価において、RCTはエビデンスを提供するのに弱く、有害性を決定的に特定するための信頼できないアプローチである」(2008)。

12 エンリッチメント戦略のひとつにランイン期間と呼ばれる、試験開始前にプラセボ反応者を除外する方法がある。8 章で述べた例を紹介する。小児への抗うつ薬の使用に関してFDAが分析した15件の試験のうち、肯定的な結果を示したのは3件だけであった。この3つの試験のうち2つはフルオキセチン(プロザック)の試験であったため、フルオキセチンはうつ病と診断された子供への使用が承認された。しかし、この試験では、すべての子どもに1週間プラセボを投与し、この1週間で有意に改善した子どもは試験から除外された。このため、治験の対象は現実の患者とは異なるものとなっていた。

13 Tsang, Colley, and Lynd (2009)は、もともと害を検出する力を報告していない出版物(ただし、出版物は統計的に有意な重大な害が発見されなかったと報告している)に対して、介入の重大な害を検出する力の計算を行った。彼らが臨床試験のpowerHを計算したところ、0.07から0.37の範囲の値が得られた。したがって、これらの試験は、実際には害があったとしても、介入による害はないと誤って報告する可能性が非常に高い。

14 例えば、Pitrou, Boutron, Ahmad, and Ravaud (2009)は 2006年に6つの主要な一般医学雑誌に掲載されたRCTの133の論文のレビューにおいて、重度の有害事象に関する情報が27%の論文で与えられておらず、有害事象による被験者撤退の情報が47%の論文で与えられていないことを明らかにした。

15 メチルフェニデートは、身長で2cm、体重で2.7kgも成長を阻害する(Swanson et al., 2007)。別の例を挙げる。何十年もの間、コルチゾン注射は腱症(テニス肘のような使い過ぎによる怪我)の治療に使われてきた。この介入をテストした試験のほとんどは短期間であり、コルチゾンは短期的な痛みの緩和をもたらすようだ。しかし、最近のメタアナリシスでは、長期的には、コルチゾン注射を受けた患者は、何もしなかったり理学療法を受けたりした患者よりも回復率が低いことがわかった(Coombs、Bisset、& Vicenzino、2010)。

16 ロシグリタゾンの例は、有害性の追求におけるメタアナリシスの重要性を示している。個々の試験はロシグリタゾンの有害性を示すには小さすぎたが、統合されたエビデンスは有害性を示すことができた。メタアナリシスには欠点もあるが、第6章で論じたように、Nissen and Wolski(2007)のように、公表データと未公表データの両方にアクセスできるものが最も優れたメタアナリシスである。

17 精神医学的介入に関する臨床試験の報告書から無作為に選んだ142件を調査したところ、有害性をわざわざ取り上げたものはごく一部であり、平均して臨床試験の報告書は結果欄の1/10ページを使って有害性を論じていた(Papanikolaou, Churchill, Wahlbeck, & Ioanidis, 2004)。

18 CDER(Center for Drug Evaluation and Research)はFDAの一部である。FDAが提供する規制を痛烈に批判した証言の全文は、オンラインで閲覧できる。

19 (Papanikolaou, Christidi, & Ioannidis, 2006).

20 (Eyding et al., 2010)。この事例の詳細については、(Goldacre, 2012)を参照されたい。

21 関連する引用文献は、(Bombardier et al., 2000)、(Curfman, Morrissey, & Drazen, 2005)、および(Bombardier et al., 2006)。心血管系の有害性に関するカットオフ日は2000年2月10日であったが、問題の有益なパラメータである胃腸系イベントのデータ報告のカットオフ日は2000年3月9日であり、この試験は有害性よりも有益性のデータを収集する時間がより長かった。したがって、この試験は9.4節で提示した論文のもう一つの例となる。彼が「Vioxx debacle」と呼ぶものの詳細については、(Biddle, 2007)を参照されたい。

22 会社(イーライリリー)は、「何百ものリリーの内部文書や会社のトップマネージャー間の電子メールメッセージによると、ジプレキサの健康リスクをごまかすために10年にわたる努力をした」(Berenson 2006)。

23 パロキセチンをめぐる組織的な偏見と不正には、製造元(グラクソ・スミスクライン社)から精神医学研究者への数百万ドルの未公表の支払い、パロキセチンが子どもには効果がないことを示す証拠の故意の隠蔽、横行する出版バイアスがあった。この件に関する長編の解説は、(Bass, 2008)を参照されたい。オセルタミビルについては、(Doshi, 2009)を参照のこと。

24 会社の研究部長が社内メールで「FDA、Nissen、GSKはいずれも虚血イベントのリスク増加に関して同等の結論を出しており、その範囲は30%から43%だ!」と書いている。(Harris,2010)と書かれている。

25 この事例については、Goldacre(2012)に記載されている。2009年、リモナバントが精神疾患や自殺のリスク上昇を引き起こしたため、市場から撤去された。

26 同社の研究責任者は、社内メールにこう書いた: ”私は、できるだけ早く前会長のフレッド・スパーリングと話すつもりである。行動方針は2つあると思う。一つは、私たちが事実を明らかにした後でも、故意に私たちの製品を中傷したとして彼を訴えること、もう一つは、アバンディアのために綿密に計画された攻勢をかけることである」この一節は、米国上院財政委員会の報告書に引用されている。この報告書は、「ジョン・ビューズ博士の脅迫と糖尿病治療薬アバンディア」と題され 2007年に発表され、オンラインで閲覧することができる。

管理

第12章 結論

12.1 ジェントルメディスン

著名な医師であるウィリアム・オスラー卿は、「薬を飲みたいという欲求は、おそらく人間を動物から区別する最大の特徴である」と主張した。本書で主張する論文によれば、私たちはこの欲望を抑えなければならない。私たちは医療介入を減らすべきであり、医師は医療介入を減らすべきであり、政策立案者は医療介入を減らすべきであると考える。極端であり、あり得ない考え方は、絶対的不介入主義であり、医療介入を決して求めてはならないとするものである。同様にありえない考え方は、本書で提示された議論のほとんど、あるいはすべてに同意するが、医療介入の使用を変えないというものであろう。医療ニヒリズムの議論は、患者には医療介入に対する顕著な懐疑心を、医師には自由に使える治療手段に対する謙虚さを動機づける。

第3章では、過剰治療(overtreatment)の概念、すなわち、私たちの多くが、必要以上に医療介入を消費しているという見解について述べた。この考え方は、主流医学の中でさえも広く浸透している。例えば、BMJ誌の前編集長リチャード・スミスは、健康ジャーナリストのパトリック・モイニハンとともに、社説のタイトルを「薬が多すぎるのか」という挑発的な問いに、「ほぼ間違いない」と答えている(2002)。医療ニヒリズムは、過剰診療のテーゼを支持する。私が主張したように、医療介入に対する信頼が低下するならば、私たちはより少ない薬を消費すべきなのである。私たちは現在、過剰に薬を消費している。私たちは過剰な治療を受けているのだ。

歴史上、治療に対する保守的なアプローチは人気があった。紀元前5世紀のヒポクラテスの書物には、Vis medicatrix naturae(自然の治癒力)が強調されており、健康を得るためには適切な栄養補給と運動が重要であることが強調されている。15世紀から19世紀にかけては、芸術家、作家、科学者、医師たちによって、数多くの不干渉主義が宣言された。一方、20世紀には、治療に対する積極的なアプローチが行われるようになった。今日、主流医学に代わる治療法として、カイロプラクティック治療、ハーブ療法、鍼灸治療が行われている。私は、このような後者の医療行為に使われることのある「La médecine douce(優しい医療)」という言葉を引用している。(私は、この言葉を借用しただけで、関連する原理や実践を借用したわけではないことを明確にしておく)。La médecine douceは、穏健な治療的保守主義を奨励するものであり、医療が優しくあることを奨励するものである。

オスラーの別の言葉が、優しい医療の原則を物語っている: 「医師の最初の仕事の一つは、大衆に薬を飲まないように教育することである」医療ニヒリズムの主張からすれば、治療はより積極的でなく、より穏やかであるべきである。本書で紹介する多くの例を含む、コレステロールや血圧を下げたり、精神疾患を治療するための医薬品など、最も一般的に用いられている医療介入については、医療ニヒリズムの主張が最も説得力を持つ。このような介入やそれに伴う疾患に対しては、医療的介入を減らし、生活習慣への介入(例えば)を増やし、より気を配るという「la médecine douce」が必要なのではないだろうか。

「Choosing Wisely」(賢く選ぶ)と呼ばれる運動は、効果的でなく安全でない介入の使用を医師に止めさせることを目的としている(Malhotra et al., 2015)。この運動は、多くの国の数十の医学会で採用されている。これは医学の正しい方向性である。優しい医療とは、すでに特定の薬を服用している人はそれをやめるべきだというナイーブな見解ではない。私たちは、介入による治療を開始することの有効性について、コントロールされた実験環境で検証された大量のエビデンスを有している。しかし、治療を中止した場合の効果については、信頼できるエビデンスがほとんどないのである。

優しい医療を広く実施する前に持つべき証拠の一例として、次の研究を考えてみよう。研究者たちは、平均7.7種類の薬を服用している高齢者のコホートに、薬物中止プログラムを適用した。標準的な治療プロトコルを適用し、患者とその主治医の同意を得て、研究者は4.2種類/患者、合計256種類の薬剤を中止した。このうち、症状の再発を理由に再投与されたのは6剤(2%)のみであった。薬物中止による有害な影響はなく、88%の患者が健康状態の改善を報告している。薬をもっとやさしくすれば、私たちはもっと健康になれるのである1。

しかし、これはあくまで提案である。では、具体的にどのようにすればいいのだろうか。第1章で、19世紀の医師ジェイコブ・ビグローが、医療介入は病気の改善にほとんど効果がないとする医療虚無主義者であり、苦しみを和らげるために医療介入は必要ないと主張したことを思い出してほしい: 「枕をひっくり返したり、季節に合った水を患者に与えたりする者は、その苦しみを和らげる」(1835)のだ。苦しんでいる人の世話をするだけでも、価値があり、役に立つのである。残念ながら、優しい医療の概念空間は十分に探求されていない。医療介入の魔法の弾丸モデル(第4章参照)に過度に焦点が当てられており、病人をケアするために使用できる他の優しい選択肢の範囲に関する研究は比較的少ないのが現状である。第2章の分析を援用すれば、医学は病気の因果的根拠と病気の規範的根拠を狭く解釈し、前者に焦点を合わせてきたのである。そのうちのいくつかは、§12.3で述べる。ここでは、医学研究の優先順位を修正する一つの方法として、やさしい介入方法の研究に多くのリソースを割くことを論じている。要するに、医療はより優しくあるべきであり、医療がこれを達成する方法を学ぶには、医療研究のアジェンダを再編成する必要がある。

優しい医療とは、医師が全く介入しないという大胆な提案ではない。私たちの武器には魔法の弾丸がいくつかあり、それを使うべきなのである。むしろ、優しい医学とは、医師が介入すべきことを現在よりも少なく、おそらくははるかに少なくし、私たちの生活や社会を変えることで健康を改善しようとする、より控えめな提案である。

12.2 方法論の細部を調整する

私が明示した医学ニヒリズムの主張の中には、医学研究の方法論的欠点に基づくものがある。例えば、第6章ではメタアナリシスの脆弱性について、第7章では医学研究におけるエビデンスの質を評価するツールの多様性について、第8章と第9章では無作為化試験の多くの特徴が、介入の有効性を系統的に過大評価し、害を過小評価することを生み出していると主張する。このような問題に対する単純な対応は、指摘された欠点を解決するために研究方法を変更することである。このような医学的ニヒリズムへのアプローチを私は「ディテール・トゥイーキング」と呼んでいる。

ディテール・トゥイーキングは、エビデンス・ベースト・メディシンのコミュニティで多くの人が促し、発展させてきたもので、重要な戦術である。例えば、いくつかの章では、出版バイアスの偏在と悪質な認識論的影響について述べていた。最近、主要な医学雑誌の編集者は、データ収集の前に試験を事前登録することを要求している。これは、その後のエビデンスをレビューする人は、出版バイアスの程度を推定できれば、介入をより適切に評価でき、これは試験の登録によって支援されるという考え方である2。同様に、Pハッキング(第8章参照)を軽減するために、試験で測定される主要転帰は事前に指定され遵守すべきとの方法論の指針を示している。測定器の不備の問題に対処するため、より良い測定器(より高感度で特異的なもの)を開発することが必要である。12.4節では、医薬品承認規制の文脈で、細部を調整することが有用である他のいくつかの方法について述べているが、本書を通じて方法論の細部を調整することができる多くの方法を指摘しているので、ここで提案を繰り返すことはしない。

細部を調整することは、今日の医学研究の問題の多くを解決することになる。しかし、細部を調整しても、医療ニヒリズムのもっともらしさを緩和することはできないだろう。それは、いくつかの根本的な理由からだ。第一に、いくら細部を調整しても、多くの疾患の複雑な基礎や、生理学的システムに対する介入の複雑な因果関係を変えることはできない(4章参照)。第二に、詳細な調整が行われれば行われるほど、医療介入の有効性の推定値は低下する。医学研究の欠点は、体系的に有効性を過大評価する方向に偏っているため、欠点が緩和されれば有効性の推定値は減少する(第8章、第9章、第10章を参照)。そして、もし有効性の推定値が下がれば、医療ニヒリズムの中心的な主張の一つを強化することになる(第11章参照)。第三に、細部を調整することで、研究からすべてのバイアスを排除することはできない。しかし、どんな実証的手法も完璧ではないし、有効性を示すことに強いインセンティブがある場合、有効性を誇張するためにバイアスが利用される可能性がある。第四に、詳細な調整は、医学研究におけるいくつかの重要な問題、例えば、病気の捏造(第3章参照)、魔法の弾丸モデルに従わない健康を改善する重要な戦略の無視(第4章と§12.3参照)、非イノベーションのミートゥー薬の拡散(§12.4参照)とは無関係であることである。

しかし、医療ニヒリズムの原動力となる問題を解決するためには、細部へのこだわりは不十分である。

12.3 研究の優先順位を再考する

医療ニヒリズムは、医療介入の有効性に対する信頼を低下させるべきであるとする。健康増進のための戦略として、魔法の弾丸モデルは、多くの人が考えているほどには役に立たないことが証明されている。魔法の弾丸は、インスリンやペニシリンのような初期の成功例の期待に応えてはいない(第4章参照)。健康は明らかに重要な目標であり、人間が豊かになるための基本的な側面である。では、医療ニヒリズムの議論を踏まえて、私たちはどのように健康の維持・増進に努めるべきだろうか。どのような研究プロジェクトに優先的に取り組むべきなのだろうか。

これらの問いに対する一つの答えは、社会疫学や医学社会史の研究から得ることができる。これらの学問は、健康の原因や健康の不平等の原因を明らかにすることに関心がある。これらの分野では、健康や健康格差の最も重要な原因は医学的介入ではなく、むしろ清潔な飲料水や栄養へのアクセス、社会資源の公平な分配など、社会のより広い特徴に関係しているという点でほぼ一致している。先に述べたように、トーマス・マキューンは、産業革命期に始まった長寿化とそれに伴う人口増加は、医療介入(結核に対する抗生物質など)とはほとんど関係がなく、むしろ社会経済条件の改善、特に食事の改善によって引き起こされたと主張した(1976a)。人々は医薬品のような介入が健康の重要な原因であると考える誤った傾向があるため、マキューンは、人々は医学の治癒力にあまりにも大きな期待を寄せていると主張した(1976b)。そうではなく、より広範な社会経済的な健康状態に関心を持つべきだというのである。マキューン論文は、そのように呼ばれ、批判を集めている。しかし、批判的な人たちでさえ、平均寿命の伸びなどの著しい健康増進は、医学的介入によるものではなく、清潔な飲料水へのアクセス向上など、より広範な社会的介入によるものであるとするのが普通である。

関連する論文は、疫学者のMichael Marmot (2004)によって展開されている。Marmotは、社会経済的地位(社会における地位や階級)は、所得やライフスタイル、質の高い医療へのアクセスなど、社会経済的地位と関連する生活の他の特徴をコントロールした後でも、人の健康の重要な原因であると主張している。Marmotの理論では、社会的地位が高い人ほど自分の人生をコントロールできるという感覚を持っており、この自律感の高まりが健康にプラスの影響を与えるとしている。Wilkinson(2006)も、不平等と健康状態の悪化の媒介者はストレスであるとして、同様の主張をしている。ストレスや自制心を媒介とした社会的地位と健康との因果関係を考えると、社会的地位の感覚にバランスを持たせ、ストレスを軽減したり、自制心を高めたりするような社会構造の改変に取り組むことができる。

つまり、メディカル・ニヒリズムの一つの示唆は、研究の優先順位を、医薬品などの医学的介入から社会的介入へと変更することができるということである。

この提案は、新たな魔法の弾丸となりうるものの研究を行うべきではないという極端な見解として理解されるべきではないだろう。医薬品の研究にリソースを割くのであれば、魔法の弾丸のような理想に近づく可能性のある介入策を研究すべきです(むしろ、効果量が小さいミートゥー薬と言うべきだろう)。新しい抗生物質を開発することは非常に価値がある。抗生物質に対する細菌の耐性が発達し、私たちが自由に使える有効な抗生物質はますます少なくなっている。感染症は致命的であり、すぐに広がってしまうため、また、抗生物質が非常に有効であるため、抗生物質耐性の発達は大きな問題である。製薬会社はここ数十年、新しい抗生物質の研究をほとんど避けてきた。スタチンや抗うつ剤など他の種類の薬(患者は何年も服用する)と違って、抗生物質を服用する期間は数日から数週間程度であり、耐性菌の発生という脅威から、医師は抗生物質の処方に慎重になったためだ。これらの理由はいずれも、抗生物質が企業にもたらす利益が少なくなることを意味している。このように、製薬会社にとっては、儲かる薬を開発しようというインセンティブが働くため、最も効果的で必要とされる医薬品、つまり魔法の弾丸のような理想に近づくような医薬品が軽視されるという逆方向の状況が生まれている。

生物医学研究の多くの論者は、「10/90ギャップ」と呼ばれる、世界人口の90%(世界の最貧困層)の健康問題に、世界の医学研究資源の10%しか割かれていないことを指摘している。Pogge(2005)は、10/90ギャップは誇張かもしれないが、重要かつ道徳的に重要な問題を表していると指摘している。この問題を明確にするために、ReissとKitcher(2009)は、「秩序ある科学」という概念を適用している。彼らは、医学が秩序あるものであるためには、「フェアシェア」の原則を守る必要があると主張する。つまり、特定の病気に費やされる資源の量は、他の病気と比較して、その病気によって引き起こされる苦痛の量に比例しなければならない。医学ニヒリズムが、医学研究の成果物はあまり効果的でない、特に富裕層の健康問題を対象とした成果物であると考えることから、医学ニヒリズムは、富裕層の健康問題に費やされる資源量の不均衡を懸念する人々を支援するものである。10/90ギャップと医療ニヒリズムは、研究資源の配分を修正すべきことを示唆している(そのような修正のための様々な提案については、12.5節で述べる)。

ヨアニディス(2005b)がブレイクスルー論文で提案した、研究の優先順位を修正する提案は、一見奇妙に聞こえる。ヨアニディスは、利益相反のある研究者が採用する偏った手法の蔓延、事前確率の低い仮説、効果量の小ささなど、マスターの議論と同様の考察に基づいて、発表された研究結果のほとんどが偽であり、医療ニヒリズムと一致する結論であると論じている。ヨアニディスは、この問題に対処する一つの方法として、事前確率の高い仮説を研究することを提案する。そうすれば、仮説の事後確率が高まり、研究結果が真である可能性が高まる。というのも、事前確率の高い仮説の多くは、より多くの証拠を必要としないからだ。例えば、頭痛を和らげるアスピリン、朝の目覚めを良くするコーヒー、スカイダイビングの落下速度を遅くするパラシュートなどを検証するのは無駄である。一方、事前確率の低い仮説を検証することも、無駄で有害である。本書の第1部の教訓を考慮するならば、多くの症状に対して魔法の弾丸があると考える理由はほとんどなく、したがって、そのような魔法の弾丸があるという仮説には低い事前確率が割り当てられるべきであり、そのような仮説に関する研究を避けることで膨大な研究資源を節約し、効果のない有害な介入の導入を最小化することができる。

例えば、精神状態の物理的基盤が非常に複雑であることから、気分障害の化学物質欠乏症仮説は低い事前確率を割り当てられるべきである(第2章参照)。このことは、これらの化学的レベルを調節する介入は、生理学的効果の大きな連鎖的な複雑さを持つという事実(第4章参照)とともに、気分障害の化学的欠乏の疑いを対象とするそのような介入の有効性と安全性に関する仮説は、低い事前確率を割り当てられるべきであるということを意味している。もしヨアニディスの提案に従えば、そのような介入に関する研究は行われず、気分障害に対する介入は効果がなく(11章参照)、有害であると思われる(9章参照)現在の状況を避けることができたであろう。

医学研究の優先順位を変更すべきもう一つの方法は、12.1節で述べたような効果的な穏やかな介入を発見するために、より多くの資源を割くことである。ある集中治療医が書いた本からの次の一節を考えてみよう:

医学研究界は、遺伝子、タンパク質、分子経路を追い求めるようになり、病気に直面した人間とはどういうものかを無視しがちになってしまった。分子医学と最新の医薬品治療薬にレーザー光線で焦点を当てた結果、生命を脅かす病気の人間的側面に関する研究は軽視されることになった。 (ブラウン、2016)

遺伝子、タンパク質、分子経路という魔法の弾丸に焦点を当てたが、全体として期待外れだった(第4章参照)。優しい医療は、病気に直面している人がどのようなものだろうかに関心を持つことである。このほかにも、生活習慣への介入など、より深く追求されるべきやさしい医療がある。例えば、Naciとヨアニディス(2013)は、薬物介入と比較した運動の有益性を系統的に検討し、冠動脈性心疾患と糖尿病前症の二次予防のための運動と薬物介入の間で死亡率に検出できる差はなく、脳卒中患者の死亡率低減には運動が薬より有効であることを明らかにした。私たちは、健康増進のためのこの種の戦略を調査した高品質のエビデンスをほとんど持っていない。もっと増やすべきだろう。

12.4 規制と帰納的リスク

医療ニヒリズムに対する合理的な対応は、規制当局による医療介入の精査の強化を求めることである。第8章(§8.5)で私はFDAの承認プロセスについて説明し、それが多くの測定上の問題に苦しんでいることを論じた。ここでは、この規制基準を「帰納的リスク計算」の観点から明確化し、この帰納的リスク計算を改善する方法を提案する。

FDAは新しい医薬品の導入を過剰に規制していると主張する批評家がいる。これらの批評家は、新薬承認に必要な認識基準は煩雑であり、新薬の研究を阻害し、薬価を上昇させるとしている4。また、FDAは新薬の導入を過小評価しているとする批評家もいる。新薬承認に必要な認識基準が低すぎるため、効果のない薬や安全でない薬が承認されてしまうという批判である。このような批判は、学術研究者(本書のいくつかの章で取り上げた2007年のロシグリタゾンのメタアナリシスを行ったSteve Nissenなど)、科学団体(米国医学研究所など)、さらにはFDAの職員(疫学者のDavid Grahamなど)からも出されてきた。

ルドナー(1953)によって提示され、ダグラス(2000)らによって拡張された帰納的リスクに関する著名な議論と同様に、非帰納的価値は医薬品規制における認識基準の設定において役割を果たす5。医薬品の有効性と安全性を評価するとき、利用可能な証拠に基づいて誤った推論を行う可能性があり、帰納的リスクに直面する。少なくともいくつかの実験用医薬品は有効であり(多くは有効ではない)、ほとんどの実験用医薬品が少なくともいくつかの意図しない有害な効果を引き起こすため、完全に安全なものはほとんどない。規制当局は、あらゆる証拠に基づいて、実験用医薬品の相対的な有効性と有害性のプロファイルについて判断を下さなければならない。その際、規制当局は推論を行わなければならないが、その際、2つの基本的な誤りがある。すなわち、ある医薬品が実際には有効性-有害性プロファイルが良好でないにもかかわらず、その医薬品が有効性-有害性プロファイルが良好であると推論することができる、あるいはある医薬品が実際には有効性-有害性プロファイルを有しているにもかかわらず、それがないと推論できる。前者の誤りは、不当な医薬品承認につながり、相対的に効果が低く安全でない医薬品が利用できるようになることで、患者に害を及ぼす可能性がある。後者の誤りは、不当な医薬品不承認につながり、比較的有効な医薬品が使用できなくなることで患者に損害を与え、医薬品製造者の経済的利益を損なう可能性がある。

この2種類のエラーを回避するために、規制当局は多くの戦術を採用している。これらの戦術の多くは互いにトレードオフの関係にあり、一方の過誤を犯す確率を下げる戦術を採用すると、他方の過誤を犯す確率が高くなる。例えば、医薬品の承認に際してより肯定的な試験を要求すると、不当な医薬品の承認の確率は低下するが、不当な医薬品の却下の確率は上昇する。極端な例を挙げると、規制当局が不当な医薬品却下の誤りを犯さないようにするための戦術は、すべての新薬申請を承認することであり、それによって不当な医薬品承認の確率が大幅に増加する。逆に、規制当局が不当な医薬品認可の誤りを犯さないようにするための戦術は、すべての新薬申請を却下することで不当な医薬品却下の確率を大幅に増加させる。私たちは帰納的リスクの尺度を概念化することができる。尺度の一方の端は、不当な承認の誤りが回避される確実性(したがって、不当な医薬品却下の誤りが犯される可能性が高い)、もう一方の端は不当な医薬品却下の誤りが回避される確実性(したがって、不当な医薬品認可の誤りが犯される可能性が高い)であり、尺度の一方の端は不当な承認が行われる可能性の高いリスクである。

規制当局は、自分たちの政策がこの帰納的リスクの尺度のどこに位置するのかを判断しなければならない。これが帰納的リスク計算である。この帰納的リスク計算には、エピステーミズム以外の価値観が影響する。FDAの過剰規制と過小規制に対する批判は、この計算の観点から理解することができる。ある批判者は、FDAの帰納的リスク計算が、不当な医薬品承認という誤りを犯さないという極端に規制姿勢を置きすぎているとし(過剰規制)、他の批判者は、FDAの帰納的リスク計算が、不当な医薬品却下という誤りを犯さないという反対極に規制姿勢を置きすぎているとするのである(過小規制)。

前章の資料の恩恵を受けて、規制基準の数々の問題点を明確にすることは簡単だ。基準は、試験で測定しなければならないパラメータ(第3章参照)とその測定に使用できる機器(第8章参照)に関して緩く、基準は有効性の優れた統計的尺度に依存していない(第8章参照)、基準は、新薬申請に至るまでの研究が医薬品の有害性プロファイルを適切に評価していないという事実を無視している(第9章参照)、基準は、多数のバイアスに苦しむ試験で満たすことができる(10章参照)、基準は出版バイアスの普遍性を無視(5,8、10章参照)している。これらの問題は、FDAを規制不足とする人々を支持するものである。以下では、これらの問題のいくつかに対処するために、帰納的リスク計算を再調整する方法をいくつか提案する。

Kitcherの帰納的リスクの文脈における秩序ある認証の概念(2011)を考えてみよう。帰納的リスク計算を熟考する理想的な熟議者は、患者やメーカー、社会全体の関連する非経験的価値を考慮し、医薬品承認のための帰納的リスク計算に対してバランスのとれた姿勢を求めるだろう。FDAの帰納的リスク計算がよりバランスを達成するための基本的な方法は、新しい医薬品の有効性と有害性に関するより良いエビデンスを要求することである。これを達成するためには、いくつかの簡単な戦術がある。

Pハッキングの問題(8.5節参照)に対処するために、リスク差の尺度(8章参照)のような、より適切な有効性の定量的尺度を医薬品承認の基準として採用するべきである。リスク差は、治療対象の疾患に関連する重要な患者レベルのパラメータについて、当該疾患の典型的な患者が介入から実質的な利益を受けると期待できるほど大きくなければならない(より正確には、リスク差は、医療介入の承認と使用が有用性を最大化すると期待できるほど大きくなければならない)。さらに、測定すべき主要アウトカムの選択を含む試験デザインと分析計画は、試験の前に公開されるべきであり、デザインや分析計画からの逸脱は、規制当局によるエビデンスの質の評価を軽減するものである。

新薬の申請が承認される前に、試験は、現実の環境において最終的にその薬を使用する典型的な患者の多様性を表す広範な対象において、その薬が有効で比較的安全であることを示すべきである。治験は、実験薬の有害性を厳密に調査するように設計されるべきであり、問題となっている疾患を忠実に表現する測定機器を使用すべきである。

出版バイアスに対処するため、すべての試験データは公開されるべきであり、試験登録は必要であり、規制当局によって強制されるべきである。規制当局の帰納的リスク計算は、すべての試験から得られたすべてのエビデンスを取り込むべきである。金銭的利害の対立が試験デザインの微妙な側面に偏った形で影響するという懸念を軽減するために、規制当局は、問題のメーカーから完全に独立した組織(大学や他の政府機関など)が実施した試験からの証拠を要求すべきである-これについては§12.5で述べる。

CDERの資金の多くは、新薬申請の評価を受けるために産業界から支払われるユーザーフィーに由来しており、このユーザーフィーが薬剤審査官の給与を支払っているため、審査官は新薬申請のスポンサーに従順であるという批判がある。さらに、FDAは内部スタッフと外部の科学コンサルタントで構成される諮問委員会に依存しており、これらの委員会はしばしば重大な利害対立を抱えている7。最後に、CDERには新薬を承認する部署と承認された薬の有害性を追跡する部署の両方があるため、制度上の利害対立が生じると批判する。このように、米国の規制を改善する一般的な方法は、FDAの制度構造を変更することである。

医療介入の規制を強化すべきだという主張に対する予想される反応は、規制を強化することで研究やイノベーションを阻害し、それによって利用可能になる価値ある介入の数を減少させたり、利用可能になる時期を遅らせたりするというものだ。医療ニヒリズムは、規制の有無にかかわらず、効果的な介入はいずれにせよ多くないということを意味する。さらに、多くの新しい治療法は、既存の薬とよく似た、単なるミートゥー薬であり、その効果は微々たるものである場合が多い。製薬業界の批評家が指摘するように、有効な薬よりも効果的なマーケティングによって利益を得ることができるが、規制当局が認識基準を高めたとしても、利益インセンティブは残るため、規制強化によって、企業はより高い基準を満たすために、より有効な薬の開発に拍車がかかるかもしれない。

関連する反論として、医薬品開発にはすでに非常にコストがかかっており、医薬品承認のためのエピステミック・スタンダードを高めることは、このコストを増大させるというものがある。このコストは患者に転嫁され、多くの医薬品はすでに高価であるため、規制の強化は医薬品の費用をさらに負担させることになる、というのがこの反論である9。この反論は、多くの理由から説得力がない。患者や支払者にとって重要なのは、医薬品のコストだけではない。つまり、薬剤の有効性によって患者にもたらされる利益を、薬剤のコストと薬剤によって引き起こされる害と比較して相対的に評価する。このより複雑な特性を評価するためには、医薬品の有効性と有害性に関するより良いエビデンスが必要である。さらに、規制上の帰納的リスク計算を修正するために上で提案された提案の多くは、開発に大きなコストを追加することのない単純な提案である。さらに、新薬の費用の大部分は、特許制度によって可能になった新しい医療介入の製造業者に与えられた一時的な独占の結果であるため、消費者の費用に関する懸念は見当違いである(12.5節参照)。

規制当局の不均衡な帰納的リスク計算の問題のいくつかに対処する興味深い提案は、Biddleが「医薬品の評価のための敵対的手続き」(2013)と呼ぶものである。これは、アーサー・カントロウィッツの科学法廷の概念に基づき、2つのグループの対話者が医薬品のメリットを議論するもので、一方のグループは医薬品のスポンサーが任命し、もう一方のグループは独立した科学者、消費者擁護者、医薬品の先行批判者で構成される。このアイデアは、実施に際して多くの詳細を検討する必要があるが、不均衡な規制の誘導的リスク計算に関連する問題のいくつかを軽減することができる。しかし、次のセクションでは、医療介入のすべての評価を、その介入の製造者の権限から外すことによって、さらに一歩進めることを提案する。

12.5 医学研究に革命を起こす

方法論の細部の調整(12.2 節参照)、研究の優先順位の再考(12.3 節参照)、規制の再調整(12.4 節参照)という上記の提案が、医療ニヒリズムを動機づける問題に適切に対処できる可能性について悲観的になることもあるだろう。そうであれば、もっと必要なことがあるのではないか、と考えるかもしれない。医学研究の社会的・法的背景を大きく変えることを提案する人もいる。例えば、Brown(2008)は、医学研究の社会化、医学研究の発見に対する特許の廃止を主張している。ブラウンは、これに対して2つの論拠を示している。第一の主張は、医学研究は臨床治療の基礎となるものであり、したがって、医療提供の社会化を支持する政治的配慮は、医学研究の社会化を支持する配慮でもあるという考えに基づいている。多くの人は前者で納得しているのだから、後者でも納得するはずだ。特許で保護された医学研究はあまり成功しなかったが、物理学や天文学などの他の科学分野や、ソークのポリオワクチンのような医学の大発見は、知的財産権法がもたらす経済的インセンティブがない中で繁栄してきた、というのが彼の第二の論拠である。

ブラウンが提案する特許の廃止は、医学研究の強力なインセンティブである利潤の動機を排除することになるというのが、予想される反論である。この動機がなくなれば、患者のための新薬が少なくなってしまうというのがこの反論である。しかし、この反論は、少なくとも3つの理由から説得力に欠ける。第一に、本書の中心的な論旨は、とにかく効果的な治療法が少ないということであり、したがって、医学的発見に対する知的財産権保護を放棄しても、効果的な新しい治療法のパイプラインにはあまり影響を及ぼさないというものである。第二に、近年、利潤追求のために導入された新薬の多くは「me-too」薬であり、病気治療における大きな進歩ではなく、むしろ市場にある既存の薬と非常に類似した製品であることである。第三に、この反論は、知的財産法の古典的な正当化、すなわち、知的財産法がイノベーションを促進するという功利主義的正当化に依存している。しかし、これは経験則に基づく前提であり、Brown (2008)やAngell (2004a)が主張するように、医学やおそらくより一般的な科学の場合には不当である(Biddle (2014)などが主張し、ミートゥー医薬品の事例が示すように、特許は実際に研究を妨げることがある)。

ガリレオによる木星の衛星の発見、ダーウィンによる自然選択による進化の発見、アインシュタインによる一般相対性理論など、偉大な科学の進歩は、利益動機によって加速されたものではない。このような金銭的な動機によらない発見の動機は、医学においても重要である。医学における最も重要な発見、例えば病気の細菌説などは、利益を動機としたものではなく、魔法の弾丸(第4章参照)やX線などの医学上の大発見のほとんどは、特許で保護されていなかった。インスリン(第4章の魔法の弾丸の一つ)の発見者であるバンティングとベストは、その発見に対して特許を求めなかった。彼らは、インスリンが命を救うことを目の当たりにし、インスリンは必要な人に提供されるべきであると考えたからだ。また、アレクサンダー・フレミングは、ペニシリンの特許を放棄して、その普及に努めた。11 20世紀最大の医学的発見の一つであるポリオワクチンの開発者、ジョナス・ソークは、ワクチンの特許は誰が持っているのかと問われ、「特許などない。太陽に特許を取ることができるだろうか?

Reiss and Kitcher (2009)は、医学研究を管理する知的財産法を修正すべきであるとブラウンに同意している。しかし、彼らの提案は、特許保護を廃止するのではなく、特許保護の期間を徐々に縮小し、その縮小がイノベーションのペースに与える影響を検討することである。(米国では現在、新しい医学的介入は20年間保護されている)。12.5で述べた10/90ギャップの問題に対処するために、ライズとキッチャーは、世界の最貧困層を苦しめる傾向にある顧みられない病気に焦点を当てたグローバルヘルス研究所を提案している。これは、Pogge (2005)と対照的である。Poggeは、産業製薬研究の成果物が世界の疾病負担を軽減する程度に、産業製薬研究に報いる仕組みを提案している。ReissとKitcherは、新薬申請のスポンサーがFDAに支払うユーザーフィーを廃止するなど、より控えめな提案もしている。医学的ニヒリズムによれば、多くの治療法は多くの人が考えているほど有用ではなく、知的財産法を適切に執行すれば、効果のない治療法の特許保護を排除することができ、これにより本当に有用な治療法の開発にさらに拍車をかけることができる。

中央集権的な政府機関が資金を提供する臨床試験は、民間が資金を提供する臨床試験よりも質が高い傾向がある。第11章で取り上げたADHDのメチルフェニデートに関するMTA試験について考えてみよう。この試験は、産業界が資金を提供したほとんどの試験よりもはるかに長い期間にわたって行われ、患者の熱心なフォローアップが行われた。大規模な公的資金による試験は、バイアスの脅威を軽減することができる。バイアスは、医療介入の有効性を過大評価し、害を過小評価する方向に系統的に偏っているため、公的資金による試験は一般的に(MTA試験のように)より小さな効果量を示している。第10章では、国立心肺血液研究所が資金提供した臨床試験の二次研究を紹介したが 2000年以降、平均リスク差はゼロであり、これらの臨床試験でテストされた介入は被験者に何の利益も与えなかった。公的資金が投入された臨床試験の方が、より真実に忠実なのである。医療介入の知的財産をなくすべきだというブラウン氏の意見に反対することもできるし、ブラウン氏の意見には賛成だが、そのような変化はすぐには起きないだろうと皮肉ることもできるだろう。しかし、認識論的な理由から、医療介入はその製造者によってテストされるべきではないという意見には同意できるだろう。その代わり、介入は独立した学術研究者や政府機関によってテストされるべきである。

12.6 医学の芸術と人間への愛

本書の最後に、西洋医学の象徴的な親であるヒポクラテスの言葉を紹介する: 「医術が愛されるところには、人間愛もある」本書はその精神に基づいて書かれたものである。人間愛が、臨床、科学研究、規制など、あらゆる医療技術の向上への動機づけとなり、逆に、医療技術の見直しが、人間の状態の改善に寄与することを期待している。医療ニヒリズムは、医療技術の改善には、魔法の弾丸のような新しい医療介入の開発に焦点を当てるのではなく、医療をより優しく、最終的にはより効果的にするための社会構造と戦術の修正に焦点を当てることを提案する。

医療ニヒリズムは、前世紀に考え出された魔法の弾丸のような医療介入は、私たちの健康を改善し維持するために有効でないことがあまりにも多く、少なくとも私たちが考えがちなほどには有効ではないと考える。医療はもっとやさしくあるべきだ。ヒントを与えてくれるのが、ヒポクラテスのもう一つの主張である: 「歩くことは最良の薬である」本書で擁護する医療ニヒリズムの焦点となっている、世界の裕福な地域で多くの人が罹患している病気(2型糖尿病、心臓病、うつ病など)には、ヒポクラテスの知恵が依然として有効である。世界の貧しい地域で多くの人が罹患している病気については、医学の社会史家や社会疫学者の教訓が適用される。このような状況で健康を改善するための最も効果的な介入策は、蚊帳、清潔な飲料水、栄養改善、社会経済的平等の拡大といったものだ。私たちは、前世紀に開発された医療介入の魔法の弾丸モデルから、人類の健康に真に役立つ社会の再構築の方法へと注意を移す方がよいだろう。

  • 1 参照(Jena, Prasad, Goldman, & Romley, 2015)。別の研究では、心不全や心停止の患者の死亡率を、循環器学会の開催日(学会で多くの上級循環器医が外泊していた時期)に比較した。この研究では、心臓病学会の開催期間中に重度の心臓疾患を持つ患者の死亡率が低いことが判明した(Garfinkel & Mangin, 2010)。その意味するところは、そのような患者は、シニアで有名な心臓病専門医が治療すると、より悪くなるということであった。解説は(Emanuel, 2015)を参照。
  • 2 金銭的利益相反の懸念(第10章参照)に対処するため、一部のジャーナルやその他の組織は、研究者が金銭的関係を開示するよう求めている。このような政策は、利益相反が医学研究の偏りを悪化させる脅威を遮断するには不十分である-(de Melo-Martin & Intemann, 2009).
  • 3 ReissとKitcherが指摘するように、例えば、「マラリア、肺炎、下痢、結核は合わせて世界の疾病負担の21%を占めるが、健康研究に充てられる公的・私的資金の0.31%しか受け取っていない」のである。
  • 4 このような批判は、自由市場経済学者や機関から出ることが多い。例えば、(Friedman & Friedman, 1990)、(Becker, 2002)などを参照。
  • 5 科学における価値観に関する最近の文献の一例として、(Steel, 2010)、(Elliott, 2011)、(Steele, 2012)、(Wilholt, 2012)を参照のこと。
  • 6 FDAの疫学者であるDavid Grahamは、「FDAは本質的に製薬業界に有利なように偏っている」と主張している。FDAは製薬業界を顧客とみなし、その利益を代表し、増進させなければならないと考えている。FDAの主要な使命は、安全性や必要性に関係なく、できるだけ多くの医薬品を承認することである」(2005)。
  • 7 Resnik(2007)とKrimsky(2003)は、FDA諮問委員会の会議を調査した調査について述べている。大半の会議において、金銭的利害関係のある委員が少なくとも一人おり、ほとんどの会議において、半分以上の委員が「会議のテーマに直接関係する」金銭的利害関係を有していた(Resnik, 2007)。第10章参照。
  • 8 経済学者のゲイリー・ベッカーが「新薬は、過去50年間に訪れた平均寿命と生活の質の両方における急速な進歩の主要な力である」(2002)と述べているように、こうした見解によれば、医薬品承認のための認識基準を高めることは、新薬の開発を妨げることになり、ひいては私たちの健康を阻害することにつながる。FDAの現総監であるロバート・カリフ氏もこのような考えを持っているようで、カリフ氏は最近のプレゼンテーションで、規制はイノベーションの障壁であると主張するスライドを発表している。
  • 9 新薬のFDA承認には平均5億ドル以上かかるという試算もある(Resnik, 2007)が、この試算には研究よりもマーケティングと考えた方がよい事業活動が含まれているため、著しく膨らんでいるという意見もある(Angell, 2004b)。
  • 10 ビドルの提案に、科学的推論と医学研究のニュアンスに精通した科学哲学者が、このようなパネルに加われば、貴重な存在となるだろうと付け加えたい。ビドルの提案は、科学的評価に多様な視点を取り入れることで認識基準を高めることができると主張するフェミニスト認識論の研究によって動機づけられる。
  • 11 19世紀末から20世紀初頭にかけての医学における特許の詳細な歴史的研究については、(Gabriel, 2014)を参照のこと。

 

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー
error: コンテンツは保護されています !