臨床試験：精密医療にはより正確なエビデンスが必要

Contents

はじめに
不必要な副作用
相関関係と因果関係
プラズミック・プラットフォーム・スタディ（語用論的プラットフォーム研究）
第4レベルのエビデンスエビデンス
無作為化比較試験

Klinische Studien: Genauere Evidenz für Präzisionsmedizin notwendig

www.aerzteblatt.de/archiv/210058/Klinische-Studien-Genauere-Evidenz-fuer-Praezisionsmedizin-notwendig

無作為化比較試験では、個々の患者に関する利用可能な知識を除外する必要がある。そのため、精密医療の出現により、エビデンスの階層に4つ目のレベルを加えることが必要になっている。

はじめに

連帯責任に基づく健康保険制度の費用で提供されるサービスには、エビデンスの証明が必要であることは間違いない。しかし、プレシジョン・メディシンの時代には、確立されたエビデンスの基準はもはや十分ではない。医学の進歩のおかげで、がんのような複雑な病気のパターンに対する理解が深まっている。一方で、一般的に受け入れられている定義でエビデンスに基づいた医療という主張を正当化することは、日常生活では困難である。この主張を日常的に実現するためには、医師は個々の患者の治療の成功に対する個々の活性物質の予測精度をより正確にする必要がある。例えば、最も商業的に成功した10種類の新薬では、1人の患者を助けるために3人から 25人の患者を治療する必要がある(1)。個々の患者さんにどの薬剤が最適かという問いに答えることは、ますます難しくなっている。複雑さが増すにつれ、治療法の選択肢と患者の間の基本的な配分問題が発生する。

エビデンスをより正確に、より行動的にしていかなければ、この問題は将来的に悪化していくであろう。そのためには、医学の進歩に合わせて、予測精度の向上という意味で、エビデンスの水準を高めていく必要がある。その良い例ががんである。わずか10年前には、無増悪生存期間を延ばすための有効な治療法はほとんどなかった。ここでも、治療法の選択肢が増えている。米国メリーランド州にある国立がん研究所は、乳がんだけで78の薬剤をリストアップしている。がんでは、病期に応じて毎日の治療が重要になる。とはいえ、予測精度が低いため、医師は治療の状況に応じて最適な薬剤を見つけるために、長い試行錯誤をしなければならないことが多い。医師は、大きな不確実性の中で、患者さんと一緒に治療方針を決定する。

不必要な副作用

多くの患者さんにとっては、個々の患者さんに適した薬が実際にあるにもかかわらず、不必要な副作用が出たり、治療がうまくいかなかったり、最悪の場合は命を落とすことになってしまう。最適な薬が見つからないその理由は、利用可能なエビデンスの予測精度の水準が低いことにある。しかし、適切なバイオマーカーを用いれば、個々の患者の治療効果を最大90%まで予測できるようになったにもかかわらず、である。このエビデンスの可能性は使われないまま、システムの中で失われていく。しかし、なぜそうなったのか？

新薬は、臨床試験でその有効性と効果を示さなければならない（2）。このエビデンスは、医師が治療法を決定する際の外部の科学的根拠となる。個人に対するエビデンスの予測精度が高ければ高いほど、医師はより的を射た治療を行うことができる。

エビデンスは、いくつかのレベルに応じて分類される。レベル1は、ケーススタディや専門家の意見を参考にしている。レベル2では、エビデンスとして対照試験を参照している。レベル3aは無作為化比較試験（RCT）（囲み記事参照)レベル3bは無作為化比較試験のメタアナリシスを指している。レベル3はゴールドスタンダードと呼ばれ、ドイツでは診療報酬の基準としても使われている。患者に関連する評価項目が増え、研究の量も増えているにもかかわらず、ゴールドスタンダードの予測精度は驚くほど低い。最も売れている10種類の革新的な医薬品であっても、予測精度が5～33%しかなければ、その供給は結局効果がない。

ランダム化比較試験の平均的な有効性のために、研究ベースの企業は、できるだけ大規模で均質な患者集団による「ワンサイズ・フィッツ・オール」のアプローチを採用せざるを得ず、試験が長期化し、費用もかさむ。同時に、現在では研究の時間的長さが成功のための最も重要な要素の一つとなっている。試験の対象となる標準治療が急速に変化していく中で、今では陳腐化した標準治療に対して新薬を試験する場合、静的なデザインの試験はますます途中で中止しなければならない。このように、コストのかかる試験はますます複雑になり、企業にとってもリスクが高まっている。数少ない成功した薬剤に対しては、高いリスクに応じた価格設定が必要となる。

相関関係と因果関係

しかし、これらの薬剤に関する研究も、個々の患者さんに対する予測精度という点では、ほとんど語られていないことが多い。これは、無作為化試験では、個々の患者に関する既存の知識を排除する必要があり、亜集団における因果関係について結論を出すことができないためだ。例えば、ある患者さんが薬剤の作用機序を阻害する特定のバイオマーカープロファイルを持っていることがわかっている場合、無作為化のためにこの知識を無視するか、そのプロファイルを持つ集団を除外するか、効果関係をプロスペクティブに検証するために試験をその集団に限定する必要がある。しかし、その場合、中心となる問題は、薬が効くかどうか（相関関係）ではなく、なぜ効くのか（因果関係）ということになる。しかし、RCTはこのような質問のためにデザインされたものではないので、このような質問には適していない(3)。

特定の知識を除外することは、論理的には統計的ノイズにつながり、結果が希釈されて有意性を失うからだ。そのため、RCTには多くの非応答者が含まれており、有効性の独自性が損なわれている。このような知識抑制のメカニズムが、大部分のRCTの有効性に関する予測精度が未だに低い主な理由だ。

知識が排除されることで、何千人もの患者が不必要で、しばしば有害な治療にさらされ、かなりの副作用があるという倫理的な問題も生じる。例えば、化学療法のような重篤な副作用を伴う多くのがん治療は、個々の患者にとって最善の治療法ではないか、あるいは単に効果がないため、今日ではすでに避けることができる(4)。近年、無作為化をエビデンスに基づく医療と同一視するような無作為化ドグマが出現している。

また、ランダム化はそれ自体が目的ではない。因果関係がわからず、相関関係で対応せざるを得ない場合に、系統的な偏りを防ぐ役割を果たす。しかし、予測精度がまだ低いことを考慮すると、他の選択肢も、より優れたエビデンスの生成を可能にし、その結果、治療法の決定においてより高い予測精度が得られるのであれば、検討することができる。これは、相関関係を科学的に検証された因果関係に置き換えることで、より正確な証拠を得ることができるようになってきている。

RCTは、原因と結果の関係がはっきりしない場合に有効性を実証するための最も確実な代替手段である。そのため、適切にデザインされたRCTは、当面の間、エビデンス創出の重要な要素であり続けるであろう。しかし、疾患の因果関係の理解が進むにつれ、相関的な証拠に焦点を当てたRCTの限界が明らかになっていた。例えば、RCTを効率的に利用するためには、母集団の大きさ、費用対効果、急速に変化する標準治療など、多くの現実的なハードルがある。その背景には、RCTでは定義された集団における平均的な相関効果を見ること、精密医療では個人レベルでの因果関係を見ること、という相反するアプローチがある。達成された効果のばらつきは、散乱効果やバイアスを分離するため、因果関係を理解するのに不可欠である。これは、患者や病気の生物医学的作用機序に関する利用可能な知識を組織的に排除することとは対照的である。したがって、ますます精密医療の出現により、4つ目のレベルを含むエビデンス階層の拡大が必要であると考えられる。

エビデンスに基づいた医療の要求に、より良く、より良く応えようと、近年、研究者や医師たちは大きな進歩を遂げている。今日では、何千もの可能性の中から、最適な治療法の選択肢を見出すことができる。バイオインフォマティクス（遺伝子機能シミュレーション）を用いた仮説の立案と、過去のデータとの連携、実世界のデータの取り込み、動的で適応性のある研究デザインの組み合わせにより、予測精度が大幅に向上した複数の有効な結果が得られるようになった（5）。

このアプローチは、しばしばプラグマティック・プラットフォーム・スタディという言葉でまとめられ、古典的なRCTデザインとは異なる論理に従っている。このアプローチでは、平均的な治療効果ではなく、定義された患者グループや個人に対する最も正確な治療効果、すなわち正確な治療効果を目指す。

これは、生物医学的な因果関係を、前向きにコントロールして検証しようとするものである。患者グループは生物医学的な因果関係に基づいて形成され、基本的にはバイオマーカーに基づく反応者／非反応者の論理に従う。これは、生物医学的な因果関係に関する既存の知識が無視されるのではなく、明示的に利用されることを意味する。

その一例が、がん細胞のDNA修復機構ʼの機能低下を利用した薬剤「オラパリブ」である。健康な細胞には2つの修復機構があるが、修復遺伝子に欠陥のあるがん細胞には1つの修復機構しかない。これをオラパリブが阻害することで、がん細胞は分裂できなくなり、健康な細胞は増殖し続ける。この因果関係を知ることで、対応するDNA変異を持つ患者さんを非常に高い精度で予測することができる。癌細胞のDNA修復機能が失われていることを利用した薬剤「オラパリブ」の作用機序を、他の癌細胞の類似組織に移植することができる。健康な細胞には2つの修復機構があるが、修復遺伝子に欠陥のあるがん細胞には1つの修復機構しかない。これをオラパリブが阻害することで、がん細胞は分裂できなくなり、健康な細胞は増殖し続ける。この因果関係を知ることで、対応するDNA変異を持つ患者さんを非常に高い精度で予測することができる。したがって、この作用機序は、他の癌腫の類似した組織細胞に移植することができる。

プラズミック・プラットフォーム・スタディ（語用論的プラットフォーム研究）

生物学的には、組織学的に同等の前立腺がんで、DNA修復遺伝子に変異がある場合、オラパリブが有効であることは当然のことである。TOPARP試験では、化学療法後の転移性前立腺がん患者50名を対象に、この仮説を検証した。すべての患者にオラパリブが投与され、そのうち33%の患者が治療に反応した。その後、すべての腫瘍のDNA修復遺伝子の変異を遺伝子学的に調べた。その結果、16人の患者に対応する変異があり、そのうち14人（88%）が治療に成功した（6）。無作為化を行っても、どのような患者がオラパリブによる治療の恩恵を受けるかという問題に新たな知見は得られなかったであろう。

有効性をより正確に予測することで、実用的なプラットフォーム試験のような新しい試験デザインが可能になる。ここでは、研究集団がプロスペクティブに多数のサブグループに分けられ、異なる対照群で追跡されており、それぞれが動的な標準治療や第二、第三の治療法の変化を反映している可能性がある。プラットフォームの研究デザインは、フェーズ2から4の研究を継続的に統合することができる。フェーズ2の結果が成功したり、優位性を示すものであれば、化合物は次のフェーズに移ることができる。第3相が完了し、承認された後は、実世界で人口ベースのプラットフォーム・アプローチを用いて薬剤の性能を継続的にモニターすることができる（第4相）。複数の薬剤が並行してプラットフォームに入っている場合、患者の割り当ては適応原理に基づいて重み付けされる。薬剤の測定結果に基づくパフォーマンスが良ければ良いほど、バイオマーカーを考慮して、より多くの患者がこのアームに割り当てられる（承認は、実世界での人口ベースのプラットフォームアプローチによって継続的に共同記録することができる（第4相））。複数の薬剤が並行してプラットフォームに入っている場合、患者さんの配分は適応原理に基づいて重み付けされる。薬剤の測定結果に基づくパフォーマンスが良ければ良いほど、バイオマーカーを考慮した上で、より多くの患者がそのアームに割り当てられる(7)。

このような実用的で適応性のあるプラットフォーム研究は、通常、大規模な集団を用いた実世界コホートとして組織される。このようにデザインされた試験では、有効性だけでなく有益性についてもより良い証拠が得られ、より高度な有効性が期待できる。このデザインの後半では、ロバスト性をさらに高めるために割り当てをランダム化することもできる。しかし、その頃には、効果のない薬を投与された患者さんはかなり少なくなっているであろう。現在、シャリテの泌尿器科では、資本の入った泌尿器科の開業医の参加を得て、まさにこのアプローチが科学的に研究されている（8）。

因果関係に関する利用可能な知識を実際に利用すれば、今日でもすでにより高度な効果が得られるであろう。その一例が、抗生物質耐性菌による感染症である。どの細菌が原因でどのような耐性を持っているのかがわかれば、適切な薬剤を非常に効率的に投与することができる。治療開始時に必要な情報がすべて得られない場合は、効果が限定的な広域抗生物質を使用しなければならない。ここでの限界は、因果関係を知ることではなく、ポイントオブケアでの不正確な割り当てにある。

この帰属問題を解決するためには、可能な限り正確な治療効果を示すエビデンスを作成することが、精密医療の次のステップとなる。より多くの治療場面で、相関関係から因果関係へと徐々に移行していくことで、エビデンスに基づく医療の理想に近づくことができる。医療システムの課題は、この移行を可能にして、精密医療の恩恵ができるだけ早く日常の医療に届くようにすることである。最も正確な治療効果を可能にするエビデンスの生成は、精密医療の論理的な次のステップである。より多くの治療場面で相関関係から因果関係へと徐々に移行していくことで、エビデンスに基づく医療の理想に近づくことができる。医療システムの課題は、この移行を可能にし、精密医療の恩恵ができるだけ早く日常のケアに届くようにすることである。

第4レベルのエビデンスエビデンス

現代医学の根本的な帰属問題を解決するためには、4段階目のエビデンスが必要である。より多くの因果関係に基づく予測が可能になるにつれ、RCTを他の研究デザインに置き換えるべき場所とそうでない場所を決定する必要がある。ここでの指針となるのは因果関係に基づいた研究が、個々の患者に対して現在の標準的な治療よりも優れた予測精度を提供するのであれば、それは優れたエビデンスを含んでいると推定できるが、実際の治療の世界ではさらにプロスペクティブに立証する必要がある。目標は、予測精度の高いロバストなエビデンスでなければならない。

承認試験において生物医学的因果関係をいつ、どのように考慮するかについて信頼できる合意が得られれば、新薬の開発期間は大幅に短縮され、試験の実施コストは大幅に減少し、生成されたエビデンスの予測精度はより正確なものとなるであろう(9)。医師、患者、支払者にとって、それぞれのケースでの最善の治療方法が透明化されるため、医薬品の有効性が劇的に向上する可能性がある。各薬剤の効果が得られるターゲットグループを正確に把握し、治療の成功率を測定することができる。このようにして得られたリアルワールドデータは、エビデンスベースを向上させ、さらに有効性を高めることにつながる。有効性が高まれば、医療費1ユーロあたりの健康状態が向上するという意味で、研究の価値も高まる。

効率性を高めることは、すべての人が手頃な価格で医療を受けられるようにするためにも、また、精密医療を日常的に行うためにも重要だ。そのためには、規制当局、科学者、医師、製薬企業、支払者が、レベル4のエビデンス生成について共通の理解を持つ必要がある。私たちは、アプリケーションに付随するデータを最高レベルで収集、編集、処理するための知識、技術、リソースを持っている。共通の理解があれば、研究資源をより有効に活用するための適切なフレームワークを構築することができる。このようにして、現在の断片的で標準化されていない、つぎはぎだらけの登録状況を、研究とケアの効率を高め、誰もが精密医療を受けられるような、持続可能な集団ベースの研究状況に変えることができるのである。

無作為化比較試験

無作為化比較試験（RCT）は、バイアスや干渉を避けるために生まれたものである。なぜ薬が効くのかという因果関係がわからないため（因果関係)薬の投与と効果との統計的な関係を調べた（相関関係）。このような効果の散らばりや偏りの相関関係を調整するために、患者を無作為に割り当てる（ランダム化）デザインが開発され、その後、どの患者がどの薬剤を投与されるかを研究者が知らない盲検化が補完された（10）。

このようなRCTは、平均化された治療効果に焦点を当て、有効性についての一般的な声明を出する。その結果、調査対象となっている研究集団に対する薬の有効性が平均化されると、個々の患者に対する有効性は論理的に低くなる。この結果は、臨床研究の場以外では限られた範囲にしか適用できないため、実践のための情報価値はさらに低下する。したがって、有効性について一般化できるようにするためには、平均化された治療効果を調べる必要がある。一方で、この一般性こそが、他の集団への結果の転用ができないという理由で、科学界から疑問視されている(3)。