ベイズかベイズでないか、これが問題だ
Bayes or not Bayes, is this the question?

強調オフ

因果論・統計学

サイトのご利用には利用規約への同意が必要です

pubmed.ncbi.nlm.nih.gov/30825279

Bayes or not Bayes, is this the question?

Croat Med J.2019 Feb; 60(1):50-52.

ブラニミール・K・ハッケンベルガー

様々な科学文献データベース(例:ScienceDirect、Web of Science)によると、年々多くの科学論文がデータ処理にベイズ法を用いている(図1)。これは、ベイズ統計が頻出統計より優れていることを意味するのだろうか?ベイズ的手法では実現できて、頻出主義的手法では実現できないことは何だろうか?ベイズ統計の使用は研究に付加価値をもたらすのか?ベイズ統計を使わなければ、何を失うのか?ベイズ統計を使うことで、重要な医学的発見ができる可能性があるのだろうか?ベイズ統計学は複雑だろうか?

An external file that holds a picture, illustration, etc. Object name is CroatMedJ_0050-F1.jpg

図1 1995年から2018年までのベイズ統計を用いた医学論文発表数(sciencedirect.com. 2019年2月号)である。

ベイズ統計学の基本はベイズの定理で、ある事象が発生する確率を、この事象に関連する条件についての過去の知識に基づいて記述するものである。例えば、患者が最近の出来事をなかなか思い出せず、気分の落ち込みや意欲の低下がある場合、どれくらいの確率でアルツハイマー病を疑うことができるだろうか。このような症状だけで答えるのは簡単ではない。さらに、この患者が16歳なのか、75歳なのかでも大きな違いがある。年齢の情報によって、この症状がアルツハイマー病によるものである可能性が強く変わってくる。このわかりやすく直感的な例では、アルツハイマー病は事象であり、年齢はその事象に関連する条件である。

ベイズ統計学を説明するのに最適な例は、診断テストかもしれない。ある検査で陽性となった患者が病気である可能性を計算したい場合、さまざまな予想を知る必要がある。まず、検査方法の精度を知る必要がある。そして2つ目は、集団における病気の発生を知る必要がある。検査の精度が99%で、その病気が1万人に1人の割合で現れることが分かっていれば、陽性と判定された患者が病気である確率を求めることができる。直感的にこの確率は99%だと結論づけることができる。しかし、これは間違いだ!この場合、その人が本当に病気である可能性は1%以下である。つまり、集団における病気の発生に関するデータ、例えば事前確率が計算に強く影響する。この例では、病気の出現を事前確率、計算された陽性検査者の病気の確率を事後確率とする。事前確率と事後確率が同じ統計分布系列のものである場合、それらは共役分布と呼ばれ、事前確率は共役事前確率と呼ばれる。

ベイズ統計学は頻出統計学よりも歴史が古いが、長い間軽視されてきた。その主な理由は、ベイズ統計学が共役プリオールがわかっている場合に、わずかなケースしか解けなかったからだ。しかし、情報技術やコンピュータ技術の発展、新しい数学的手法の発見により、ベイズ統計学は復活を遂げた。特に注目すべきは、1950年代に発明されたマルコフ連鎖モンテカルロ法(MCMC)で、確率分布からのランダムサンプリングアルゴリズムを構築し、ベイズ階層モデルの計算を可能にした。その数年後、MCMCは統計学者にも使われ始め、現代のベイズ統計の時代が始まった。医学におけるベイズ統計の活用に関する最も早い論文の一つは1982年に発表された(1)。

ベイズ統計学では、頻度主義統計学とは対照的に、推論に必要なすべての関連情報は、他の未観測量ではなく、観測データに含まれている。ベイズ統計学では、事前確率モデルが正しく規定されている限り、事前に規定された実験デザインに関わらず、妥当性が保たれる。

頻度論的仮説検定に対する主な反論の1つは、P値の使用であり、その理由はP値が一度も観測されたことのないデータによって部分的に決定されるからだ。ベイズ法は帰無仮説と対立仮説を用いないが、その場合、主な反論は事前分布が主観的であるということである。さらに、事前分布を選択するための単一の、規定された、よく定義された方法はない。その結果、同じ実験に対して異なる人が異なる事前分布を使用することができ、その結果、異なる事後分布を得ることができ、異なる結論を出すことができる。一方、ベイズ法は、ある事象の確率を決定するだけだ。また、異なる事前分布を用いることができるため、異なる事前分布に対する実験結果の感度を測定することができる。

また、frequentist 統計の非常に重要な特徴として、実験デザインを事前に指定する必要があることが挙げられる。このような頻度論的推論とベイズ的推論の違いは、次のような例で説明することができる。例えば、仮想のマウス集団の性比が1:1かどうかを調べたいとする。2つの実験計画を立てることができる。最初の実験では、最初のオスが選ばれるまで、ランダムにマウスを選ぶことができる。この実験の結果は、選ばれたマウスの総数である。2つ目の実験では、ちょうど7匹のマウスを無作為に選ぶことができる。この実験の結果は、7匹のサンプルに含まれるオスとメスのマウスの数となる。その結果がFFFFFFMであったとしよう。どのような実験計画で行われたのかがわからなければ、この結果は無意味である。最初の実験ではPは0.031だが、2番目の実験ではP値は0.227である。常識的に考えて、通常の有意水準(0.05)に従えば、同じデータから2つの反対の結論を出さなければならない。この違いの原因は、1回目は幾何学的、2回目は二項分布というように、帰無分布が異なることにある(図2)。ベイズ統計学を用いれば、どちらの実験計画を適用したかは関係ない。ベイズ統計学では、事前分布として非常によく使われる関数がBetaである。事前分布としてBeta [3,3]関数を選ぶと、得られた結果による事後関数はBeta [9,4]となる。Beta関数は、特定のパラメータが発生する確率の関数として理解することができる。他の分布関数と同様に、ベータ関数も様々な形状を持つが、その領域は区間[0,1]である。したがって、Beta関数を事前分布として、このマウス集団の性比が1:1でない確率を計算することが可能である。この場合、実験デザインに関係なく、P= 0.92、つまり92%になる(図3)。

An external file that holds a picture, illustration, etc. Object name is CroatMedJ_0050-F2.jpg

図2 2つの異なる実験デザインは、異なる帰無分布を持ち、その結果、同じ結果について異なる解釈を導く可能性がある。灰色は幾何学的、黒は二項分布。

An external file that holds a picture, illustration, etc. Object name is CroatMedJ_0050-F3.jpg

図3 ベイズ統計学では、事前分布関数と事後分布関数に基づくので、どの実験計画を適用したかは重要ではない。灰色は事前分布、黒色は事後分布。

ベイズ統計の利点を示す良い例として、2つのデータセットの比較がある。古典的な統計手続きは、分散の等しさを検定するF検定と、2つのグループの結果の平均の等しさを検定するt検定である。これらの検定はいずれも、サンプルの元となった仮想集団の正規分布を証明できる場合にのみ意味を持つ(実際には、測定されなかった値の分布を推定することになる)。どのような頻度統計の方法を使っても、帰無仮説は常に「サンプルは同じ母集団に由来する(サンプル間でテストしたパラメータに統計的に有意な差はない)」というものである。パラメータの分布関数がわかっているので(t分布、F分布など)、目的のP値(目的の有意水準に対する検定統計量のいわゆる限界値である)以下になるためには、適切な統計量をどれだけ大きくすればよいかは簡単に計算できる(2)。

つまり、頻出統計学は、あるパラメータが置かれる望ましい信頼率(通常は95%)を推定する。これに対して、ベイズ解析は次のような問いに答える:「測定されたデータが与えられたとき、その仮説の確率はどのくらいか?」また、Frequentist統計では帰無仮説を受け入れるか棄却するかだが、ベイズ統計では2つの異なる仮説の確率の比を推定する。この比をベイズ比またはベイズ因子(3)と呼ぶ(表1)。ベイズ因子は、これらの仮説が正しいかどうかにかかわらず、ある仮説が他の仮説よりも支持されていることを定量化するものである。

表1 ベイズ因子の意味

ベイズ係数 意味
>100 H1に対する極端な証拠
30-100 H1に対する非常に強いエビデンス
10-30 H1に対する強い証拠
3-10 H1については、中程度のエビデンス
1-3 H1に関する逸話
1 根拠なし
1/3-1 H0の根拠となる逸話
1/3-1/10 H0に対する中程度の証拠
1/10-1/30 H0に対する強い証拠
1/30-1/100 H0に対する非常に強い証拠
<1/100 H0に対する極端な証拠

頻出統計学とベイズ統計学には、それぞれ多くの利点と欠点がある。ベイズ統計学がデータの確率と両仮説の確率を用いるのに対し、頻出主義統計学は仮説の確率を用いたり計算したりしない。フリークエンティスト統計学は事前分布の構築を要求せず、観測データと非観測データの確率に依存する。一方、ベイズ法は事前分布と観測データの確率に依存する(4)。

臨床研究においてはベイズ統計の方がずっと便利だという主張が増え(5)、臨床研究のデータ処理に頻出統計とベイズ統計を使い分ける試みが増えているが、ベイズ統計は機械学習アルゴリズム、すなわち人工知能に基づくシステムの基本であるため、重要度も増している(6)。審査員として、これらの統計のいずれかを明確に「支持」することは困難である。しかし、ジャッジする必要すらない。ある種の手術では、レーザーメスの方が有利であることが分かっているのに、無理に1種類の統計だけを使うのは、普通のメスよりレーザーメスの方を使うのと同じことだ。したがって、ベイズ統計学は、データを処理するためのもう一つの強力な道具として理解すべきなのである。

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー