グループでのより良い意思決定

強調オフ

心理学政策・公衆衛生(感染症)

サイトのご利用には利用規約への同意が必要です

Making better decisions in groups

オンライン 2017 Aug 16 掲載

ダン・バン1,2,クリス・D・フリス1,3

概要

個人やグループの意思決定における共通の問題を特定するために、文献をレビューする。過去の経験と新しい証拠との間の相互作用を説明するために、ベイズの枠組みに導かれ、世界が取り得るすべての状態と人が取り得るすべての行動に関する仮説の空間を探索する問題を説明している。これらの心理的プロセスには、意識されない強いバイアスがかかっている。バイアスは、情報処理の効率を高める一方で、最適な行動に結びつかないことも多い。我々は、グループでの意思決定が、バイアスを克服し、世界の良いモデルや問題の良い解決策のために仮説空間を探索するのに適していることを強調する。グループメンバーの多様性はこれらの成果を促進するが、多様なグループにはそれなりの問題がある。本稿では、これらの落とし穴に対処する方法を議論し、より良いグループの意思決定を行うための提言を行う。

キーワード:意思決定、社会、バイアス、自信、多様性、ベイズ法

1. なぜ意思決定が難しいのか?

ほとんどの意思決定は、不確実性に直面し、すぐにフィードバックが得られない中で行われなければならない。集団で意思決定を行うことで不確実性を低減することができ、これが動物界で頻繁に観察される理由の一つである[1,2].例えば、魚の群れは、個々の魚にとっては信号が弱すぎる光レベルの勾配に従うことができる [3].人間は、世界がどのように機能するかについて、議論によってより良いモデルを構築することができる[4,5].しかし、集団における意思決定は複雑であり、うまくいかないこともある[6,7].この論文の目的は、科学的な文献をレビューして、意思決定者(個人とグループで意思決定を行う人の両方)が注意すべき落とし穴を特定し、グループがより良い意思決定を行えるようにするための提言を行うことである.

ここでは主に、パネルや委員会など、解決すべき問題に同意する小集団を対象とするが、我々が検討する現象の多くは大集団でも観察される。我々は、直感的な意思決定の多くの側面を捉えることができることが示されているベイズのフレームワークを採用している[8-10]。直感的という言葉は重要であり、我々は認知プロセスのほとんどを意識していないことを思い出させてくれる.ここでは、過去の経験(事前)と新しい証拠(尤度)を区別するベイズの考え方を紹介する.また、行動を選択する際には、仮説空間を探索する必要があると言う。そうすることで、我々の主な目的は、意思決定がどのように失敗するかを理解することである。ベイジアンアプローチの詳細は付録Aに記載されている。

2. 基本概念の紹介

2.1. 不確実な世界での信念の形成

2.1.1. 過去の経験と新しい証拠の重み付け

一方では、過去の経験や認識された知恵と、他方では新しい証拠との間で、適切なバランスを取ることが重要だ。前世紀半ば、医師は扁桃腺やアデノイドを除去するために多くの子供たちを病院に送った。1938年に医学研究評議会の学校伝染病委員会が次のように結論づけたにもかかわらず、このような紹介が行われた。今日行われている大量の扁桃摘出手術の中で、すべての手術対象者が真の意味で差別的に選ばれているとは少し信じがたく、特に理由もなく、特に結果も出ないまま、日常的な予防的儀式として手術が行われている傾向があるという結論は避けられない」[11]。より最近の経験的研究では、1981年には17%の医師が冠動脈造影を不適切に使用していたことが判明している。彼らは証拠を把握せず、明らかに試行錯誤した経験に固執していたのである[12,13]。

2.1.2. 情報源の信頼性を評価する

我々が自分自身で意思決定を行う場合でも、情報は多くの場合、他の人からもたらされる。この情報を適切に利用するためには、情報源の信頼性(ベイズの枠組みでは精度と呼ばれる)の推定が必要である.他者が発信する情報の信頼性は、有用な指標となるが、欺こうとする意図がなくても、誤解を招く可能性がある。このような危険は、自分自身の判断を評価する際にも存在する。多くの場合、自分が感じている自信が良い指針にならないことがある。たとえば、犯罪の被害者は、犯人の顔をよく覚えていると心から信じていても、アイデンティティ・パレードで無実の人を選択してしまうことがある[14]。

2.2. 最適なソリューションを見つける

2.2.1. 仮説空間のサンプリング

最適な行動を選択するというタスクは、丘陵地帯の風景の中で最も高い場所を見つけるようなものだと考えることができる[15](図1a)。この風景は、可能な行動の善し悪しに関する確率分布を表しており、最も高い確率が最良の行動を示している.しかし、このピークをどうやって見つけるのであろうか?分布全体を計算することは、しばしば計算困難であるが、脳が最適に近い解を得ている状況は数多く存在する[16,17].これを実現する一つの方法は、確率分布のサンプリングである[15].さまざまなポイントで風景を訪れることで、大まかな地図ができあがり、よりよい選択ができるようになる(図1b).例えば、現在の状況と似たような状況を記憶の中から探し出したり[18,19]、他人にアドバイスを求めたり[20]することができる.

図1
An external file that holds a picture, illustration, etc. Object name is rsos170193-g1.jpg

可能な行動のランドスケープを探る。(a) 可能な行動の善し悪しに対する確率分布を示している。ピークは最良の行動を示す。(b) 確率分布の大まかな推定値は、サンプルを採取することで得られる。(c) もしサンプリングにバイアスがあれば、確率分布の推定値は真のものを反映していない可能性がある。サンプルベースの分布を作成するために、真の確率分布(N = 14)から一様に(b)または部分的に(c)サンプルを抽出し、平滑関数を適用した。真の確率分布の高さをサンプリングしたのは、ある行動の良さを思い出したり、友人にどの行動を取るべきかアドバイスを求めたりするようなものである。


サンプリングは、知覚や運動制御のように、長年の経験によって構築された豊富なデータベースを利用できる領域ではうまく機能する[21,22].しかし、その欠点は、慣れない抽象的な設定で人が犯すミスによって明らかになる.バイアスのないサンプリングを行うべきなのに、代わりに古い習慣に陥ってしまう[23].サンプリングのもう一つのリスクは、風景を探索する人が、ローカルなピークに留まってしまい、より高いピークがあることを発見できないというリスクである(図1c).このように一見して満足のいく解決策を見つけた人は、より良い解決策を探すよりも、その解決策を正当化することに認知資源を費やす傾向がある[24]。

2.2.2. Exploitation and Exploitation

十分な知識があると思うとき、あるいは時間がないとき、人は現在の知識を利用して、最良の結果が得られると思われる行動を選択する。我々は通常、価値の高い結果を好むが、ある結果がまったく実現しない確率も考慮に入れる[25].しかし、宝くじの成功[26]に見られるように、行動の期待値の推定には強いバイアスがかかっている.正しい判断をするための十分な知識を持っていない場合も多くある。そのような場合には、決断する前に、搾取するのではなく探索し、より多くの情報を求めるべきである[27,28]。もちろん、現在の知識が十分であると過大評価している場合には、より多くの情報を求めることができないかもしれない。一部の医師が冠動脈造影を不適切に使用していたという観察結果については、すでに述べた[12,13]。もし彼らが運動データを収集していたら、血管造影は不要であることがわかったであろう。

2.3. 隠れたバイアス

情報を効率的に処理するために、人間は近道を採用するが、その多くは切迫した状況での救命行動につながることで進化してきたものである[29].例えば、敵や捕食者を迅速に認識することは、回避行動をとるという適切な判断につながる。しかし、現代の生活では、進化から残されたこれらのバイアスが、例えば、候補者が(民族や性別などの)「見慣れない」グループの出身であることを理由に拒絶し、脅威反応を引き起こすなど、誤った判断を引き起こすことがある[30].現代人は、このような「時代遅れ」のバイアスを指摘されると驚き、そのようなバイアスを持たないように努力する [31].バイアスには他の種類もあり、それは個人の経験に依存する.例えば、「エスカレーターでは左側に立つ」という文化的なバイアスが考えられる(例:東京).その偏見を学んだ文脈では有用な本能であるが、右に立つことが習慣となっている新しい文脈(例:大阪やロンドン)では、その偏見は不快なものとなる。

3. 個人の判断が間違っている場合

ここでは、個人の意思決定がうまくいかない場合の方法をいくつか考え、次に、グループがその欠点を克服する方法について説明する。ここでは主に、問題と到達した答えは認識しているが、どうやってそこに到達したのかを認識する必要がない意思決定について考える。この意思決定のモードは、小グループの活動の最も典型的なものである。

3.1. 誤った信念の形成

3.1.1. 過去の経験を信じすぎたり信じなかったりする

誤った意思決定の一般的な原因は、不適切な事前の信念である。ある仮説を強く信じていた場合、その考えを変えるためには、大量の相反する証拠が必要になる。例えば、1940年代に扁桃腺摘出手術を行っていた外科医たちは、この手術は万人のためになるという強い信念を持っていたため、医学研究評議会の報告書に左右されることはなかった[11]。物理学では、アインシュタインが宇宙は静的であるという確固たる信念を持っていたために、一般相対性理論を宇宙に適用する際に不要なパラメータ(宇宙定数:Λ)を追加してしまった[33]。地質学では、永続性理論への「事前の理論的コミットメント」のために、大陸移動の理論が40年間にわたって否定された[34]。逆に、ある仮説に対する事前の確信が弱ければ、それを信じるためには膨大な量の裏付けとなる観測結果が必要になる。例えば、ほとんどの科学者は超感覚的な知覚(テレパシーなど)を信じていない[35]。その結果、彼らは感覚外知覚の存在について、より広く受け入れられている仮説よりもはるかに強力な証拠を要求する[36]。感覚外知覚の場合はおそらく賢明であるが、そのような弱い事前の信念は過去の科学の進歩を妨げてきた。

3.1.2. 新しい証拠の誤認

事前の信念を信じることが悪いことだというわけではない。事前の信念は、世界に対する過去の経験を反映したものであり、それは 進化的または個人的な時間スケールでのものであり、我々はそれらから大きな 利益を得ている。また、新しい状況に適応することは不可欠なので、新しい証拠を原則的に信用してはいけないというわけでもない。しかし、我々が世界についての信念を適切に更新するためには、新しい証拠を正しく解釈する必要がある。科学の歴史を振り返ってみよう。ガリレオが1610年に初めて望遠鏡で土星を見たとき、彼は自分が見たものを説明する良いモデルを持っていなかった。ある時、彼は土星に耳があると表現した(図2)。ホイヘンスがこの「耳」が土星を囲む環であることに気づいたのは、1655年のことである[37]。

図2

新しい証拠を誤って解釈する。(a) ガリレオは、時間とともに変化し、耳や腕があるように見える土星の姿を不思議に思った。Le Opere di Galileo Galilei, XII, Correspondence 1614-1619, Letter 1223. (b) ホイヘンスは、これらの変化する外観が環で説明できることを認識していた。Systema Saturnium (1659), Oeuvres Completes de Christiaan Huygens, XV: 312.

3.1.3. 稀な出来事の誤った評価

世界についての信念を更新するとき、意識的であれ無意識的であれ、我々は 稀な出来事を扱うのが特に苦手なようだ。世界についての信念が他人から得た 情報に基づいているときはその発生を過大評価し、自分自身の経験から構築されて いるときは過小評価する [38,39]。例えば、処方された薬のリーフレットを読んだ後、ある身体的症状が副作用によるものである確率を過大評価してしまうかもしれない。それに対して、その薬を長年処方してきた医師は、同じ確率を過小評価するかもしれない。この例では、患者は新しい証拠を過大評価し、医師は過去の経験を過大評価している。

3.1.4. 自分の能力に対する信頼が高すぎたり低すぎたりする

ほとんどの人は、好むと好まざるとにかかわらず、自分の信念の正確さを測るのが苦手である [40]。典型的な心理学的研究では、人々は様々な判断(例:点の雲は右ではなく左に動いている)や命題(例:リオデジャネイロはブラジルの首都である)に対する自信を、正しい確率として示すように求められるだろう [41]。そして、研究者は、人々の自信と信念の間の関係の2つの側面を定量化することになる[42]。1つ目の側面は解決で、人々の自信の低さと高さが、間違った信念と正しい信念を区別できる程度を特徴づける。第2の側面はキャリブレーションであり、人々が述べた正しい確率が、彼らの正しい客観的な確率をどの程度反映しているかを特徴づける。例えば、人々が自分の信念が70%の確率で正しいと言ったとき、彼らは70%の確率で正しいことになる。特にキャリブレーションにはバイアスがかかる。難しい問題では自信過剰になるが、逆に簡単な問題では自信過剰になる傾向がある.しかし、過小または過大な自信を示す程度には大きな個人差がある[46].

3.2. 複雑な問題に対する単純な解決策とその予期せぬ結果

3.2.1. ストライサンド効果

多くの問題は、人間の認知能力を超えた深い思考を必要とする。三目並べのような単純なゲームでも、何千通りもの展開が考えられる。複雑性の高い問題に直面したとき、我々はヒューリスティックな戦略、すなわち、行動を選択するための単純なアルゴリズムや経験則に頼る傾向がある[47].ヒューリスティックな戦略は、時間と認知的努力を節約することができるが [48]、意図しない結果をもたらすこともある.そのような結果の1つは、Streisand効果として知られるようになった[49].2003年、Barbra Streisandは、自分の家の写真がオンラインに掲載されるのを防ぐために訴訟を起こした。一見すると、これは望ましくないものが公開されるのを防ぐための適切な方法のように思える。我々は、望ましくない行為が罰せられれば、その行為はなくなると考えている。訴訟前に写真をしたのはわずか6人で、そのうち2人はストライサンド氏の弁護士であった。訴訟によって注目を集めた後、約40万人がウェブサイトを訪れた[50]。

3.2.2.世界のモデルなしでの学習

複雑さの問題に対する1つのヒューリスティックな解決策は、開発に時間がかかり[52]、認知的にも負担の大きいモデルベースの戦略[51]ではなく、モデルフリーの戦略を用いることである.モデルフリー戦略は、過去の行動の結果を記憶し、その値に基づいて習慣的に行動することで進行する.例えば、モデルフリーの三目並べプレイヤーは、過去にそのような行動が報われたことがあるので、常にグリッドの中央を占めるようにするかもしれない。対照的に、モデルベースの戦略は、世界のモデルを構築し、更新することで進行する。モデルベースの三目並べプレイヤーは、古い習慣に頼るのではなく、相手の内部モデルを利用して、相手の将来の動きを想像し、評価する。明らかなように、モデルフリー戦略がうまく機能するためには、変化しない世界での相当な経験が必要である[51]。しかし、この要件が満たされることはほとんどない。意思決定者の状態でさえも変化する可能性があり、意思決定が関連する未来の状態は、意思決定をしなければならなかったときの状態とは異なるのである。我々が知っているように、お腹が空いているときに買い物をすると、将来満腹になった自分が不賛成するような意思決定をしてしまう可能性がある[54]。

3.2.3. 仮説の数が少なすぎる

複雑さの問題に対するもう一つのヒューリスティックな解決策は、世界と可能な行動に関する仮説のサブセットのみを考慮することである.この戦略は、仮説の完全な空間のサンプリングを適切に導くほど、過去の経験が豊富ではない問題に適用される可能性が特に高い[15].しかし、この空間の縮小は、考慮に入れられる代替案が少なすぎる場合には、誤った決定につながる可能性がある[55]。例えば、政治学者のPhilip Tetlockは、政治評論家を、複数の仮説を検討するキツネと、より少ない数の仮説を検討するハリネズミに分けている。

3.2.4. 慣性と楽観主義バイアス

これから検討する複雑性問題の最後の解決策は、記憶からのサ ンプリングである。ある行動の将来の結果を想像し評価するフォワードプラ ンニングを用いる代わりに、同じような状況に置かれた前回の行動を 思い出して行動を決めることができる[18,19]。この戦略は、現在の証拠にかかわらず、人が過去の選択を繰り返す傾向があるという観察結果を説明することができる。前向きな計画を立てるときには、行動の期待値の推定など、計算の一部に記憶からのサンプリングを利用することがある.しかし、この戦略は、サンプリングにバイアスがあると、歪んだ推定値になる可能性がある.例えば、ある行動の結果の確率に関する我々の信念は、その結果がどれだけ望ましいかに依存することが示されており、これは楽観主義バイアスとして知られる現象である[58].このバイアスは、記憶から期待値を構築する際に、好きな結果はサンプリングするが、嫌いな結果は無視する場合に生じる可能性がある.その結果、喫煙による病気など、望ましくない結果の確率を過小評価し、宝くじの当選や新しいレストランのヒットなど、望ましい結果の確率を過大評価することがある。興味深いことに新しい情報を収集するとき、我々は良いニュースを伝える情報源を好むようであるが、これは我々の記憶をさらに偏らせることになる[59]。

4. グループでの意思決定の利点

個人の意思決定の問題の多くは、個人が他の人と一緒にグループで意思決定を行うことで軽減される。ここでは、人々が一緒に、または独立して働くグループのシナリオを検討する。グループリーダーの性質と機能については、独自の分野であるため、ここでは議論しない[60-62]。しかし、推奨事項のセクションでは、グループ議長またはリーダーがグループの意思決定に特有の問題を軽減するのに役立ついくつかの状況について言及する。

4.1. より良い信念の形成

4.1.1. 情報をプールすることの利点

統計学上の経験則として、独立した個人に情報をプールすると、より信頼性の高い情報が得られる [63,64]。例えば、バイアスはないがノイズの多い数値推定値をプールすると、相関性のない誤差が相殺されるため、プールされた推定値の精度が高まる(付録B1参照)。ここでは、人々が異なる過去の経験や新しい証拠に基づいて推定を行うため、推定誤差は相関しない可能性がある。個人間で情報をプールすることの利点は、Francis Galtonによって初めて示された [65].彼は、「牛の重さを当てる」という競争に参加した個人のエントリーを集め、これらのエントリーの平均値が、優勝した1つのエントリーよりも真実に近いことを示した。この効果は、小グループ[4,66]や大グループ[1,67]で実験的に再現されている。

4.1.2. Wisdom of crowds

情報をプールするという約束は、群衆の知恵を利用するという最近の試みを支えている[68].これらの試みの中心となっているのは、インターネット上で情報を得た場合など、人々の専門性や誠実さを確認するのが難しい場合に、個人の判断を組み合わせるための方法の開発である[69,70]。一部の領域では、使用する手法は複雑である必要はない。例えば、最近の一連の研究では、独立した皮膚科医の大多数が好む判断を採用することで、皮膚がんや乳がんの診断の精度をシングルベストの個人よりも向上させることができることが示されている[71-73]。このような診断方法は、エビデンスに基づく医療の提唱者が明らかにしたいくつかの問題点を克服することができる[12]。

4.1.3. 多数決

個人の意見をグループの意思決定に結びつけるための一般的な戦略は、各メンバーに利用可能な選択肢について投票させ、多数派が支持する選択肢を選択することである [74,75]。この多数決はグループのメンバーの好みが大きく異なる場合に、最も公平な解決策として認識される可能性がある。しかし、このプロセスの結果は、個人の意見の根拠となった情報の信頼性に大きく依存している.そのため、個人の信頼性を考慮した重み付き多数決を使用することが望ましい場合がある(図3)。では、信頼性はどのように評価されるのであろうか。

図3 信頼性による重み付け

この図は、個々の推定値にその信頼性による重み付けをした場合(加重平均)の方が、個々の推定値に等しい重みを付けた場合(単純平均)よりも、プールされた推定値の信頼性が高くなることを示している.今回のシミュレーションでは、個々の推定値の信頼性にはばらつきがあり、無相関であると仮定した。数学的な詳細については、付録B2

4.1.4. 信頼性の社会的マーカー

信頼性の一つのマーカーはステータスである[76,77]。グループのメンバーは、ランク(給与等級)年功(在職期間)経験(彼は戦争に行ったことがある)などの理由で高い地位を得ている場合があり、これらの特徴は信頼性のマーカーとみなされる[78-80]。信頼性のもう一つの指標は、意見を表明したときの自信である [81-84]。グループのメンバーは、関連する過去の経験(prior)や強力な証拠(likelihood)を持っているので、高い自信を表明することがある[41]。興味深いことに、予測よりも人気のある意見に高い重みを与える手順は、多数決や信頼度加重の代替案よりも優れた意思決定を生み出すことが示されている[70].

4.1.5. オープン考察の顕著な成功

小グループのメンバー間での考察は、時間的なプレッ シャーがない場合、グループのメンバーが持つ知識を有効に活用す るための優れた戦略であることが証明されている[85-91]。これらの研究で明らかにされた理由は、議論には信頼性のマーカーの再調整が含まれるからである。提示された意見に対して賛否両論を唱えることで、それぞれの意見の根拠となった証拠を評価することができるのである[24]。一般的に、我々は、単に自信満々に述べられた意見よりも、きちんと議論された意見に動かされる可能性が高い[91]。このような再調整を行うことで、どの意見も過度に重視されない確率を高めることができる.

4.2. より良いソリューションを見つける

4.2.1. 認知的資源のプール

グループは、確率や推論の多くの問題において、個人よりも性能が高いことが示されている [92,93]。例えば、論理学の有名な問題であるWason選択課題では、個人では10-20%しか正解しないが、グループでは約70%に増加する。また、グループは、経済ゲーム(美人コンテストなど)で個人を上回り[94]、数値問題(確定申告の計算など)ではより効率的な解答を見つけ[83,95]、科学的なトピック(生物学的な伝達の概念など)では、メンバーが単独で作業した場合の合計から予想されるよりも高い抽象度に到達する[96]ことができる.重要なことは、グループで作業したことの利点は、個人の文脈に移ることができ、個人は他の人と一緒に開発した良い戦略を保持することができることである[83,92]。

4.2.2. 探検家と開発者の努力の組み合わせ

探検家になりがちな人と開発者になりがちな人を区別することができる[97]。開発者は、世界の現在のモデルにとどまることを好み、別のモデルに切り替えることはしない。仮説空間の小さな部分を検討し、最初に思いついた解決策を改良していく.対照的に、探検家は幅広さを好む。仮説空間のはるかに大きな部分を検討するので、局所的な最大値に囚われる可能性は低い。一方、彼らの探索活動は、手遅れになってから行動することを決めるかもしれないことを意味している[27].人がどの程度探検するか、あるいは開発するかは、部分的には性格と遺伝の問題である[98]。ミツバチから人間まで、多くの動物グループには、開発者と開拓者が混在している。10,000匹のミツバチの典型的な群れには、300~500匹の偵察蜂が含まれる [99]。このような多様な個体が混在することで、集団にとっての利点を生み出すことができる。

4.3. 隠れたバイアスの克服

グループは、「自分の目に入っている梁」(マタイ7:3、KJV)を発見するのに役立つ。自分自身のバイアスは自分自身には隠れていることが多いが、他人のバイアスを検出するのは驚くほど得意である[100,101]。グループが個人のバイアスの克服を支援するもう一つの方法は、目前の問題のインセンティブ構造を、間接的(例:評判の低下や利益)または直接的(例:金銭的な損失や利益)に変更することである。例えば、いくつかのタスクでは、グループのメンバーが自発的に、そのタスクを単独で行っていたときよりも良いパフォーマンスを発揮することがある [102,103].ケーラー効果[104]として知られるこの向上は、グループメンバーが最も弱いリンクとして認識されたくないために生じると考えられている[103,105]。金銭的なインセンティブを提供する際には、グループ内で不均等に分配される個人のインセンティブと、均等に分配されるグループのインセンティブのバランスをとることが重要である[106]。個人のインセンティブはグループの意思決定のスピードを向上させる一方で、グループのインセンティブは精度を向上させる[107]。しかし、意思決定は、しばしば速さと正確さの両方を兼ね備えることはできない[108]。

5. グループの優位性が失われるとき

グループは、個人の意思決定の問題のすべてではないが、いくつかを克服することができる.ここでは、独立した知識の欠如、情報や好みの共有を歪めるバイアス、個人とグループの目標が競合する問題など、グループでの意思決定が直面するいくつかの潜在的な落とし穴について検討する。

5.1. 独立した知識の欠如

グループシンクは、グループでの意思決定がうまくいかない原因として、おそらく最もよく知られている。この言葉は、心理学者のアーヴィン・ジャニスが豚湾侵攻作戦の事例研究[7]で広めたもので、さまざまな意味で使われているが、共通しているのは、グループのメンバーが独立性を失い、あたかも超大型の個人のように振る舞うことである。自立しなくなる原因は、大きく分けて2つある。1つ目は、グループメンバーがお互いに似すぎていることである。彼らの知識は、似たような過去の経験や似たような新しい証拠に基づいている。第二に、グループのメンバーは、最初は似ていなくても、社会的相互作用を通じてお互いの知識に適応していく。このような相関関係の結果、個々のエラーは独立したものではなくなり、グループメンバー間で情報をプールすることのメリットは小さくなる(図4)。

図4 情報を制限する相関関係

 

この図は、プールされた情報に相関があると、プールされた推定値の信頼性が飽和することを示している。このシミュレーションでは、個々の推定値の信頼性が等しく、低、中、高のいずれかの程度の相関があると仮定した。数学的な詳細については、付録B3

5.1.1. グループのメンバーがお互いに似すぎている

グループのメンバーが似たような過去の経験を持ち、そのために世界について似たような期待を持っていることは、しばしば避けられない。社会生活では、背景や個人的特徴を共有する人々と一緒になる傾向がある[109]。職場では、自分とあまり変わらない人生の道を歩んできた人と一緒になることが多い[109]。このような「羽の生えた鳥は群れをなす」という傾向は、グループの結束力を高めることができるが、グループの意思決定に悪影響を及ぼすこともある。グループのメンバーが似たような事前の信念を持っている場合、彼らの推論は似たような形でバイアスがかかってしまうのだ。この問題は、グループのメンバーに独立して作業をしてもらうことでは解消されない。例えば、同じ政党のメンバーであれば、お互いの解釈を議論するかどうかに関わらず、入力されたデータを同じように解釈する可能性がある。

また、グループのメンバーが世界について同じような情報を得ることは、避けられないことが多い。似た者同士は、過去の経験が似ているだけでなく、新しい情報を得る方法も似ている。例えば、同じ新聞を読んだり、同じラジオ番組を聴いたりすることがある。この問題は、インターネットでは増幅される.検索エンジン(例:Google)やソーシャルメディア(例:Facebook)は、我々の場所や閲覧履歴に応じてコンテンツを整理し、我々の好み、友人の好み、あるいは我々に似ていると推定される人々の好みに合った情報を促進する [110].このようなパーソナライゼーションは、フィルターバブル [111]やエコーチェンバー [112]の形成を促進し、そこでは、同じ考えを持つ個人によって情報が作成され、再利用される.グループのメンバーが相関のある証拠を得ると、過去の経験が相関しているかどうかに関わらず、彼らの結論は共謀することになる[113]。

5.1.2. グループメンバーの収束が強すぎる

これまで、状況的な要因によって個人が独立していない知識を保持する方法を考えてきた。しかし、個人は集団での相互作用を通じてお互いの知識に積極的に適応することがあり、これは群れ、適合性、社会的影響の見出しで研究されている現象である[114-116]。ここでは、2つのタイプの社会的影響を区別している。人々は、グループに適合したいという願望から、あるいは他の人がより良い知識を持っていると信じることによって、お互いの知識に適応することがある。

5.1.3. 集団への適合欲求

社会的コンプライアンスの典型的な例は、サロモン・アッシュの線判定実験である[117]。8人の男子学生のグループに様々な長さの線を見せ、基準となる線とどちらが一致するかを順番に発表するように求めた。参加者のうち1人を除いて全員が役者であり、アッシュから間違った答えを出すように指示されていた。驚いたことに、参加者は常に自分の答えを最後に発表するように座っていたのであるが、内心では正解を知っていたにもかかわらず、約40%の確率で多数派に屈してしまったのである。もっと日常的な例では、ミルクチョコレートと甘いワインが好きだということを、高尚な友人に認めないことなどが挙げられる。

5.1.4. 他者がより良い知識を持っていると信じる

不確実な状況では、個人は他者を観察することで情報を得ることができる。自分が無知であったり、学ぶことが面倒であったりする場合には、「多数派のコピー」や「最も成功している人のコピー」をするとよいであろう。これらの近道は、行動は理由があって人気がある 傾向があり、人々はその行動が適応的であるために成功す る傾向があるという事実を利用している[20].我々自身が有益な情報を持っている場合、これらの近道はあまり役に立たないように見えるかもしれない。それでも、我々は自分の本能を無視して、代わりに他の人に従うことがよくある[118,119]。例えば、我々は、他の人が正当な理由でそこで買い物をしていると仮定して、市場の屋台で買い物客の長い列に加わるかもしれない。その屋台の商品の出所が怪しいと思っていても、そうすることがある。他の人は通常、良い情報に基づいて行動するという心理学的な仮定は、いわゆる情報カスケード[119]と呼ばれるように、信念や行動がグループ内で急速に広がる理由や、合理的なエージェントが自分のより良い知識に反した決定を下すことができる理由を説明することができる。

5.1.5. 情報カスケード

金融バブルは、情報カスケードのわかりやすい例である。金融バブルとは、一般的に、ある資産がその本質的な価値、すなわち真の価値よりもはるかに高い価格で取引されることと定義される。しかし、金融バブルは、資産の価格が急激に下落した後に発見されるということを覚えておく必要がある。金融バブルが発生している間、個々のトレーダーは資産の真の価値について確信が持てず、そのため、資産の買い手が正当な根拠に基づいて行動していると推測することが正当化される可能性がある。例えば、そのトレーダーは、資産の価値が上昇するという内部情報を買い手が持っていると信じているかもしれない。ある意味で、トレーダーは、市場が信念と意図を持つエージェントであるかのように行動しているのである[120]。このようにして、取引活動の小さな変動が、結果的に大きな財務的影響を与えることになるのである。

5.2. 隠れたグループバイアス

5.2.1. 共有情報バイアス

科学文献で確立された知見の1つに、グループでの議論は、重要だが少数派しか持っていない情報を犠牲にして、グループメンバー全員が共有している情報に焦点を当てる傾向があるというものがある[121]。この現象は、「共有情報バイアス」または「隠れたプロフィール効果」として知られている。例えば、異なる専門分野の人々で構成されることの多いフェローシップやグラントの審査会では、申請者の実績など、誰もがよく知っている要素に焦点が当てられ、新しい方法を使用する際のリスクなど、専門的な知識を必要とする部分にはあまり注意が払われないことがある [122]。その結果、申請が成功するかどうかは、提案された研究の質よりも審査委員会の構成に大きく依存することになる。このように、情報の共有が重視される理由はいくつかある。状況証拠的な要因もある。共有情報は、より多くの人が保有しているため、サンプリングされる可能性が高くなる[123]。迅速に意思決定を行う必要があるため、重要だが時間のかかる情報が議論される可能性は低くなる [124]。心理的な要因も役割を果たしている。グループメンバーは、グループ内での自分の地位を高めるために、共有情報に焦点を当てることがある。なぜなら、自分がすでに知っていることを他の人が知っていれば、他の人から好かれ、より有能であると判断される傾向があるからである[125]。

5.2.2.バイアスの増幅

グループはしばしばそのメンバーの大多数が持つ初期の選好を増幅させることがあり、この効果はグループの極性化として知られている[126,127]。例えば、大多数の初期の選好がリスクを求めるものである場合、グループはメンバーが単独で行うよりも多くのリスクを取る可能性がある[128]。対照的に、大多数の初期選好がリスク回避である場合、グループはメンバーが単独で行ったであろうことよりもより慎重な選択を行う可能性がある[129]。グループの分極化は、法廷などのリスクの高い状況でも示されている。ここでは、陪審員は審議後に厳しい評決や寛大な評決にシフトする傾向があり[130]、裁判官のグループは当初の選好から予想されるよりも極端な行動をとる[131]。

この現象については様々な理論がある[127,132]。1つの説明は、気分[133]や自動行動[134]と同様に、嗜好が伝染によって広がるというものである。例えば、普段は我慢強い人がせっかちな人と交流すると、すぐに満足することを好むようになるというように、脳が期待値を表す方法は関連する他者に適応することを示す証拠がある[135,136]。もう1つの要因は、自分の好みが不確かなことであり[137]、そのために他人に手掛かりを求めてしまうのである[138]。最初は弱かった嗜好を支持する新たな論拠を耳にすれば、それを強化することが理にかなっているかもしれない。

5.3. 競合する目標

5.3.1. 地位と説明責任

人間は多くの複雑で競合する目標を持っているので、一部の人が 正しい判断をすることよりもグループ内での地位や評判を気にするのは当然のことである [139]。このような動機が悲惨な結果を招くこともある。メディアで取り上げられた例としては、飛行機の墜落事故や手術ミスがあるが、これらは、若手が正当な懸念を表明しなかったり、年長の同僚に無視されたりしたものである[140,141]。グループのメンバーにとって気になる関連要因は、説明責任、つまり、グループに対して自分の意見や行動を正当化するように求められるという期待である [142,143]。グループメンバーは、説明責任を軽減するために多大な努力をすることがある。例えば、当初の立場にかかわらず、多数派の意見に向かって自分の意見を転換することがある。一方、過去のコミットメントに拘束されている場合には、初期の立場を正当化することに時間を費やすことが多い-防衛的補強として知られる現象である[143]。前者の行動は有効だが少数派の視点の抑圧につながる可能性があるが、後者は貴重な時間と資源を浪費する可能性がある。

5.3.2. Social loafing

多くの場合、個人は他人の労働の成果を享受することができるが、自分では全く、あるいは最小限の努力しかしていない。この問題は、社会的放任(social loafing)またはフリーライド(free-riding)と呼ばれ、個人の貢献度にかかわらず、グループのメンバーがグループの利益を均等に受け取ることができる場合に発生する(例:税金で賄われた無料の医療、学校のプロジェクトの成績を共有するなど)。その結果、集団の利益がすぐに枯渇したり、全員が最善を尽くした場合に比べて大きな利益が得られなかったりすることがある。社会的怠惰の典型的な例は、集団でロープを引っ張ると、個人でロープを引っ張ったときよりも少ない労力で済むというもので、この関係は集団の規模が大きくなるほど大きくなる(リンゲルマン効果:[144])。社会的怠惰を助長する要因としては、自分の貢献が特定できないと考えること、自分の貢献は必要ないと考えること、自分の貢献を他人が自由に利用すると期待することなどが挙げられる[145].これらの信念を持ちやすい人もいる。例えば、男性[145]、西洋社会出身者[145]、自分を平均よりも優れていると考える人[146,147]は、ソーシャルローフィングを行う可能性が高いと言われている。

6. 集団の優位性を回復する手段としての多様性

グループのメンバーがお互いに似すぎてしまうという問題を解決するには、グループの多様性を高めることである。

6.1. アイデンティティと機能的多様性

性別、年齢、文化的背景などの個人的特徴の違いを指すアイデンティティの多様性と、人々が認知的に表現し、問題を解決する方法の違いを指す機能的多様性を区別することができる[148]。アイデンティティ多様性は個人の思考を刺激する。自分と似ていない人は自分の立場を再考させ[149,150]、より良い解決策が存在する場合に局所的なピークに留まってしまうリスクを低減する[151]。アイデンティティの多様性によって促進されることがある機能的多様性[152,153]は、グループがより徹底的に仮説空間を探索して、世界のより良いモデルや目前の問題に対するより良い解決策を探すことを保証する[148].

6.2. 認知的分業

グループ内の機能的多様性を高めるための一般的な戦略の1つは、各個人に固有の役割や専門分野を割り当てることである[154]。例えば、ビジネスにおいては、同僚はしばしば自然発生的または意図的に、知識を符号化し、保存し、取り出すためのトランザクティブ・メモリー・システムを開発する[155,156]。特に、符号化の段階では、グループのメンバーは互いの専門分野を特定する。保存段階では、情報は関連する専門知識を持つグループメンバーに伝えられ、これにより最小限の努力で迅速な個人学習が可能となる。検索段階では、ある情報を得ようとするグループメンバーは、確立された専門家に頼めばよい。もし、その情報が信頼できないものであれば、専門分野の割り当てを変更し、情報源の重みを調整する。このように、トランザクティブ・メモリー・システムでは、個人のグループが仮説の空間を分割して探索し、専門家が洗練した解決策を比較することができる。このシステムの有効性は、全員の専門知識を認識し、情報交換の触媒として機能する「メタ知識」チャンピオンを任命することで向上させることができる[157]。

7. 多様な集団が生み出す問題

異なる専門分野を持つ人々のグループは、スーパーブレインと考えることができる[158].グループのメンバーは、異なる機能を果たすニューロンの集団に相当するが、その出力は世界を理解するためにまとめられる[159].しかし、脳よりもグループの方がエラーの余地が大きい。脳は、影響力の競争という問題をすでに解決しており [160]、情報処理を調整するための中央実行システムに依存している [161].多様な人が集まっていると、時間のかかるプロセスになり、結局、ミスコミュニケーションを避けられない可能性がある[152,153]。

7.1. 信頼性と確信度の不適切な評価

我々は、各意見をその信頼性によって重み付けすることで、グループがより良い意思決定を行えることを見てきた(図3)。しかし、他人の意見が自分とは異なる場合、その信頼性を判断するのは困難である。このような場合、我々は不適切な近道を使ってしまう。例えば、ある話題について長時間話すことができる人を専門家と見なすことがあるが、周知のように、最もおしゃべりな人が常に正しいとは限らない [162,163]。高度な教育を受けた人々の間でも、女性は男性よりも能力が低いと暗黙のうちに認識される傾向がある[164]。このような隠れたバイアスにより、女性の意見は、男性が再び発言するまで無視されてしまうことがある(図5).

図5

ある意見がグループの意思決定に与える影響は、その意見の良し悪しではなく、誰がその意見を言ったかに左右されることがある。


他人の意見の信頼性を判断するのが難しいもう一つの理由は、信頼性の指標にはさまざまな要素が反映されているからである。例えば、自信について考えてみよう。人のステータスと、自信を持ってリスクを取る準備ができているかどうかの間には、興味深く、おそらく驚くべき関連性がある [165]。ステータスが高ければ、間違っていることが証明されたときに失うものが大きいので、より慎重になる。しかし、地位が低いときは、正しいことが判明したときに得るものがすべてあるので、大胆に行動することができる。さらに、能力と自信の間には曖昧な関係があることが多い。皮肉なことに、能力の低い人は、自分の能力を誇張して感じる傾向がある [166]。また、明らかな自信にはかなりの個人差があり、それは性格 [167]、性別 [168]、文化 [169] などの個人の特性によって異なる。このばらつきは、多様なグループのメンバー間でのミスコミュニケーションのリスクを高める。多様なグループによってもたらされる複雑さは、おそらく、我々が同じような背景や文化的アイデンティティを持つ個人のグループの中でより快適に感じる傾向がある理由の一つである[109,170,171]。

7.2. 平等バイアス

これまでのところ、能力の真の違いには触れていないが、もちろん能力の違いは存在しており、良い決定を下すためには、能力の低いグループメンバーの意見を捨てるか、少なくとも割り引く必要があることがよくある。しかし、これは我々にとって難しいことである。研究によると、小グループでは、能力の点で全員を同等に扱い、その結果、各意見に同等の重みを与えるというバイアスがあることがわかっている [172].さらに、小グループのメンバーはお互いのあからさまな自信に合わせることが示されており、能力の違いをさらに曖昧にしている[173]。このような平等バイアスの説明には様々な可能性がある。おそらく、対立を回避するためであったり[174]、困難な意思決定の責任を分散させるためであったりするだろう[175]。このバイアスの結果として、無能なメンバーが劣悪な課題解決策を提示し、その回答がプールされると、必然的にグループの決定の精度が低下することになるグループの多様性を高めるためには、能力の違いに注意を払う必要がある。これは難しいことである。なぜならば、事前の交流や即時のフィードバックがない場合、能力を評価することは困難だからである。

8. 提言

我々は、個人の集団が世界の情報をどのように理解するか、また、研究がどのように現実の意思決定に役立つかという関心に基づいて、文献を検討した。これまで述べてきた知見は、任命や助成金の授与を行うパネルや委員会などの小集団の活動に特に関連している。このようなグループは、良い意思決定を行うことを約束し、さらに良い意思決定を行うために努力している。我々が取り上げた問題の多くは、単に良識と思われ、すでに実際に採用されているであろう(例えば、王立協会[172])。しかし、よくあることであるが、後から考えれば、良識を見抜くのは簡単である。このことを念頭に置いて、我々はどのような提言をすることができるであろうか。

8.1. 多様性を活用する

我々は、多様な人々が集まることで、世界の優れたモデルや問題の優れた解決策の探求が容易になることを見てきた [176,177].しかし、多様なグループが同質的なグループよりも優れた意思決定を行うという保証はない。時には、多様性が対立を招き、まったく意思決定ができないこともある。時には、誰がより正しいかというミスコミュニケーションを引き起こし、間違った行動をとってしまうこともある。我々には「ゴルディロックス」という状況がある。つまり、違いすぎる個人は、似すぎている個人と同じくらい悪い影響を与えるのである。多様性の利点を生かすためには、適切に管理しなければならない。

8.1.1. 多様な人材を採用する

アイデンティティ(性別、年齢、文化など)認知スタイル(探索と開拓など)嗜好(願望と目標など)の点で異なる個人を集めることができるという証拠がある。まず、アイデンティティの多様性は、過去の経験や証拠の相関による弊害を軽減する。多様な人々は、異なる経験を利用し、異なる方法で情報を収集する傾向がある。第二に、認知スタイルの多様性は、世界の可能な状態と人が取りうる行動に関する仮説空間の幅広いカバーを保証する [176]。最後に、嗜好の多様性はグループの偏向性を減少させることができる。グループの大多数が好む単一の嗜好がない場合、個人の違いは増幅するのではなく平滑化される[178,179]。

 8.1.2. 多様性の促進

多様性は、専門化を通じてグループのアーキテクチャに組み込まれることがある。専門化は、グループメンバーの知識、解決策、好みの重複を減少させる[154]。アドホックな方法で専門化を実現する一つの方法は、現在のタスクをサブタスクに分割することである。サブタスクの完了に対して個人にインセンティブを与えたり、サブタスクに対して個人に直接責任を負わせることで、専門化を促進することができる[180]。個人の役割の識別可能性が高まることの利点の1つは、おそらく否定的な評価を受ける可能性があるために、社会的な怠惰を減少させることである[181,182]。しかし、アカウンタビリティの向上は、グループのメンバーが否定的な評価を恐れて独創的なアイデアを抑制したり[184]、自分がなぜそうしたのかを正確に弁明しようとして時間と資源を浪費したりするなど、望ましくない副作用をもたらす可能性がある[143]。

8.1.3. ミスコミュニケーションの回避

グループのメンバーが参照するフレームを共有していない場合、情報交換が非効率になる可能性がある。例えば、助成金パネルが申請書を採点する際、異なる経歴を持つパネリストが採点尺度の評点に異なる意味を与えることがある。この場合、評点を集計すると非常に誤解を招く恐れがある[185-188]。このコミュニケーション問題のもう一つの例は、不確実性の記述を扱う地政学的予測の世界から来ている。CIAノートNIE29-51「1951年のユーゴスラビア侵攻の確率」の中で、国家推計局のシャーマン・ケントとその同僚は「クレムリンがどのような方針をとるかを決定することは不可能であるが、我々は1951年のユーゴスラビアへの攻撃は深刻な可能性と考えるべきであると信じている(強調)」と書いている[189]。ケント氏は、国務省の政策立案スタッフの議長から「深刻な可能性」に数字を入れるように求められ、同僚にどのような確率を考えているのかを尋ねた。予測の専門家である情報部員たちが考えていた確率は、20-80(20%)から80-20(80%)まで、まったく異なるものであったため、この提言は役に立たなかった。このようなミスコミュニケーションを避けるためには、グループ考察の最初の段階で、情報交換のための共通の尺度に合意しなければならない[81,86,173]。

8.2. よくある罠の回避方法

8.2.1. 意見の重み付け

グループメンバーが目下のタスクにおいて同等の能力を持っている場合、平等バイアスのリスクに対抗することができる[172]。これができない場合、グループは個人の貢献を明確に評価することを決めることができる[190]。どちらも厄介である。能力の客観的な測定値を得るのは難しく、信頼性のマーカーは誤解を招く可能性がある。

8.2.2. 匿名での交流 社会的適合のリスクは、匿名性を付与することで回避できる場合がある

[191]。例えば、出版前のレビューでは、匿名の意見の価値が評価されている。同僚や経験豊富な専門家からの正直なフィードバックは、科学の発展には欠かせないが、社会的な状況では実現が困難である。匿名性の望ましくない副作用は、自由競争や利己主義が検出されないというよく知られたリスクを伴うことである[145,192]。

8.2.3. 情報の発見

グループが共有情報バイアスを克服するのに役立つ様々な技術がある。その1つである指示的反対は、グループメンバーのサブセットに悪魔の代弁者を務めてもらい[193]、常に現在のコンセンサスと反対の立場を採用するか、またはグループメンバーそれぞれに個人のスタンスに関わらず立場を採用するように求めることである[194]。しかし、問題は、意図的な主張は、本物の主張に比べて、聞き手への影響力が小さいことが多いことである。これは、採用された立場の主張があまり自信を持っていないためであると考えられる[195]。もう一つの手法は、中断禁止のルールを設けることである。中断されるのは、共有されていないアイデアや、男性優位の環境にいる女性など、議論に多様性をもたらすグループメンバーである傾向がある[196]。また、発言時間は権力やジェンダーなど、目前のタスクに関係のない要因と相関する傾向があるため、各グループメンバーには一定のフロアタイムが割り当てられることもある[197,198]。最後に、時間が許す限り、長時間の議論は、共有されていない情報が最終的に持ち出される確率を高める [199]。

8.2.4. 明示的なルール

自由なやりとりは仮説空間を探索するのに適した方法であるが、アイデアを急速に狭めてしまうこともある.例えば、グループのメンバーが仮説空間の小さな部分に固執したり、お互いのアイデアに早く適応しすぎたりすることがある[114,116].このような情報損失をグループで克服するために考案された手法の一つが、1950年代にランド社のメンバーによって開発されたデルファイ法である[200]。この方法は、さまざまなタスクについて、制約のない話し合いよりも優れたグループ決定を導くことが示されている[201]。その古典的な形態では、グループのメンバーが個人的に個人の意見と根拠を概説し、この情報は匿名化された要約を照合するモデレーターに渡され、グループのメンバーはこの情報を提示され、最初の意見を修正する機会が与えられる。このプロセスは、コンセンサスまたは事前に指定された停止基準に達するまで繰り返される[202]。デルファイ法が機能する理由はいくつかある。グループでの議論が固定化されていないこと、匿名性によって評価の不安や防御的な補強の問題が取り除かれること、グループのメンバーが発言時間を競う必要がなく、互いの思考の流れを中断することができないため、生産ブロックの余地が少ないこと、反復的なプロセスによって、良い議論が表面化した後に個々の考えを変えることができることである [202]。

8.2.5. 優れたリーダーシップ

グループでの意思決定は複雑であるため、モニタリングプロセスを設けておくことが賢明である。これは、グループの議長またはリーダーによって達成することができる。議長は、意思決定プロセスが避けるべき正確な落とし穴を明示すべきである。議長は、作用している可能性のある様々なバイアスを認識し、それらが発生した場合には指摘するべきである。議長は、グループのメンバーが解決すべき問題の性質に同意していないことに特に注意すべきである。この場合、それぞれの解決策を議論しても実りあるものにはならない。経験上、どのような行動をとるのがベストかということについての異なる考えは、目の前の問題についての異なる考えに根ざしていることがある。このような場合、一見すると別の解決策のように見えても、実際には全く別の問題に対する解決策であるため、議論に多くの時間を費やすことになる。グループリーダーのもう一つの重要な役割は、グループの長期的な目標を考慮することである。特に、長期的な目標が目先の目標と相反する場合には注意が必要である。グループの全体的な有効性と長期的な意思決定の質のためには、全員の意見に耳を傾けることが重要な場合がある。これは、特定の目的のために集められた一回限りのパネルの場合にはあまり当てはまらないが、長期的なプロジェクトを遂行するために効果的なグループを構築する上では重要な要素である。また、議長はスピードと正確さのトレードオフを意識する必要がある。時には、グループの動きが遅すぎて、他の機会を失ってしまうこともある。また、グループの動きが速すぎて、結果的に誤った決定を下してしまうこともある。

9. まとめ

これまでバイアスに焦点を当ててきたことで、バイアスは良い意思決定をするために常に克服しなければならないものだという印象を与えたかもしれない。しかし、これは我々が広めたいと思っている話ではない。バイアスは、我々の認知システムの現実である。それは、効率性のために支払うべきコストである。バイアスとは、ベイジアンフレームワークにおけるプライヤーと考えることができる。これらのプライヤーは、自然や文化によって受け継がれてきたものである。バイアスは、我々に良い影響を与える。バイアスは、学習した習慣では対応できないような新しい状況での意思決定に役立つ。致命的ともいえる逡巡を避けることができるのである。しかし、バイアスが時代遅れで不適切なものである場合には、悪い影響を与える。また、局所的な最大値から抜け出せなくなってしまうこともある。

意識的にバイアスを変えることはできるのか?意思決定の際に自分のバイアスを意識することはあまりないが、後から振り返ることはできるし、バイアスは変えられる。また、自分自身よりも他人、特に多様性のある他人にとっては明らかであり、そのため議論の対象となることもある。なぜ我々は自分の偏見を変えたいと思うのであろうか?その理由は簡単で、もし我々が自分の偏見に全面的に委ねてしまったら、いつも通りの仕事しかできなくなり、世界のモデルを改善することも、我々が直面している多くの問題のより良い解決策を見つけることもできなくなってしまうからである。

謝辞

本記事の執筆を依頼し、執筆過程でご指導いただいたUta Frith氏、および初期バージョンの記事にコメントをいただいたことに感謝する。また、Rani Moranには、グループにおける情報統合の数理について議論していただきた。

付録A. ベイズ推論

仮説は、意思決定において中心的な役割を果たす。我々が意思決定を行う際には、現在の問題とその解決方法に関する競合する仮説に対して、賛成の証拠と反対の証拠を比較検討する。例えば、医師は患者の病歴や検査結果を見て、正しい可能性の高い診断と成功の可能性の高い治療法を見極めようとする。理想的には、仮説を評価し、新しい証拠が得られればそれを更新するために、原則的な方法を使用したいものである。ベイジアン推論は、過去の経験と新しい証拠を統計的に活用することで、まさにそれを実現する。ベイズの基本的な考え方は、仮説に対する確信の度合いを確率として表すことができるというものである。そのため、確率の法則を利用して、新しい証拠が出てきたときに信念の度合いを更新することができる。

ベイズ推論の主力は、トーマス・ベイズ(1701-1761)にちなんで名付けられた「ベイズの定理」である。この定理により、「新しい証拠があれば、ある仮説が真実である確率はどのくらいか?この計算には、大きく分けて2つの要素がある。1つ目の要素は事前情報である。事前とは、新しい証拠を考慮する前の仮説に対する我々の確信の度合いを表すもので、背景情報や関連する過去の経験が集約されている。2つ目の要素は「尤度」である。尤度は、新しい証拠が仮説とどの程度一致するかを表する。例えば、「コインは公平である」という仮説の下で、10回のコイン投げのうち9回で頭を観察する可能性がどの程度あるかを考える。この可能性は、世界がどのように機能するかについての我々のモデルに決定的に依存している。例えば、我々は、コインが公正であれば、どちらかの方向に同じ頻度で落ちると仮定している。もう1つの理解すべき用語は「事後」である。これは、事前予測と尤度を統合したものである。事後は、新しい証拠を取り入れた後の仮説に対する我々の確信の度合いを表しており、仮説の良さを評価するために使用することができ、ベイズの法則の次の反復において優先順位として機能することができる。ベイズの法則とベイズ更新を図6と図77で説明する。

図6 ベイズの推論

(a) ベイズの定理。ここで、「p」は確率、「|」は与えられたものという意味で、p(hypothesis|evidence)は、証拠があればその仮説が正しいという確率を意味する。正規化定数は、仮説に関係なくデータを観測した場合の限界尤度であり、異なる仮説の事後確率が1になるようにしている。(b) 診断的推論におけるベイズの定理の使用。ある医師が、検査結果が陽性の患者が前立腺がんである確率p(+cancer|positive)を計算したいとする。この検査は、75%の確率で正しく検出され、p(positive|+cancer) = 0.75、10%の確率で偽陽性となり、p(positive|-cancer) = 0.10となる.また、前立腺がんの基礎率はわずか4%で、p(+cancer)=0.04であることもわかっている。

図7 ベイズ更新

An external file that holds a picture, illustration, etc. Object name is rsos170193-g7.jpg

30%の確率でヘッドが出るような偏ったコインが提示されている。各ヒートマップは、コインのバイアスに関する仮説(縦軸)に対する我々の事後評価(色)が、より多くのコイントス(横軸)を観察することによってどのように変化するかを示している。白い線は真の値を示している。ある時点での事前情報は、直前の時点での事後情報である.時点1の事前分布は、(a)仮説間で平坦、(b)真値に集中、(c)誤った値に集中、のいずれかに設定されている。

なぜ事前情報と尤度の両方を考慮することが重要なのであろうか?図6のような例を考えてみよう。医師が前立腺がんの診断テストを実施したところ、75%のケースで正しく検出され、10%のケースでしか誤検出されなかった。患者が前立腺がんである確率はどのくらいであろうか?ほとんどの人、そして医師の中にも、診断テストの結果を重視して70%程度と答える人がいます [203]。しかし、前立腺がんが男性の4%にしか見つからないとすれば、図6の計算でわかるように、正解は約24%にしかならない。また、事前情報と尤度の精度を考慮することも重要だ。前立腺がんの基礎率の推定値が曖昧だったり、信頼性の低い情報源から得られたものであれば、診断テストをより重視すべきである。ベイズ推論では、信念を一点推定ではなく、確率分布で表現することで精度を実現することができる。精度の概念を図8に示する。

図8 精度

このプロットでは、事前、尤度、事後を点推定値(つまり単一の数字)ではなく、確率分布で表している。図7のように、偏ったコインを考える。分布の幅は分散と呼ばれ、精度は分散の逆数(1/分散)である。事前分布と尤度が統合されると、事後分布はより正確な成分に向かっていく。なお、複数の情報源を統合しているので、事後分布は2つの分布のどちらよりも精密になる。

付録B. 異なる戦略におけるグループのパフォーマンス

全てのシミュレーションにおいて、グループとそのメンバーが連続変数の値を推定していると仮定した(例えば、Galtonの古典的な研究のようにOxの体重)。異なる戦略と状況が、共同推定値の精度(信頼性)に与える影響を調べた。

B.1. 共同推定値の信頼性は、グループの大きさとともに増加する

ここでは、グループの各メンバーiの個人推定値xは、ガウス分布N(s, σ2)からサンプリングされると仮定する.ここでは、グループが個々の推定値を平均して共同推定値を計算すると仮定する.

z=1n∑i=1nxi,
ここで、nはグループサイズである.個々の推定値の誤差はガウス分布に従うので、共同推定値の誤差も同様になる.与えられたグループサイズの場合、共同推定値の標準偏差は

σgroup=σn√,
であり、共同推定値の精度は

pgroup=1σ2groupとなる。
グループサイズと信頼性には線形関係があることがわかる。

B.2. 意見を信頼性で重み付けすることが重要である

ここで、各グループメンバーiの個人推定値xは、ガウス分布N(s,σ2i)からサンプリングされていると仮定する。このように、最高のグループメンバーの推定値は、最悪のグループメンバーの推定値よりも最大で16倍も分散が小さくなる。個々の推定値がその精度の点で異なる場合、最適な戦略は、各推定値をその精度で重み付けすることである.

zoptimal=∑ni=1pixi∑ni=1pi,
ここで、nはグループサイズである.この最適戦略のもとでは、共同推定値の精度は個々の精度の合計である.

poptimal=∑i=1npi,
ここで、個々の精度はpi=1/σ2iである.

単純な平均化戦略では、個々の精度は考慮されない.

z=1n∑i=1nxi,
ここで、nはグループサイズである.与えられたグループサイズでは、共同推定値の標準偏差は

σ2simple=∑ni=1σ2in2,
であり、共同推定値の精度は

psimple=1σ2simpleとなる。
図中の各データポイントは、1000回のシミュレーションを平均して算出した。

B.3. 相関関係にある意見が共同推定値の信頼性を低下させる

各グループのメンバーiの個人推定値xは、多変量ガウス分布N(s, Σ)からサンプリングされていると仮定する(sは平均ベクトル

s=⎛⎝⎜⎜s⋮s⎞⎠⎟⎟である。
ここで、sはすべてのグループメンバーで同じであり、Σはi≠jに対してΣj,j=1,Σj,k=rとなる共分散行列であり、rは個々の推定値間の相関を表している。ここでは、r = 0.1、r = 0.3、r = 0.6 を使用した。グループは、個々の推定値を平均して、その共同推定値zを計算すると仮定した。

z=1n∑i=1nxi.
シミュレーションを行うことで、単純な平均化戦略の下での期待分散を、平均共同推定値の二乗誤差として計算することができる.

σ2group=∑ql=1z2lq,
ここで、qはシミュレーションの数である.そして、単純平均法による期待精度を次のように計算することができる。

pgroup=1σ2groupとなる.
図中の各データポイントは、1000回

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー