自己欺瞞の普遍性を理解する

Contents

要約
目次
1　はじめに
2. インパクト・バイアスの進化：ノイズの多い環境における選択のための感情予測の最適化
2　文献レビュー
3　価値観の同類性は協力に利益をもたらすが、誤った社会情報を用いる動機となる
4　インパクトバイアスの進化：ノイズの多い環境における意思決定のための感情予測の最適化
5　信頼は、部分的な情報とパートナーの選択が与えられた場合に、高価な罰を媒介する
6 高価な処罰戦略の異質性は適応的である
7 信頼と最後通牒ゲームにおいて、高価な罰は中立的にドリフトする
8　フォーマルなレビューとそうでないレビューの混合が、非効率的な医療機関において最良の患者ケアをもたらす
9 結論

Understanding the Ubiquity of Self-Deception The Evolutionary Utility of Incorrect Information

purehost.bath.ac.uk/ws/portalfiles/portal/187953332/Rauwolf_Understanding_the_Ubiquity_of_Self_Deception.pdf

ラウウルフ, ポール 2016 バース大学

本論文の著作権は著者にある。本論文へのアクセスは、上記のライセンスが与えられている場合、それに従うものとする。上記のライセンスが指定されていない場合、本論文のオリジナルコンテンツは、クリエイティブ・コモンズ表示 – 非営利 4.0の条件でライセンスされている。

要約

意思決定をするとき、個人がすべての事実を把握していることはめったにない。これは、行動が一刻を争う世界では許されることである。人生の中で、環境のニュアンスをすべて理解する余裕などめったにない。しかし、個人が貴重な情報を無視するのは、それを得るのにコストがかかる場合だけでなく、真実の情報が自由に入手できる場合であっても無視することが多い。状況を正確に理解する代わりに、無知と誤解の助けを借りて決断を下すことが多いのである。本論文は、その理由を検証しようとするものである。このような行動が常に認知の限界によって引き起こされるという考え方に反論する。その代わりに、様々な状況において、確かな情報を無視することが有利に働く可能性があることを示す。この研究を通して、個人が自由に入手可能な情報を一貫して無視することが研究で示されているいくつかの状況を検証する。形式的な分析とシミュレーションを組み合わせることで、そのような行動が有利になりうることを実証する。協同社会（第3章）、予測不可能な環境（第4章）、投資市場（第5章～第7章）、非効率的な制度（第8章）をナビゲートするためには、確かな知識を欠くことが機能的になりうる。この研究は、これまで混乱していた人間の行動の説明に貢献するだけでなく、自己欺瞞の潜在的な利点（第2章）についての洞察も提供している。

謝辞

何よりもまず、父に感謝したい。容赦のない世界では、好奇心は簡単にしぼんでしまう。次の丘の向こうを覗き込む方法を教えてくれてありがとう。指導教官であるジョアンナ・ブライソンには深く感謝している。ジョアンナは、萌芽的なアイデアを学問的な作品に仕上げてくれただけでなく、その過程は魔法ではないことを辛抱強く説明してくれた。同僚のドミニク・ミッチェル、ダニエル・テイラー、スウェン・ゴードル、ロブ・ウォルサムにも感謝している。コーヒーはこれほど啓発的なものではなかった。私の最も古い批評家であるヨハン・ネイラーとライアン・ルイスには、月曜から土曜は日曜なしでは成り立たなかっただろう。最後にレイチェルへ、あなたの心とは対照的な私たちの静かな生活のために。

1 はじめに
- 1.1 論文
- 1.2 モチベーション
- 1.3 そのような行動は機能的か？
- 1.4 テーゼ確かな知識の欠如は偏在的に適応的である
- 1.5 メソッドの概要適応戦略
- 1.6 各章の要約
2 文献レビュー
- 2.1 定義
  - 2.1.1 誤信、誤信、戦略的に間違っていること
  - 2.1.2. 欺瞞
  - 2.1.3 自己欺瞞：哲学的ソワレ
  - 2.1.4. 機能的説明はどこにあるのか？
  - 2.1.5 まとめ
- 2.2 自己欺瞞の進化に関する既存の理論
  - 2.2.1 誤信の進化と戦略的に間違っていることの定義
  - 2.2.2. 心理的利益
  - 2.2.3 トリバース自己欺瞞は対人欺瞞を強化する
  - 2.2.4. 誤信の進化
- 2.3 まとめ
- 自己欺瞞の理論的研究に対する3つの障害
  - 2.3.1 私たちは何について話しているのか？
  - 2.3.2. 大きな意見の相違が残っている
  - 2.3.3 その場しのぎのカテゴリー化
- 2.4 自己欺瞞の進化に必要な条件
  - 2.4.1 必要条件1：自己欺瞞の行動は以下のものでなければならない
  - 利点を提供する（あるいは少なくとも不利にならない）
  - 2.4.2 必要な条件2：自己欺瞞は誤った信念を持っている
  - 2.4.3. 必要条件3：誤った信念は適応行動を促進しなければならない
  - 2.4.4 動機づけ主義は脱落する
  - 2.4.5. 意図主義者の条件
  - 2.4.6 理論家の要件
  - 2.4.7. 誤信と戦略的に間違っていることの要件
  - 2.4.8 まとめ
- 2.5 信念の進化可能性を分析することの難しさ
- 2.6 前へ進む：偽情報を用いることの進化
- 2.7 結論
価値の同類性は協力に利益をもたらすが、誤った社会情報を使う動機になる
- 3.1 まとめ .
  - 3.3.2 一次規範と二次規範 .
  - 3.4.1 シミュレーション .
- 3.5 モデル 2: 同族性
  - 3.5.1 シミュレーション .
- 3.6 モデル 3: 不正確な社会情報 v. 正しい個人情報
  - 3.6.1 シミュレーション .
  - 3.6.2 VDISCの安定性：
- 3.8 結論
4 インパクト・バイアスの進化：ノイズの多い環境での意思決定のための感情予測の最適化
- 4.1 まとめ
- 4.2 はじめに
- 4.3 背景
  - 4.3.1 インパクト・バイアスの原動力
  - 4.3.2. 学習に対する頑健性
  - 4.3.3 近接的説明
  - 4.3.4. インパクト・バイアスは選択的優位をもたらすか？
  - 4.3.5 個人差
  - 4.3.6. エラー管理理論
- 4.4 研究1：ノイズの多い環境における最適な意思決定
  - 4.4.1 モデル1a：予測可能な環境
  - 4.4.2. モデル1b：予測不可能な環境
- 4.5 研究2：個人的経験から学ぶ（あるいは学ばない）
  - 4.5.1 モデル
- 4.6 一般的考察
  - 4.6.1 強度はインパクト・バイアスを増加させる
  - 4.6.2. ノイズが多いほどインパクト・バイアスが増加する
  - 4.6.3 確率的情報は感情予測を変える
  - 4.6.4. ノイズがない状況でのインパクト・バイアス
  - 4.6.5 自己欺瞞
  - 4.6.6. 結論
5 信頼は部分的な情報と相手の選択がある場合に、高価な罰を媒介する
- 5.1 まとめ
- 5.2 はじめに
- 5.3 信頼ゲームの文脈における費用的処罰
- 5.4 信頼の進化
  - 5.4.1 モデル
  - 5.4.2. 結果
- 5.4.3 考察
- 5.5 部分的情報によるコスト的処罰の進化
  - 5.5.1 モデル
  - 5.5.2. 結果
  - 5.5.3 考察
- 5.6 信頼がなければ費用的処罰は適応しない
  - 5.6.1 結果
  - 5.6.2. 考察
- 5.7 総論
- 5.8 結論
6 コスト的懲罰戦略の異質性は適応的である
- 6.1 まとめ
- 6.2 序論
- 6.3 モデル
- 6.4 結果
- 6.5 考察
  - 6.5.1 検証的知識を欠いている
  - 6.5.2.なぜdよりもσを進化させるのか？
- 6.6 結論
7 信頼と最後通牒ゲームにおける費用的処罰の中立的ドリフト
- 7.1 まとめ
- 7.2 はじめに
- 7.3 MAOの変動は罰せられない：玩具の例
  - 7.3.1 結果
  - 7.3.2. 不公平なオファーを十分に罰すれば、戦略は中立的にドリフトする
  - 7.3.3 考察
- 7.4 個々のMAOの変動は罰せられない：
- 実証例
  - 7.4.1 結果
  - 7.4.2. 考察
- 7.5 母集団の平均MAOは期待ペイオフの代用にはならない
  - 7.5.1 戦略対直接反応法
  - 7.5.2. 金銭的賭け
  - 7.5.3 ローカルな競争とグローバルな競争
  - 7.5.4. 遅延反応
  - 7.5.5 議論
- 7.6 総論
  - 7.6.1 提案者はIMOをプレーするのか？
  - 7.6.2. 他者が公正さを求めるなら、なぜMAOを下げないのか？
  - 7.6.3 検証的知識の欠如
- 7.7 結論
8 非効率な医療機関では、正式なレビューとそうでないレビューの混合が最良の患者ケアをもたらす
- 8.1 まとめ
- 8.2 はじめに
- 8.3 モデルの概要
  - 8.3.1 ラウンド
  - 8.3.2. 内部告発の申し立てと解決
  - 8.3.3 結果の分析
- 8.4 モデル1：（ユートピックな）ベースライン
  - 8.4.1 結果
  - 8.4.2. 考察
- 8.5 モデル2：加担と情報の難読化によって患者ケアが改善される場合
  - 8.5.1 結果
  - 8.5.2. 考察
- 8.6 モデル3：より効率的なレビュー
  - 8.6.1 結果
  - 8.6.2. 考察
- 8.7 モデル4：時間の結果
  - 8.7.1 結果
  - 8.7.2. 考察
- 8.8 モデル5：ソフトで監視されない助言と内部告発の比較
  - 8.8.1 結果
  - 8.8.2. 考察
- 8.9 総論
9 結論
- 9.1 論文
- 9.2 各章の要約
- 9.3 限界と今後の課題
- 9.4 適応的無視に共通する環境の特徴
- 9.5 まとめ
A 第3章の付録
- A.1 社会規範
  - A.1.1 モデル2：同類性
  - A.1.2 モデル3：VDISCの安定性
- A.2 モデル2：連続的評判
- A.3 同類性の定義
- A.4 単純化
- A.4.1 DISCの安定性の単純化
- A.4.2 VDISC安定性の単純化
B 第8章の付録
- B.1 5%と10%の問い合わせ依存性
- B.2 モデル2 50,000ラウンドの場合
- B.3 100,000ラウンドを超える5%と10%モデル
- B.4 有害なソフトアドバイスのための変更増加

1　はじめに

「汝自身を知れ」

ソクラテス『パイドロス』

人間は自分自身の何を知っているのだろう！一度でも、まるで照明のついたガラスケースの中にいるように、自分自身を完全に認識することができるだろうか。自然は、腸の蟠りや血流の速い流れや繊維の震えから遠く離れた、高慢で欺瞞に満ちた意識の中に彼を閉じ込め、呪縛するために、彼の身体についてさえ、多くのことを彼から遠ざけてはいないだろうか？そして災いなことに、意識の部屋の裂け目から一度だけ覗いて見下ろし、人間が無慈悲で、貪欲で、飽食で、殺人的な存在であることを、無知の無関心さの中で感じ取るかもしれない好奇心が、いわば夢の中で虎の背中にぶら下がっているのだ。このように考えると、真理を求める衝動はいったいどこから来るのだろうか？

ニーチェ『真理と嘘について』

1.1 テーゼ

意思決定をするとき、個人は必ずしも世界を正確に理解しているとは限らない。有限の時間の中で完璧な情報を集めることはしばしば不可能であるため、これは予想されることである。その結果、人間の意思決定における誤りの多くは、時間的制約のせいにされる。情報をわずかなコストで得ることができれば、意思決定は改善されるという仮説である（Shah and Oppenheimer, 2008）。

多くの文脈では間違いなくそうだが、私の論文は、真実の知識が意思決定を妨げる、まだ発見されていない様々な環境が存在するというものである。本論文では、人間が行動を選択する際に情報を無視したり偏ったりすることが知られている様々な状況を分析する。私は、人間の認知の脆弱性を表すのではなく、真実の情報にバイアスをかけたり無視したりする戦略が、自由な真実の知識を用いる個人を凌駕する可能性があることを実証する。そのため、この研究は、情報を偏らせることがどのような場合に有利に働くかについての議論を拡張するものである。さらに、これらの結果は、自己欺瞞や誤信念のような認知バイアスの進化の研究を拡張するための重要な枠組みを提供すると主張する。

1.2 動機

人は誤った情報で意思決定を行う

意思決定をするとき、個人は常に世界を正確に理解しているわけではない。私たちは、いくつかの性格的特徴に基づいて他人の価値を一般化する（Nisbett and Wilson, 1977）。私たちは、客観的にそうである以上に、自分は未来をより大きくコントロールできる（Langer, 1975）、他人は自分と同じ意見を持っている（Marks and Miller, 1987）と信じている。不正確な社会的情報を他の霊長類よりも長く保持することさえある（Whiten et al.）

世界の複雑さを考えれば、これは驚くべきことではない。個体が環境のニュアンスをすべて把握し、ベイズ的合理的な方法で情報を処理できるわけがない（Johnson et al.） 必ず、多くの最適でない決定は、時間、情報、認知の制限の結果であり、私たちの合理性は限定されている（Simon, 1972, 1991）。情報を得るには時間がかかり、意思決定はしばしば時間に左右されることを考えると、私たちが他の多くの種と同じように行動し、「『満足』するのに十分な適応をする……一般的には最適化しない」（Simon, 1956, p.129）というのは、重要なトレードオフのように思える。

真実の情報が無料であっても、人は偽の情報で決断を下す

もし人間の意思決定バイアスが情報取得の時間的制限によって説明できるのであれば、これ以上議論する必要はないだろう。しかし、個人は時間がないときに誤った情報を用いるだけではない。個人はまた、真実の情報が自由に入手できる場合でも、それを無視する傾向がある。

例えば、感情的な結果を伴う意思決定（すなわち、情動に富んだ文脈）をするとき、個人は確率的な情報を無視する傾向があり、たとえそのような情報が自由に利用可能であっても、私たちは確率的に鈍感である（Loewenstein et al.）衝撃を避けるために代償を払うかどうかを決めるとき、私たちは99%の確率と1%の確率の衝撃を同じように処理する（Rottenstreich and Hsee, 2001）。将来の感情体験を予測する際、感情強度が高まると確率に対する感度が低下する（Buechel et al.）感情豊かな文脈における人間の意思決定をアルゴリズムで記述しようとすると、確率的情報を無視することが最も適合度の高いモデルにつながる（Suter et al.）

このような確かな情報を無視する傾向は、一部のニッチな文脈だけに見られるものではなく、むしろどこにでもある。相手の社会的行動に関する正確な歴史的記録が与えられているにもかかわらず、人は誤りを犯しやすい社会的評判に基づいて相手と協力するかどうかを決定し、真実の歴史的説明を無視する（Sommerfeld et al., 2008）。もう1つの例として、将来の状況で自分がどう感じるかの予測に系統的な偏りがある（Gilbert et al.）しかし、何度も同じ場面に遭遇しているにもかかわらず、感情予測を誇張してしまうのである（Lacey et al., 2006;Scheibe et al., 2011;Wilson et al., 2003b）。

Chanceら(2011)は、参加者の試験結果予測能力を分析した。参加者はそれぞれ2つのテストを受けた。2つのテストの間に、各自が模擬テストの点数から最終試験の結果を予測した。参加者は2つのグループに分けられた。模擬テストでは、一方のグループには試験中に使用する解答が与えられた。対照群は、補助なしで模擬テストを受けた。どちらのグループも、最終テストでは補助は与えられなかった。模擬試験中にカンニングペーパーを渡されたグループは、対照グループに比べて、最終試験でより高い、不正確な結果を予測した。このグループは、模擬試験で成功したのはカンニング・シートのおかげではなく、自分の知能のおかげだと誤認したのである。

おそらく、カンニング・シートのグループはカンニング・シートなしのテストを経験していなかったので、このようなバイアスは許されるかもしれない。参加者は自分の能力を推測するのに十分な情報を持っていなかったとも言える。Chanceら(2015)はこの点を検証した。彼らはChanceら(2011)の実験を2回、連続して繰り返した。まず、カンニング・シートのグループは、解答ありのテストを受け、次に解答なしのテストを受け、再び解答ありのテストを受け、最後に補助なしでテストを受けた。対照群は、補助なしで4回のテストを受けた。各受験者は各試験の前に結果を予測した。2回目のテスト（つまりカンニングペーパーなしの1回目のテスト）に臨んだ実験グループは、カンニングペーパーなしの結果という冷厳な現実に直面した。その結果、カンニング・シート・グループは、3回目のテストの予想を下げた。しかし、カンニングペーパーを再び渡されたとたん（テスト3）、彼らは再び、補助なしの試験の予測を誇張した（テスト4の予測）。実際の技能を学ぶ十分な機会が与えられているにもかかわらず、参加者は自分が客観的な事実よりも優れていると信じ続けたのである。

これは、歴史が明らかにするよりも自分の方が優れていると信じる人間の傾向の一例に過ぎない。成功も失敗も知らされる人生にもかかわらず、私たちはさまざまな領域で自分の能力を過度に楽観視している（Alicke et al., 1995; Sharot, 2011）。他人と比べて自分は運転がうまい（DeJoy, 1989; Dalziel and Job, 1997）、離婚する確率が低い（Weinstein, 1980）、長生きする（Weinstein, 1980）と信じている。

人々は自分が真実の情報を無視していることに気づいていない

個人は自由に利用できる情報を無視するだけでなく、その行動に気づかないことも多い。少数のデータに基づいて他人の一般的な性質を判断していることに気づいていないのだ（Nisbett and Wilson, 1977）。生涯をかけて客観的に裁こうと試みているにもかかわらず、裁判官が最近食事をした場合、囚人に仮釈放を申し出る可能性が6倍高くなる（Danziger et al.） 食事休憩の後、約60%の囚人が仮釈放されるが、食事休憩の前に仮釈放されるのは約10%になるまで、その割合は着実に減少する。冷たい飲み物と熱い飲み物を飲むという単純なことで、求職者を採用する可能性は低下する（Williams and Bargh, 2008）。

前述のように、個人は自分の感情予測に偏りがあることを学ばないだけでなく、予測の成功を誤って記憶している。チームのスーパーボウルでの敗北（Meyvis et al., 2010, 研究1）や大統領選挙（Meyvis et al. 感情的な予測を評価しようと何度も経験したにもかかわらず、私たちは予測を調整することを学ばず、「自分の無知を知らない」のである（Kahneman, 2011）。

1.3 そのような行動は機能的か？

自由で確かな情報を無視することが優位性をもたらすことはあるのだろうか？帰無仮説は、そのような行動は人間の認知の欠陥の結果であり、もし個人がそのような落とし穴を避けることを学ぶことができれば、その方が良いというものである。これは、このような偏った判断の多くが有害な結果につながるという事実からも支持される。

確かな情報を無視することは犠牲を伴う

苦痛を伴う状況でどれほどの不快感を感じるかを誇張する人は、運動をしたり（Ruby et al., 2011）、健康診断を受けたりする傾向が低い（Janz et al., 2007; Dillard et al., 2010）。目標を達成することで得られる利益を誇張する人は、不可能な課題を追求するために多くの時間を浪費する。(Greitemeyer et al., 2011)。信頼する個人は、経済的ゲームをする際にしばしば搾取される。(Berg et al., 1995)。

確かな情報を無視すると有利になる

しかし、すべてが悲観的なわけではない。意外なことに、真実の情報を偏らせたり無視したりすることで、利益が得られると思われる例も数多くある。自己肯定感などの肯定的な錯覚が心理的な利益をもたらし、自尊心や精神的健康のレベルを高めるという仮説を支持する証拠は多い（Taylor and Brown, 1988）。自己肯定感は、早期乳がん患者における症状の軽減と正の相関がある（Creswell et al., l07）。自分の知性を誇張して信じることは、人生満足度と自尊心の両方に正の相関がある（Dufner et al.）

世界に対する正確な理解は有害な場合もある。問題のあるギャンブラーは、負けた後の気分の悪さをより正確に予測する。(Willner-Reid et al., 2012)。将来の感情体験の楽しさを正確に予測することは、自殺企図や逃避妄想と相関している（Marroqu´un et al.） 一般に、軽度から中等度のうつ病患者は、対照群と比べてより正確な世界観を持っている（Alloy and Abramson, 1979）。さらに、コントロールの錯覚は抑うつ症状と逆相関している（Alloy and Clements, 1992）。

偽情報の進化的利点

真実の情報を無視することが好都合であるとすれば、そのようなバイアスが自然淘汰を生き延び、機能的な利点をもたらしているのだろうか？偽情報の利用が進化上の利点をもたらすかどうかに焦点が当てられるようになったのは、比較的最近のことである。前述したように、ヒューリスティクスが時間的制約のある状況での意思決定を補強することはよく知られているが（Simon, 1956; Higginson et al., 2015; Haselton et al. このような行動の進化的実現可能性は、ヒトがこれらの意思決定バイアスの多くをヒト以外の霊長類と共有しているという事実によってさらに立証される（Santos and Rosati, 2015）。もしヒト以外の霊長類にも同様のバイアスがあるとすれば、おそらくそのような意思決定メカニズムは、ヒトの系統発生史の奥深くで選択されたものなのだろう。

自己欺瞞の進化

個人はしばしば自分が真実の情報を無視していることに気づかないことから、進化論者は、ヒトが自分自身を欺くように進化した可能性があるかどうかを検討し始めた。具体的には、自己欺瞞の進化と誤った信念の永続化に必要な環境的特徴を理解しようと研究が進められてきた。自己欺瞞は高い自尊心を与え（Taylor and Brown, 1988; Ramachandran, 1996）、他者を欺くことを助け（Trivers, 1991; von Hippel and Trivers, 2011a; von Hippel, 2015）、騒がしい環境での意思決定を強化する（Ramirez and Marshall, 2015）と論じられてきた。詳しいレビューは第2章を参照のこと。

障害より多くのデータが必要

このような研究は、真実の情報を偏らせたり無視したりすることが、どのような場合に適応的となりうるかを診断する上で予備的な進歩を遂げたが、この分野はまだ始まったばかりである。確かな情報を無視することの進化に必要な条件について理論を一般化しようと試みる前に、文献はそのような行動を可能にする環境を徹底的に探索しなければならない。現在のところ、考えられる説明はほんの一握りしか存在しない。自己欺瞞の進化に関する研究も同じ問題を抱えている。自己欺瞞を増大させる選択的圧力をしっかりと探索することは、文献から欠落している。自己欺瞞に関する研究をさらに発展させるにはどうすればよいのだろうか？不思議なことに、この問いに対する答えが議論されることはほとんどない。むしろ、ほんの一握りの理論の進化的実現可能性を分析することに議論が集中している。その結果、現在の文献は、自己欺瞞を促進する可能性のある新たな環境を探索するための明確な道筋がなく、やや限定的なものとなっている。

1.4 テーゼ確かな知識の欠如は偏在的に適応的である

私の論文は、真実の情報が意思決定を妨げる、まだ発見されていない様々な文脈が存在するというものである。この研究は、文献における2つのギャップを埋め始めるものである。第一に、確かな情報を無視したり偏らせたりすることが適応的である既知の環境を拡大する。第二に、自己欺瞞が適応的である可能性のある新たな環境を診断する助けとなる。第2章では、自己欺瞞の多くの形態（すなわち、誤信、戦略的に間違っていること、認知バイアス）が進化するための前提条件は、偽の情報を使って意思決定を行うことが、（自由な）真実情報を使うよりも優れている環境であると論じている。このように、真実情報にバイアスをかける圧力を生み出す環境を新たに発見することは、同時に自己欺瞞の進化に潜在的な可能性を持つ環境を発見することでもある。

一連の6つの実験を通して、真実の情報が自由であっても、誤った情報を採用することの利点を実証することで、科学的な難問を解決する。この研究を通して、世界を誤って理解することの広範な有用性と適応性を示す証拠を発見した。さらに、これらの発見は、自己欺瞞が適応的である既知の環境を拡大する可能性がある。

1.5 手法の概要適応的戦略

ある環境において、情報を無視することが有利かどうかをどのように評価するのだろうか。さらに、そのような戦略が自然淘汰を生き残る可能性があることを、どのように証明するのだろうか？この研究では、様々なタスクにおいて、異なる量の真実の情報と偏った情報を使った戦略のパフォーマンスを比較する。もし、ある課題に対して支配的な戦略が、真実の情報を偏らせたり無視したりするものであれば、その戦略は真実の知識を用いる戦略と比較して適応的である。

しかし、進化の基本的な考え方のひとつに、「自然淘汰は必然的に、生まれながらにしてその国に最も適応した体質を持つ個体を保存する傾向がある」というものがある（Darwin, 1872, p.161）。したがって、もし真実の情報に偏ることが他の戦略よりも優れているならば、そのような行動は自然淘汰によって好まれる可能性が高い。

この研究を通して、私はエージェントベースのモデリングと形式的分析を組み合わせて、適応的戦略を検証している。頻度に依存しない環境と頻度に依存する環境の両方において、適応的戦略を探索する（下記参照）。本節の残りの部分では、本研究で使用した方法論について述べる。

定義確かな情報

偽情報と真正情報の有用性を比較するためには、真正情報はきちんと定義されていなければならない。本研究では、情報の正しさとは、世界のある状態を指すものとする。例えば、第4章では、エージェントはある行動の利益について実数の信念（b′）を持っている。しかし、エージェントの信念に関係なく、エージェントがその行動を実行すれば、エージェントは実際の利益（b）を受け取る。実際の利益を反映する信念は正しいとみなされる（例：b′=b）。それ以外の信念は厳密には正しくない（例：b′ /= b）。

周波数依存環境と独立環境

Parkerら(1990)は、周波数依存環境と独立環境における最適戦略の探索を区別している。周波数に依存しない環境とは、他の人の戦略が個人のパフォーマンスに影響しない状況である。このような環境では、与えられた課題における各戦略のパフォーマンスを分析するだけで、最適な戦略を発見することができる。これは、形式的な分析（第7章など）や、エージェントベースのモデリング（第8章など）によって達成することができる。

頻度依存の環境では、集団内の戦略の分布が各個体のパフォーマンスに影響を与える。例えば、戦略Bのプレーヤーで一杯の集団では戦略Aが最適かもしれないが、集団がAとBのプレーヤーに均等に分かれている場合は戦略Bが戦略Aを上回るかもしれない。このような場合、様々な母集団分布における各戦略のパフォーマンスをテストすることが重要である。これは形式的分析（例えば第3章）によって達成することができるが、進化的アルゴリズム（例えば第3-6章）によって分析することもできる。

進化的アルゴリズム頻度依存の環境をテストする

進化的アルゴリズムは、安定した戦略を見つけるために、戦略分布のパラメータ空間を探索するシミュレーション進化を使用する。これを行うために、エージェントベースのモデルは、戦略のある分布（例えば、1%の戦略Aと99%の戦略B）で開始される。その後、エージェントは互いに競合する可能性があるタスクを実行する。一定時間後、各エージェントのスコアが集計される。

次に、エージェントの新しい「世代」を作るためにシミュレーション進化が適用される。最も優秀な成績を収めたエージェントは、よりタスクに適応しているため、次の世代の種となる可能性が高くなる。そのため、シミュレーテッド・エボリューションは、前世代と比較して、より高い割合の適応戦略を持つ次世代のプレーヤーをインスタンス化する。例えば、戦略Aが戦略Bよりも優れている場合、最初の1%の戦略Aエージェントは、次の世代では2%にシフトするかもしれない。新しい世代はタスクをシミュレートし、戦略Aが戦略Bを引き続き上回った場合、次の世代では集団は4%の戦略Aエージェントで構成されるかもしれない。これが均衡に達するまで続く。

進化的アルゴリズムの例を以下に示す：

1. エージェントの集団を作る。
2. エージェントに真実の情報と（異なる量の）不正確な情報を播くことで、集団にバリエーションを発生させる。
3. エージェントにタスクを与える。そのタスクの実行は、ばらつきのある情報に依存する。
4. エージェントのタスクをシミュレートする。
5. タスクにおける各エージェントの有効性を計算する。
6. 次世代のエージェントを生成する。次世代エージェントの戦略分布は、最も成績の良かった戦略に偏る。
7. 戦略の分布が平衡になるまで、項目4から繰り返す。

進化的アルゴリズムは、頻度依存のランドスケープの影響を分析するのに適している。(Alexander, 2009)。個体群の度数分布が変化すると各戦略のパフォーマンスが変化するため、進化アルゴリズムは（進化と同様に）教師なしで戦略的均衡を探索することになる（Nowak and Sigmund, 2004）。これは、戦略の効用が他のエージェントの戦略に依存する、社会的相互作用の影響をモデル化する場合に特に当てはまる。

表現

偽情報が真情報を上回る場合を研究するためには、エージェントは何らかの方法で情報を表現する能力を必要とする。これは様々な方法で行うことができ、研究によって異なる。一般に、正しい情報と誤った情報の表現が明確に区別される限り、表現の詳細は重要ではない。例えば、第3章では、プレイヤーの評判を二値行列に格納することで分析する（すなわち、あるエージェントは他のプレイヤーが良い[1]か悪い[0]と信じている）。第4章では、エージェントはある行動の効用を信じる。これは実数で表現される。正しい情報と正しくない情報の表現が区別可能である限り、その表現によって引き起こされるその後の行動は、選択によって行動することができ、したがって分析することができる。

1.6 各章の要約

本論文では、様々な文脈におけるいくつかの未解決問題の解決における偽情報の有用性を評価する。ここでは、各章の概略を述べる。

文献レビュー

第2章では、自己欺瞞の進化的実現可能性に関する文献をレビューする。この章は、真実の情報を偏らせることの利点について研究を続ける動機付けとなる。自己欺瞞の定義には大きなばらつきがあるものの、自己欺瞞の進化に関するほとんどすべての定義に必要な条件は、自己欺瞞を行う個人が、真実の知識がない状態で行動しなければならないということである。このことを踏まえ、続く章では、自己欺瞞が適応的である可能性のある既知の環境を拡大していく。

価値観の同類性は協力には有益だが、誤った社会情報を用いる動機となる

社会的に信じられている見方が誤りであることを孤立した状態で発見した場合、その見方は改められるべきなのだろうか？経験則によれば、人間はそうしないことが多い。ゴシップは誤りを犯しやすいにもかかわらず、個人は自分の経験ではなく、第三者のゴシップに基づいて他人を判断することが多い（Sommerfeld et al., 2008）。たとえそのような知識が自由であったとしても、他人の長所を判断するのではなく、第三者の意見に基づいて判断する。

第3章では、このような行動が適応的である条件が存在することを発見する。人類の進化の歴史において協力が重要であることを考えると、真実を語ることが協力に悪影響を及ぼすのであれば、真実の知識を欠くことが適応的である可能性がある。私は、最終的に協力を広める最善の方法として、集団内の地位を示すことが正直さを上回る可能性があることを実証している1。

2. インパクト・バイアスの進化：ノイズの多い環境における選択のための感情予測の最適化

予期される出来事の前に、人はその出来事の後の感情を正確に予測することに系統的に失敗するという確かな証拠がある（Wilson and Gilbert, 2013; Wilson et al., 2000; Schkade and Kahneman, 1998; Wilson et al. 2003a; Wilson and Gilbert, 2003; Gilbert et al.）この現象はインパクト・バイアスとして知られている（Gilbert et al., 2002）。さらに、過去の経験にもかかわらず、学習によって予測が向上することはない（Lacey et al.）

第4章では、インパクト・バイアスが機能的であり、ノイズの多い環境での意思決定に役立つことを示す。エラー管理理論（Johnson et al., 2013）の研究を拡張することで、ノイズの多い環境では、以前の感情経験から学ぶことが最適でない可能性があることを示す。この説明は、これまで説明されていなかった実験データと一致する2。

信頼は、部分的な情報とパートナー選択の環境において、コストのかかる罰を媒介する

注：本章では偽情報の有用性については直接論じていない。しかし、この発見は第6章と第7章の結果には必要不可欠である。

1 この論文はJournal of Theoretical Biologyに掲載された。また、2014年のEuropean Human Behaviour and Evolution Association (EHBEA)および2015年のInternational Conference of Social Dilemmasで口頭発表された。さらに、この研究からのアイデアは、”A Tendency to Follow the Herd Rather than Whistleblow May be Part of our Evolutionary Past “というタイトルでワシントン・ポスト紙に掲載された。
2 本研究は、2014年の『Proceedings of Collective Intelligence』に査読付き会議論文として掲載された。さらに、2015年のEuropean Human Behaviour and Evolution Association（EHBEA）で口頭発表が認められた。現在、査読中である。

信頼ゲームのような経済ゲームをプレイするとき、個人は2つの一見逆説的な誤りを犯す傾向がある。第一に、相手が信頼に足る人物であるかどうかの情報を持っていない場合、サブゲーム完全戦略では相手が離反するにもかかわらず、未知の品質である相手の申し出を受け入れる（Berg et al., 1995）。第二に、参加者は取引が儲かると分かっていても、その取引が公正でない限り拒否する、つまり潜在的な恩人に対して高価な罰を表明する（Henrich et al.）

このような行動は、公正さを本質的に重視する人間の素因を解明するものだと指摘する人もいるが（Fehr and Schmidt, 1999; Fehr et al., 2002）、第5章では、このような行動が収益を最大化しうることを実証する。さらに、部分的情報という自然な制限の下で、盲目的な信頼が高価な罰の進化的実現可能性を媒介できることを示す。この結果は、信頼と高価な処罰の進化的実現可能性が関連している可能性を示すものとして重要である3。

高価な処罰戦略の異質性は適応的である

第5章では、高価な罰（他者を公平に扱おうとしない者を罰するために代償を払うこと）は適応的でありうることを示す。これによって、なぜ一部の人間が高価な罰を与えるのかが説明できるが、実験データで目撃された高価な罰戦略のばらつきは説明できない（Manapat et al.）もし高価な罰を与えることが有利であるならば、なぜその行動にこのような個人差があるのだろうか？

第6章では、高価な罰戦略の不均一性が適応的である可能性を示す。第5章と同様、これはパートナーの選択と部分的な情報を前提としている。個人は、最適な費用のかかる罰の量を学習するのではなく、様々な戦略をとることで利益を得る。この行動は適応的である。なぜなら、第三者は、個人が頻繁に罰を与えようと散発的に罰を与えようと、高価な罰に反応するからだ。

信頼ゲームと最後通牒ゲームでは、高価な罰のばらつきはしばしば罰されない

前章と同様、本研究では費用的処罰のばらつきについて考察する。近年、高価な罰の個人差は実験者を混乱させている（Manapat et al.）第6章では、このようなばらつきが適応的である可能性を示したが、第7章では、ばらつきが適応的でない場合でも、経済ゲームでは最適でない戦略が罰せられないことが多いことを示す。もし集団内の十分な個体が真実の情報（すなわち最適戦略に関する知識）を持っていれば、真実の情報を持たない個体は罰せられない–その結果、真実の情報を持たない個体は中立的に漂流する。

3本研究は、2015年の国際社会ジレンマ学会で口頭発表として採択された。現在査読中である。

非効率的な医療機関では、フォーマルレビューとインフォーマルレビューの混合が最良の患者ケアをもたらす

第8章では、公的機関における非効率性が、情報の難読化を促進することが最善である環境を生み出す可能性があることを警告する。これを医療制度における内部告発政策の文脈から考察する。制度上の資源制限と処理の非効率性が、情報の透明性を最適なものにしていない可能性があることを示す。制度の有効性を考慮した場合の内部告発と情報の透明性の有用性を分析する。その結果、照会処理にわずかな非効率性があったとしても、個人が1.内部告発の割合を制限するか、2.悪しき慣行に気づきにくくなる（すなわち透明性が低下する）ことが、患者ケアにとって最善であることがわかった）

最後に、（悲しいことに）情報難読化の圧力につながる組織構造を回避する方法について論じる。シミュレーションを活用し、正式なレビューとそうでないレビューの混合が最良の患者ケアにつながる可能性があることを示す。最後に、組織構造と情報の透明性が患者ケアにもたらす利益との相互作用について、より全体的な理解を深めるためのさらなる研究を呼びかける。

考察と結論

最終章では、真実の知識を欠くことの利点に関する既存の研究を踏まえ、この研究の意味について論じる。次に、知識の自己欺瞞や偏りをもたらす環境の種類について論じる。最後に、自己欺瞞の現象や確かな知識を無視する傾向を説明するために、さらに体系的な研究を行うことを求める。

2　文献レビュー

「心はそれ自身の場所であり、それ自体が地獄の天国、天国の地獄を作ることができる」

ジョン・ミルトン『失楽園』

錯覚の必要性が深いときには、無知に多くの知性が注ぎ込まれることがある。

ソール・ベロー『エルサレム・アンド・バック』：個人的記述

本章の意図は2つある。第一に、自己欺瞞の進化的実現可能性に焦点を当てた文献レビューである。この現象は様々な方法で定義されているので、自己欺瞞の見出しに該当しうるいくつかの進化論をレビューし、その中には誤信念の進化や戦略的に間違っていることも含まれる。この議論の過程で、文献には自己欺瞞の進化可能性を診断するための一般化可能な枠組みが欠けていることがわかった。必要な条件のリストを提示する代わりに、多くの研究は、特定の変数が自己欺瞞を可能にするために必要な選択圧を提供できるかどうかを分析することに焦点を当てる傾向がある。その結果、自己欺瞞の進化の可能性に関する体系的な研究は欠けている。

この文献のギャップは、本章の2つ目の貢献、すなわち、世界に関する真実の知識が欠如していることが適応的である場合に、研究の動機として機能することにつながる。私は、自己欺瞞の定義にかかわらず、自己欺瞞が進化的に有効であるかどうかは、真実の知識を欠くことが適応的であるかどうかにかかっていると主張する。本論文では、虚偽の情報を用いることが適応的であるような、これまで発見されていなかった文脈が数多く存在することを論じているので（第3章から第7章を参照）、この研究が自己欺瞞に関する研究の範囲を広げるための洞察を提供するものであると考える。

2.1 定義

2.1.1 誤信、誤った信念、戦略的に間違っていること

自己欺瞞について論じる前に、この作業を通して適用されるいくつかの関連用語を明確にしておくことが重要である。私は「誤信念」と「誤った信念」を同じ意味で使っている。誤信念とは、「すべての点において正しくない信念」である（McKay et al.）これに関連して、戦略的に間違っているという概念がある。個人が戦略的に間違っているのは、誤った信念を持つことがその人の最善の利益になる場合である（Kurzban, 2012）。

2.1.2 欺瞞

自己欺瞞の定義はいまだに議論されており（Deweese-Boyd, 2012）、アイデンティティ、心、そして「知る、意図する、選ぶ、望む」（Fingarette, 1969）とは何かという概念に関する、他の未解決の哲学的・神経学的な疑問にかかっている。この現象を構成する部分ですら、特徴づけるのは難しい。自己欺瞞はひとまず置いておくとして、欺瞞の定義についてはいまだに論争が続いている。

どのような場合にエージェントは欺かれるのだろうか？この用語の用法は分野によって異なる（Mitchell, 1986）。ほとんどの場合、哲学的な会話は人間の欺瞞に焦点を当てており、その結果、欺瞞には欺く側が（民間心理学的な意味で）他者を欺く意図を持つことが必要であるという点で大方の意見が一致している（Mahon, 2015; Fallis, 2010）。しかし進化生物学者にとっては、意図することは前提条件ではないことが多く、人間以外の種にも欺く能力があること（Trivers, 1985）、あるいは少なくとも欺くことに機能的に相当する能力があること（Dawkins, 1976）を示唆している。

意図的な定義

人間レベルの欺瞞における意図の重要性は、Mahon(2015)によってうまく要約されている。エージェントAが他のエージェントBを欺くのはどのような場合か？単純な定義では、エージェントAがエージェントBに虚偽を信じさせることだけが必要かもしれない。より正式には、エージェントAのせいで、エージェントBは、実際にはpが真であるにもかかわらず、ある命題¬pを信じてしまう。この定義には、情報を与えるつもりのない個人も含まれるため、広すぎるという意見もある。しかし、「代理人Aは代理人Bに¬pを教え込むつもりでなければならない」という要件を加えても、問題は回避されない。エージェントAは、¬pを真であると信じながら、¬pを教え込むことを意図することができる。より堅固な定義では、エージェントAはエージェントBにエージェントAが偽であると信じていること（すなわち¬p）を信じさせる意図があることが要求される。

– エージェントAはpを信じている（この要約のより長引いた分析についてはMahon, 2015を参照）。

しかし、欺瞞行為における意図の必要性には大きな議論があることに留意する必要がある。意図を必要とすることは、欺瞞を人間中心主義の枠に閉じ込めてしまう。もし意図と虚偽の知識が欺瞞に必要だとしたら、他の種にとってはどうなのだろうか（Bond and Robinson, 1988a）。

機能的定義

進化生物学では、種が他者の誤りを誘発するように進化したと思われる事例を説明するために、欺瞞が頻繁に用いられている（Mokkonen and Lindstedt, 2015; Bond and Robinson, 1988b; Trivers, 2011）。スミス(2004)は、欺瞞を「他者に偽の情報を提供したり、真実の情報を奪ったりする機能を持つあらゆる形態の行動」と定義している（Smith, 2004, p.14）。確かに、行動の機能を定義することは難しいが（McKay et al. 機能」の定義の議論に埋もれることなく、私はプロセスの機能を個体の複製を助けるものと定義する（Millikan, 1989）。機能的欺瞞とは、他者に誤りを誘発することで、そのプロセスの進化的生存を助けるプロセスのことである。

この定義に従えば、人間以外の種における機能的欺瞞の例は枚挙にいとまがない。花の擬態はどこにでもある（Schiestl and Johnson, 2013）。花粉媒介者の獲物（Jin et al., 2014）や性的パートナー（Gaskett, 2011）を模倣することで、花の色彩が花粉媒介者をおびき寄せる。交尾の前に、オスのナミグモはしばしば絹に包んだ昆虫をメスに差し出す。しかし、全体の1/3のオスは価値のない絹に包まれた植物片を差し出すが、発見される前に交尾に成功する（Ghislandi et al.）フォークテール・ドロンゴは餌を盗むために鳴き声を偽装するだけでなく、騙された側が誤情報に慣れないように鳴き声を変化させる（Flower et al., 2014）。

2.1.3 自己欺瞞：哲学的ソワレ

欺瞞の定義がいまだに議論されているように、このような悩みは必然的に自己欺瞞を理解することにつながる。人はどのようにして自分を欺くのだろうか？その欺瞞が対内的なものであろうと対人的なものであろうと、欺瞞の定義を維持しようとするのは当然のことのように思われる。もし欺瞞が意図を必要とするならば（2.1.2「意図的な欺瞞」参照）、pを信じているエージェントAは、エージェントBに¬pを信じさせようとする。自己欺瞞では、エージェントA = エージェントBという制約が追加されるだけである（初期の論評はKipp, 1980を参照）。

しかし、これは自己欺瞞の静的パラドックスと動的パラドックスの両方を生じさせる（Mele, 1997）。静的パラドックスは、心がどのようにして何かを信じたり信じなかったりすることができるかを問うものである。もしエージェントAがpを知っていて、¬pを自分に信じ込ませることに成功したら、それでもpを知っているのだろうか？エージェントはpと¬pの両方を信じることができるのだろうか？ダイナミック・パラドックスは、もし欺瞞が（民間心理学的な意味での）意図的なものでなければならないとすれば、欺かれる側が自分が欺かれていることを知っている場合、どうして欺瞞が成功するのだろうかと論じている（Mele, 2001）。歴史的に、こうしたハードルを乗り越えようとする場合、2つの道がある：

1. 意図論者の議論
2. 動機づけ論者の主張

意図論者

意図論者は、自己欺瞞と意図的な対人欺瞞との関連性を真剣に考える。その結果、意図論者は静的パラドックスと動的パラドックスの克服を試みなければならない。この2つのパラドックスを是正するために様々な誘惑が提唱されているが、そのほとんどは何らかの方法で自己を分裂させることを含んでいる。一つの考えにしか注意を向けない限り、矛盾する考えを信じることができるかもしれない（Demos, 1960）。時間的分割は、未来の自分を積極的に欺こうとすることを可能にし、矛盾する考えを同時に持つことを避ける（Bermu´dez, 2000）。部分的意図論は、心を意識と無意識に類似したものに分割し、2つの部分が相反する見解を持ちうることを示唆する（Davidson, 1987）。

しかし、意図論者はいくつかの問題にぶつかる。第一に、2つの信念を同時に持つことが起こることを示す経験的証拠はほとんどなく、多くの意図論者は仮説や想像の議論に規制されている（Mele, 1997; Porcher, 2015）。第二に、意図論者は、自己の定義の曖昧さを受け入れるために、ことわざの弾丸を噛まなければならないかもしれない（Smith, 2014）。自己は、互いを欺こうとする2つ以上のホモンクルスで構成されているのだろうか？もし一人の人間の中で複数のメカニズムが互いに欺き合っているのだとしたら、その人間を単一の均質化されたアイデンティティを持つものとして論じることは、どれほど有益なのだろうか（Kurzban, 2011）。

動機づけ論者

動機づけ論者は、自己欺瞞が意図的な欺瞞と表裏一体であるという考え方を否定することで、静的パラドックスと動的パラドックスをかわそうとする。Mele(2001)は、自己欺瞞には欺こうとする意図は必要なく、むしろ自己欺瞞に陥った個人が何かを信じようとする動機がなければならないと指摘している。同様に、Bagnoli(2012)は自己欺瞞を「反対の圧倒的な証拠があるにもかかわらず、信念を獲得し保持すること」と定義している。例えば、思春期の子どもの呼気からアルコールの臭いがするにもかかわらず、2人の親が自分の子どもは飲酒していないと信じようとする動機付けがあるかもしれない。Nelkin (2002)は、情報獲得におけるバイアスも自己欺瞞の可能性があるとしている。例えば、前述の子供の親が、アルコール乱用についてわざわざ知らないようにしている場合、自己欺瞞を行っていることになる。

反対派は、動機づけ論者が自己欺瞞と単純な希望的観測を区別するのは難しいと主張する（Deweese-Boyd, 2012; Smith, 2014）。どのような場合に自己欺瞞に陥り、どのような場合に世界が違っていればいいと願うのだろうか。スミス(2014)は、意図の要件を無視することで、自己欺瞞の成功基準に対する確固とした理解も失われていると懸念している。均質化された自己の定義は救われたが、その代償として、欺瞞の概念が広がりすぎている可能性がある。Porcher (2012)は、動機づけ論者はpを知っていることと知らないことの両方の概念を切り離すことに失敗していると論じている。したがって、（あるレベルでは）個人は現在の信念が偽りであることをすでに知っている。Lazar (1999)は、動機づけ主義的な考え方は、騙された本人が現在の信念を持ちたくないと思うような「ひねくれた」自己欺瞞（Mele, 1999）の例を説明できないと論じている。例えば、妻の不貞を（誤って）確信している嫉妬深い夫は、間違っていることを望むにもかかわらず、証拠を探し回るかもしれない。なぜ夫は、自分が望んでいないことを信じようとするのだろうか？

2.1.4 機能的説明はどこにあるのか？

最近、自己欺瞞の機能的説明を含めることが求められている。Baghramian and Nicholson (2013)は、自己欺瞞がどのようにして自然淘汰を生き延びることができたのかを検討することが、哲学的議論の焦点になるのではないかと示唆している。いつ、どのようにして自己欺瞞が優位に立てるのかを考えることで、この現象はよりよく理解されるかもしれない。しかし、進化論を自己欺瞞の哲学的議論に取り入れることは、驚くほど少ない。一つの例外は、デイヴィッド・リヴィングストン・スミスの遠隔機能的アプローチである。

遠隔機能的アプローチ

スミス(2014)は、自己欺瞞に対する遠隔機能的アプローチとして、意図的理論と動機づけ理論の長所を統合しようと試みている。彼の目標は、動機づけ論者の統一された自己を保持する一方で、意図論者の自己欺瞞の成功基準を定義する能力を取り入れることである。

スミスにとって、自己欺瞞の暗黙の基準とは、その行為が成功したか失敗したかを診断する能力である。まさに、自己欺瞞に成功したかどうかを診断することの難しさが、自己欺瞞と希望的観測の区別における動機づけ主義者の問題を引き起こしているのである（Smith, 2014）。スミス(2014)は、欺瞞の機能的定義（2.1.2節参照）を援用し、自己欺瞞には機能的目的がなければならないと主張することで、この問題を回避しようとしている。

スミスは、自己欺瞞の機能は対人欺瞞と同じであり、虚偽の信念を誘導することであると主張する。さらに、虚偽の信念を誘発するメカニズムが機能的であるためには、それが自然淘汰を生き延びたものである必要がある。スミスは、自己を欺く意識と意図についての議論に没頭するのではなく、偽の信念を生み出すように進化したメカニズムが、真の信念を生み出すように進化した別のメカニズムを抑制するならば、人間は自己を欺くように進化した可能性があると主張する。抑制性ニューロンが興奮性ニューロンを制限する機能を持つように、あるプロセスが、世界を正確に表現する機能を持つ別のプロセスの機能を減衰させるように働くかもしれない。スミスは自己欺瞞を次のように定義している：

もしOが、その世界のある特徴を正しく表現するという目的Fを持つ特性Cと、Cにその特徴を誤って表現させるという目的F*を持つ特性C*を持ち、C*がCに誤った表現をさせるのは、F*を実行することによ。ってであるならば、Oが自己欺瞞である(Smith, 2014)。

スミスは、進化的機能の要件にシフトすることで、意図的な欺瞞の必要性を回避している。そうすることで、スミスの定義は自己欺瞞を人間以外の欺瞞の定義と雄弁に結びつけることができる。ある生物が、別の生物に世界を誤認させる目的で特性を持つ場合、最初の生物はもう一方の生物を欺いたことになる（Smith, 2014）。

スミスは、自己欺瞞に関する哲学的議論に機能的な説明を統合することで、大きな前進を遂げた。しかし、進化の過程には、自己欺瞞の定義につきまとう難問のいくつかを明らかにする方法が、他にもいくつかありそうだ。次に、自己欺瞞の機能的説明が、ねじれた自己欺瞞だけでなく、ダイナミック・パラドックスの説明にどのように役立つかを論じる。

進化論はダイナミック・パラドックスに役立つか？

スミスは、欺瞞の機能的定義を用いることで、ダイナミック・パラドックスの解明に役立つ可能性がある。ダイナミック・パラドックスは、欺こうとする意図と、欺こうとする意図を自覚しながら欺くことに成功することの両方が、どのようにして可能なのかを問うものである（Mele, 1997）。意図した欺瞞に気づいている自己を欺くことに成功することは不可能かもしれないが、自覚なしに自己を欺く機能を持つ自己の一部は、かなり実現可能であるように思われる。確かに模倣花は欺くつもりはないが、欺く機能は持っている（Smith, 2004; Millikan, 1989）。このように考えると、人間は意図せずに人を欺く機能を持っているのかもしれない。欺瞞の機能的説明を含めることは、部分的意図論の別のバージョンだが、ほとんど議論されていない重要なものである。

確固とした意図論者は、間違ったことをするように進化した個人は、自己欺瞞ではなく、むしろ進化の力によって操作されていると主張するかもしれない。もし個人ではなく進化が欺瞞の罪を負うのであれば、自己欺瞞の基準は満たされないことになる。しかし、私にとっては、進化論的な議論は検討に値すると思われる。進化論的な力に責任があるとしても、その力は自己のどこにあるのだろうか？自己が欺かれていて、欺く力が自己の中にあるのなら、これは自己欺瞞ではないのか？さらに、この考え方は、部分的意図論のホムンクルスと競合する危険性から逃れることができる。

進化論はねじれた自己欺瞞に役立つか？

ねじれた自己欺瞞の場合（Mele, 1999）、個人は自分が真実でないと願っていることを誤って信じてしまう。典型的な例では、ある妻が恋愛相手が浮気をしていると弱い証拠に基づいて信じ、自分が間違っていることを願いながら証拠を探し回る（Deweese-Boyd, 2012）。動機づけ論者は、ねじれた自己欺瞞を自分たちのモデルに組み込むことに難色を示してきた。自分が真実でないと願っていることを、なぜ信じようとするのだろうか（Lazar, 1999）。

ここでもまた、進化を会話に組み込むことで、洞察が得られるかもしれない。妻は、たとえそうでないことを望んでいたとしても、自然に選択された認知バイアスのために、その虚偽を信じる気になったのかもしれない。エラー管理理論（第4章でさらに検討）の旗印の下、偏った意思決定が、たとえ味気ないものであったとしても、最適であると証明される文脈があることが研究で示されている（Johnson et al.）この直感は、例で説明するのが一番わかりやすいだろう。森の中を歩きながら、棒とヘビを見分けようとするところを想像してみてほしい。棒の方が可能性が高いにもかかわらず、ヘビに偏った信念を持つことは、進化的に有利だったのかもしれない（Galperin and Haselton, 2012）。ありそうもない脅威から身を守ることは、不安を高める代償を払ってでも、生存を助けたのかもしれない（Bateson et al.）

パートナーの不貞がもたらす進化的コストは大きく、現在のヒトの交尾行動の多くを説明できるかもしれない（Buss, 2007）。その結果、過度の嫉妬は適応的な役割を果たし、パートナーの不倫を抑制するのかもしれない（Schipper et al., 2006）。このことは、個人が最も嫉妬する文脈がジェンダーによって異なり、それらの文脈が異なるジェンダーの進化的リスクと相関しているという事実によって裏付けられている（Easton et al.）蛇や不倫に対する絶え間ない不安を望む人はいない。しかし、選択圧を考慮することで、欲求がなくても動機づけは存在しうる。

2.1.5 まとめ

明らかに、自己欺瞞の議論には論争がつきものである。現象としての自己欺瞞を記述しようとすると、民俗心理学の脆弱性や、「信念」や「自己」といった用語について議論する際の方言が浮き彫りになるようだ（Porcher, 2015, 2012; Schwitzgebel, 2010）。さらに、自己欺瞞に関する哲学的な議論には、一般的に進化論は含まれていない（Baghramian and Nicholson, 2013）。Smith (2014)は、進化のメカニズムが自己の意識なしに自己を欺く可能性について、いくつかの洞察を示している。さらに私は、自己欺瞞の明らかな困難のいくつかは、進化の枠組みで考えれば説明できると主張してきた。少なくとも、哲学的議論に進化論を含めることは正当化されるように思われる。このことを念頭に置き、混乱の一部を明らかにすることを期待して、自己欺瞞の進化に関する現在の理論のレビューに移る。

2.2 自己欺瞞の進化に関する既存の理論

一見すると、エージェントが偽りの信念を維持する動機づけがあるときに、効果的に世界をナビゲートできるというのは非現実的なことのように思える。Trivers (2000)が主張するとおりである、

孤独な生物にとって、（自己欺瞞を進化させることは）絶望的ではないにせよ、困難であるように思われる。複雑で変化する世界に効果的に対処しようとするとき、現実を自分自身に誤魔化すことのどこに利益があるのだろうか？

どのような環境がこれを相殺し、虚偽表示の選択圧を生み出すのだろうか？この研究はまだ始まったばかりで、この10年でようやく本領を発揮するようになった。最近のレビューで、Chance and Norton(2015)は、自己欺瞞の潜在的な適応的機能として、a）心理的利益、b）対人欺瞞、c）社会的地位の3つを挙げている。自己欺瞞によって社会的地位を獲得するには、他者を欺く必要があるためだ。

2.2.1 誤信の進化と戦略的に間違っていることの定義

話を始める前に注記しておこう。戦略的に間違っていることと同様に、誤信念の進化に関する文献もレビューしておこう。進化論的な文献では、自己欺瞞は哲学的な言説ほど綿密に定義されていない。実際、誤信念の進化と自己欺瞞の進化を区別していないものが多い。そのため、それぞれの用語に関する文献を順番にレビューしていく。ただし、用語が混乱しているように見えるのは、おそらくそうだからであろう。

2.2.2 心理的利益

自己欺瞞は、自己欺瞞を受けた人の心理的幸福を増大させるために進化したと主張する人がいる。証拠があるにもかかわらず、自己欺瞞に陥った両親が、未成年の子供が飲酒していないと信じ続けている例を考えてみよう。この典型的な例は、自己欺瞞によって親が望む心理状態を維持できることを示唆するために、動機づけ論者によって広く用いられてきた。このように、自己欺瞞は心理的防衛機制として機能する。子供が薬物を使用していないという信念を保つことで、親は心理的恒常性を傷つけかねない現実を回避することができる（Bortolotti and Mameli, 2012; Bagnoli, 2012）。

支持　ポジティブ・イリュージョンの個人内利益

経験的に、偏った情報が心理的ウェルビーイングの向上につながることを示唆する証拠がある。平均して、個人は客観的にそうであるよりも、自分の方が優れていると考える傾向がある（Alicke, 1985; Alicke et al., 1995）。これは、車の運転（DeJoy, 1989; Dalziel and Job, 1997）、離婚の回避（Weinstein, 1980）、余命（Weinstein, 1980）など、さまざまなタスクに当てはまる。この楽観主義バイアスは神経学的に維持されているようで、ニューロン学習は、否定的な経験よりも肯定的な経験を高く評価する（Sharot, 2011）。

このようなポジティブな錯覚は、心理的利益をもたらすようだ。自分の知性を誇張して信じることは、人生満足度や自尊心と正の相関がある（Dufner et al.）自尊心が高い人は、肯定的な見通しを維持するように人生の出来事を組み立てている（Brown, 2014）。CumminsとNistico (2002)は、肯定的な認知バイアスは、人生の満足度を維持し、恒常的な幸福を維持するのに役立つと主張している。

抑うつリアリズムは、AlloyとAbramson(1979)によって作られた理論であり、軽度から中等度の抑うつ状態の人は、対照群と比べてより正確な世界観を持っていると主張している。世界を正確に表現することがうつ病と相関関係があるとすれば、肯定的な錯覚は健康な幸福を維持するのに役立つかもしれない。75の実験を対象としたメタ分析では、抑うつ的リアリズムに有意な効果があることが示されている（Moore and Fresco, 2012）。興味深いことに、メタアナリシスでは、うつ病患者は依然としてポジティブな錯覚バイアスを示しているが、対照群に比べると少ないだけだ。関連する研究では、コントロールの錯覚は抑うつ症状と逆相関することが示されている（Alloy and Clements, 1992）。

シェリー・テイラーは、適応的ポジティブ錯覚理論の最も有名な提唱者の一人である。テイラーと彼女の同僚は、そのキャリアを通じて、肯定的錯覚がより高いレベルの自尊心と精神的健康をもたらすという仮説を支持する重要な証拠を発見した（Taylor and Brown, 1988）。例えば、早期乳がん患者において、自己肯定感は症状の軽減と正の相関がある（Creswell et al., 2007）。自尊心と楽観主義のレベルが高いと、ストレスと逆相関する（Creswell et al., 2005）。重要なことは、経験的文献に見られる精神衛生上の利点は、自己顕示欲の高いごく一部の個人によってもたらされるバイアスでは説明できないということである。

支持　心理的防衛機制

臨床的見地から、また初期の精神分析にさかのぼると、現実の心理的荒廃から自らを守るために、心は自白することを厭わないことが長い間示唆されてきた（フロイト、1936年、素晴らしい総説はVaillant, 1992を参照）。Butler (2000)は、交通事故で外傷を負い、半身不随になった患者について考察した。事故から1年後、この患者は逆オセロ症候群を発症し、かつての恋愛相手と最近結婚したと思い込むようになった。しかし、その元パートナーは事故後すぐに患者のもとを去っていた。バトラー(2000)は、ヤスパースら(1963)の研究を拡張して、このような妄想は悲劇に直面したときに精神内の一貫性を維持するのに役立つと主張している。

実際、さまざまな臨床診断が、悲劇に直面すると心が否定によって自らを守るという考え方に信憑性を与えているようだ。Ramachandran(1996)は無認知症の患者について考察した。右半球の脳卒中により、患者は歩くことも片腕を動かすこともできなくなっていた。しかし彼女は、自分は歩くことができると主張し、自分の病気を執拗に否定した。BairdとMcKay(2008)は、逆行性健忘症の患者を研究したが、その患者は対照群よりもはるかに高い割合で自己肯定感を示した。

前述のように、Ramachandran (1996)は、右半球性脳卒中患者の中には身体的障害を否定する人がいることを発見した。このことからラマチャンドランは、自己欺瞞の神経学的局在に関する理論を定義した。フロイトに倣って、ラマチャンドランとブレークスリー(1998)は、人間の心は、個人の世界モデルを脅かす情報を無視するメカニズムを進化させたと主張する。彼の理論によれば、健康な心では、このメカニズムが、均衡を保つために情報を無視すべきときと、心の世界モデルの再評価が必要なときのバランスをとっている。しかし、アノソグノシアに罹患している患者では、このメカニズムが壊れ、心理的防衛メカニズムが暴走し、病理の否定を説明する（ラマチャンドランの理論の優れたレビューについては、McKay et al.）

支持　恐怖管理理論

さまざまな理論が、死を意識し続けることは祖先の心理的幸福にとって有害であっただろうと提唱している。したがって、私たちが（一般的に）差し迫った死を意識しないのは、適応的なことなのである。Becker(1973)は、もし個人が自分たちの人生の弱さや、出来事の展開が恣意的であることを認識していたら、不安や恐怖に襲われただろうと推測している。

このことから、Greenbergら(1986)は、自尊心を高める幻想が、偏りのない世界認識に従うことになる蔓延する不安を和らげるという適応的な役割を果たしている可能性を示唆した。グリーンバーグら(1997)は「恐怖管理理論」と名付け、心理的な幸福が現実の否定と相関していることを示唆する証拠があると主張している。例えば、恐怖管理理論では、最終的な死に直面した人は、その考えを抑えようとすると予測している。自分の死を意識した後、認知的負荷がかかっている人は、より高いレベルの死の思考へのアクセス性を示すことが示されており、抑圧が現状維持であるという仮説の信憑性を高めている（Arndt et al., t97）。

これと同様に、VarkiとBrower(2013)は、知能に対する選択圧が自己欺瞞を必要とした可能性があると仮定している。特に彼らは、知性は問題解決を強化する一方で、自分の死に対する理解も明らかにすると仮定している。彼らは、世界を現実的に処理することから生じる実存的な脅威は、知性によってもたらされる利益以上の代償を払う可能性があることを示唆している。知能が自分の死期を否定する能力（楽観主義など）と共進化して初めて、知能の恩恵がコストを上回るのである（Varki and Brower, 2013）。

支持　自己シグナリング

自己欺瞞は自己シグナリングによって生じ得ると主張されてきた（McKay他、2011b;Mijovic´-Prelec and Prelec, 2009）。曖昧な状況では、自己は自分の信念を肯定的な結果に偏らせようとするかもしれない。Mijovic´-Prelec and Prelec (2009)はこう言っている、

自己シグナリングは、良い知らせに対する欲求が十分に強ければ、たとえそのようなバイアスが長期的な目標達成の全体的な可能性を低下させるとしても、中間的な評価にバイアスをかけることを意味する。

この理論の証拠は多岐にわたる。耐寒性が長寿と相関していることを知らされていると、手を冷水に浸したままにしておく時間が対照群よりずっと長くなる（Quattrone and Tversky, 1984）。試験の解答を与えられると、学生は試験の高得点を自分の知力のせいだと誤解する（Chance et al.）さらに、この誤った帰属を複数回の試行で調整することは学ばない（Chance et al., 2015）。Mijovic´-PrelecとPrelec (2009)は、金銭的インセンティブが高まると、金銭的損失を犠牲にしてでも前向きな見通しを維持するように、個人の意思決定がますます偏っていくことを示した。

反対　自尊心は（せいぜい）社会的向上への中間ステップである

フォン・ヒッペルとトリバース（2011a）は、進化を概念的に誤解していると主張し、この考え方を否定している。どのような属性の進化でも、その属性に関連する表現型行動がどのように選択的優位をもたらすかを説明しなければならない（Trivers, 2000）。自己欺瞞が進化したのは、自分自身について良い気分になるためだという仮説は、そのような利点を説明する論拠にならない（von Hippel and Trivers, 2011a; Kurzban, 2012; McKay et al.）人類が砂糖を食べるように進化したのは、砂糖を食べると気分が良くなるからだと示唆するのに似ている。ロバート・カーズバンは、「進化は、あなたがどれほど幸せであろうと気にしない」（Kurzban, 2012, p.136）と率直に同意している。

自尊心とポジティブな幻想の間に正の相関関係があることを示す膨大な実験データを、反対派はどう説明するのだろうか？von Hippel and Trivers (2011a)とKurzban (2012)の両氏は、次に述べる理論（自己欺瞞は対人欺瞞を助けるために進化した）の支持者である（セクション2.2.3参照）。そのため、von HippelとTrivers (2011a)は、自尊心の高まりが対人欺瞞を媒介すると主張している。自尊心は、相手を欺くのに役立つという進化的な利点を提供する。自分を良く思うことで、自分は実際よりも優れていると他者に思わせることができ、その結果、他者を騙して分不相応な社会的利益を与えることができる。

この主張を裏付ける証拠があるようだ。Taylorら(1983)は、自己強化は精神的健康だけでなく好感度とも正の相関があることを発見した。さらに、自尊心は自己強化者の好ましさを媒介する（Dufner et al.）自尊心を高めること自体は進化的利益をもたらさないかもしれないが、それが社会的利益の増加につながるのであれば、自己強化は適応的であることが証明されるかもしれない。

反対　神経学的傷害は病理以外のことを解明しないかもしれない

神経学的外傷後に誤った信念が維持されることは、必ずしも自己欺瞞の機能的説明の信憑性を高めるものではない（McKay et al.2005)は、適応的な自己欺瞞としての虚偽の信念の維持と、信念の創造と獲得の神経学的基盤が壊れているために虚偽の信念が維持されることとの区別に注意すべきだと警告している。例えば、無認知症は右半球性の脳卒中患者にのみみられ、左半球性病変の患者は自分の病気を認めている（Ramachandran, 1996）。悲劇に直面して現実を否定することが適応的であるならば、なぜ左半球性脳卒中患者はアノソゴシアに陥らないのだろうか？さらにBisiachら(1991)は、無認知症患者の耳に冷水を吹きかけると否定がなくなることを発見した。最初は適応的な自己欺瞞に見えるかもしれないが、それは神経回路がおかしくなっている一例かもしれない。McKayら(2005)は、臨床集団における妄想を理解するための枠組みは、自己欺瞞の動機づけの考え方と、信念の神経学的基盤を損傷することの影響とを融合させることによって、最もよくなる可能性があることを示唆している。

2.2.3 トリバース　自己欺瞞は対人欺瞞を強化する

自己欺瞞の進化に関する最も有名な理論は、Robert Triversによるものである（Trivers, 1991, 2011; von Hippel and Trivers, 2011a）。Trivers(1991)は、自己欺瞞は対人欺瞞を助けるために進化したという仮説を立てている。彼の議論は、他人を欺くことは有利になりうるが、見破られるコストはおそらく高いという考えに基づいている。しかし、もし欺く個人が捕まる確率を下げることができれば、欺くことは非常に有益であると証明され、その個人はさらなる資源を獲得し、進化的生存能力を高めることができるかもしれない。

その結果、発見されないようにするために、欺く能力を向上させるという選択圧が働くと考えるのが妥当だろう。しかし、もし個体が欺く能力を向上させる進化を遂げたのであれば、欺きを見破る選択圧が生じる可能性も高いと思われる（Cummins, 1999）。理論的には、欺瞞と発見の間に共進化的な赤の女王効果（Van Valen, 1973）が起こり、何世代にもわたって欺瞞と発見の両方が改善されるが、相対的にはほとんど進歩しない。

Triversは、自己欺瞞によってこの共進化の踏み絵から抜け出す方法を論じている。彼は、欺く主体は自分自身を欺くことで発見のリスクを回避できると提唱している（Trivers, 1991）。もし個人が欺こうとする意図に気づかなければ、欺瞞は発見されにくい。さらに、たとえ発見されたとしても、もっともらしい否認可能性を維持し、発見のコストを減らすことができる。

von Hippel and Trivers (2011a)は、前述の実験データのほとんどをこの理論で統一しようと試みている。自己強化、楽観主義、自信過剰が社会的地位の向上につながるのであれば、自己欺瞞は有利であり、したがって適応的かもしれない。自分が客観的にそうであるよりも優れていると信じることで、他人は欺かれ、自己欺瞞した個人に利益を与える。von Hippel and Trivers (2011a)は、心理的幸福を維持するために自己欺瞞が進化するという考え方を否定しているが（セクション2.2.2参照）、心理的幸福の増大は対人関係上の利点をもたらす可能性がある。例えば、自信過剰は自尊心を高めるが、自尊心は好感度を高める。(Dufner et al., 2012)。

情報処理バイアスとしての自己欺瞞

von Hippel and Trivers (2011a)による自己欺瞞の定義は、ほとんど動機づけ主義に沿ったものである。彼らは、自己欺瞞とは「個人の目標を反映する形で、歓迎されない情報よりも歓迎される情報」を好む情報収集／処理バイアスであると主張している（von Hippel and Trivers, 2011a, p.2）。歓迎されない情報を探すことを拒否したり、歓迎されない情報よりも歓迎される情報を重視したりすると、個人は自己欺瞞に陥る可能性がある。von Hippel and Trivers (2011a)によれば、自己欺瞞的な個人は、欺かれることに動機づけられている。この意味で、彼らは動機づけ論者と一致している。

裏付けとなる証拠

自己を肯定的に錯覚させることで、他人を騙して不当な威信を授けさせ、対人欺瞞を増大させるという仮説を支持する証拠がある。自信過剰はより高い社会的地位を獲得することと関連している（Anderson et al.）知的自己強化は好感度と相関している。(Dufner et al., 2012)。自己強化は社会的魅力や社会的影響力と正の相関がある（Dufner et al., r13）。自己認識された交際相手の価値は、個人の人気と正の相関がある(Back et al., 2011)。

反対　長期的な関係において欺瞞は通用しない

この理論には多くの反対意見がある。人類は小さな集団の中で進化してきたのだから、対人関係の欺瞞のために自己欺瞞を進化させることはありえないという意見もある。確かに、親友の間で真実を共有することのメリットは、欺瞞を凌駕する1（Dunning, 2011）。さらに、もっともらしい反証はあまり役に立たない。人間には長期的な関係があり、意図的でない誤りも最終的には関係を悪化させる（Bandura, 2011）。

実験データによると、真実が発覚した後、このような対人関係上のメリットがコストを上回るかどうかについては、さまざまな結果が示されている（Kennedy et al., 2013; Tenney et al., 2008）。例えば、他者の自己強化を知覚すると社会的魅力は低下するが、社会的影響力は高まる（Dufner et al.） Tenneyら(2008)は、自信過剰が言語化された場合、真実が知られると自己顕示欲の強い人は罰せられることを発見した。対照的に、Kennedyら(2013)は、コミュニケーションが非言語的な行動に限定される限り、真実が知られたとしても自己強化の利益は維持できることを示した。

反対　人はひどい嘘発見器である

トリヴァースの議論は、欺瞞と欺瞞の発見が共進化したという考えに基づいている。個人は欺瞞を見破ることに非常に成功しているため、自己欺瞞は進化論的に支持されている。しかし、ごまかしの発見に関する経験的証拠は、この考えを根底から覆すものである（Fridland, 2011; Vrij, 2011）。人は嘘の発見が苦手で、偶然の一致を上回ることはほとんどない（Ekman and O’Sullivan, 1991）。もし個人が嘘を見抜くのが下手なら、トリヴァースの議論は破綻する。自己欺瞞は、起こりそうもない出来事を回避するために支払うべき高い代償である。

しかし、最近の証拠によると、欺瞞発見能力が低いのは実験的なアーチファクトの結果かもしれない。自然な環境では、個人の方が欺瞞発見能力が高いように見える。少人数の集団の方が、一人だけの集団よりもはるかに欺瞞を発見しやすいのだ（Klein and Epley, 2015）。さらに、歴史的に、欺瞞検知は参加者に顔の手がかりを提供することでテストされてきたが、最近では参加者にもっと文脈的な情報を提供する方向にシフトしており、欺瞞検知の可能性が大きく飛躍している（Levine, 2015）。文脈情報が飽和している小集団のような自然環境において、私たちが欺瞞を発見する能力に優れているとすれば、おそらくTriversの仮説は実現可能なのだろう。

反対　哲学的問題

Smith (2011)によると、von HippelとTrivers (2011a)は、意図主義と動機主義を融合させようとしているようだ。一方では、偏った情報探索が自己欺瞞の十分条件であると考えている。そのため、意図論者は、von Hippel and Trivers (2011a)が提示した議論は自己欺瞞ではないと主張する。偏った情報探索は自己欺瞞ではなく、自己バイアスである（Bandura, 2011; Pinker, 2011）。自己欺瞞には欺く意図が必要であり、意欲的な情報探索はこの基準を満たさない。

一方、von Hippel and Trivers (2011a)は、自己欺瞞の定義に意図を残そうとしている。「自己欺瞞者は、それを知ってか知らずかにかかわらず、嘘つきである」（von Hippel and Trivers, 2011b, p.47）とまで主張している。これは、欺くには情報の不正確さを知っている必要があると考える人々には馴染まない（Vrij, 2011）。現実がpであるにもかかわらず、個人Aが命題¬pを本当に信じている場合、個人Aは¬pを関連付けることによって個人Bを欺いているのではなく、むしろ個人Aが間違っているだけなのである(Fridland, 2011)。

von Hippel and Trivers (2011a)は、情報の偏りの瞬間に欺く意図が生じうることを示唆し、これに反論している。後で誰かを欺くために意図的に情報を求めないことは、嘘をつくことになる（von Hippel and Trivers, 2011b）。しかし、この説明が、自己欺瞞者は知ってか知らずか嘘つきである、という上記の引用とどう整合するのか、私にはよくわからない。たとえその意図が時間的に調整されていたとしても、欺く意図なしに嘘をつくことができるのだろうか？

ここで、この議論に私自身を簡単に挿入しておこう。セクション2.1.4で述べたように、この難問から抜け出す方法は、機能的、進化的観点から欺瞞を考えることである。もし個人が情報探索を偏らせる傾向を進化させたのであれば、進化は欺瞞の罪を負うことになる。個人は欺くつもりはないかもしれないが、欺くために機能する特徴を持つことは、単に「間違っている」というよりも、自己欺瞞に近いことは確かである。von Hippel and Trivers (2011a)はこのことを明確に主張しているわけではないが、Triverの研究の多く、特に通常の対人欺瞞の定義を定義する際には、このことが暗黙のうちに含まれているように思われる(Trivers, 2011)。

反対　なぜ誤信念の進化論的利点を考慮しないのか？

自己欺瞞の定義に関する大きな批判に直面して、（私も含めて）最善の方法は、行動を引き出す情報が常に真実であるべきであるかどうかに焦点を当てることであると主張する人もいる。von Hippel and Trivers (2011a)の議論を検討する中で、Fridland (2011)は「真の啓示とは、信念が真実であるときに最も有用であるという仮定に疑問を投げかけることであろう」と述べている。Harnad(2011)も同意見で、「適応的な認知と行動に必要なのは情報（つまりデータ）だ」と仮定している。Kurzban(2012)は、自己欺瞞は的外れだと主張する。自己はモジュール化されていて統一されていないため、統一された自己を欺くという会話は支離滅裂である（Kurzban and Athena Aktipis, 2007）。そうではなく、Kurzbanは戦略的に間違っているという状態を紹介している。

私はこの批判に同意する。以下では、意思決定における偽情報の使用は、自己欺瞞に関する進化論の前提条件であると主張する（セクション2.6参照）。しかし、まず最初に、誤信念の進化と戦略的に間違っていることに関する現在の文献をレビューする。

2.2.4 誤信の進化

思い出してほしいが、私は「誤信念」と「誤った信念」を同じ意味で定義した（セクション2.1.1参照）。したがって本節では、適応的な誤信念につながる圧力に焦点を当てる。二つの点が明らかになるだろう。第一に、自己欺瞞の進化的実現可能性を論じた文献は、誤信念の進化に関する知見と一致していない。これは、自己欺瞞に関する文献と誤信念に関する文献の両方が、同一ではないにせよ、非常に類似した現象の定義を使っているという事実にもかかわらずである。第二に、誤信念の進化に関する文献の中でさえ、進化的原因に関しては大きな意見の相違がある。

ヒューリスティクス／生態学的合理性／適応的合理性

Haseltonら(2015)は、個人が「客観的現実のある側面と比較して系統的に歪んだ表象を確実に生み出す」文脈を分類した。彼らは3つのカテゴリーに分類した：

a)ヒューリスティクス、b)エラー管理効果、c)実験的人工物である（Haselton et al.）最初の2つについてレビューする。実験的人工物とは、実験の設定が進化した頭脳にとって直感的でない場合を指す。その結果、リアルワールドではこのようなジレンマに直面することは（あったとしても）めったにないため、個人は最適とは言えない決定を下してしまう。実験的人工物については、誤信念が適応的であるという文脈を表していないため、ここでは割愛する。むしろ、実験的人工物は、進化した心が系統的なエラーに陥りやすい状況を表している。

Pinker (2005)が指摘するように、心は必ずしも真実を明らかにすることに適応しているわけではない。情報は時間とエネルギーを必要とする高価なものであるため、「有用な近似のために設計されたシステム（『…を満足させる』システム）は、どんな犠牲を払っても正確な真実のために設計されたシステムに勝るかもしれない」（Pinker, 2005）。例えば、餌を求めるとき、ヒューリスティックな採餌ルールを進化させると、世界を完璧に理解しようとする（しかし時間がかかる）ルールに勝ることが実証されている（Higginson et al.）

CosmidesとTooby (1997)は、人間の最適とは言えない意思決定をフレームワーク化する方法にパラダイムシフトを起こした。彼らは、人間の意思決定を理解するためには、進化の過去という歴史的文脈に立脚しなければならないと主張している（Cosmides et al.）彼らは一連の実験を通して、人間の心は一般化された知能を発達させたのではなく、むしろ特定の進化上のニーズに適応したのだと主張している（Cosmides and Tooby, 2013）。例えば、他動詞の性質は、数学的な文脈ではなく、社会的な文脈でとらえた方が、よりうまく活用できる（Cosmides, 1989）。変化盲（2つのイメージの違いを認識できないこと）は、無生物に比べ、動物のイメージを変化させると有意に減少することから、ヒトは主体性のあるものに優先的に注意を向けるように進化したという仮説の信憑性が高まる（New et al.）ヒトは今でも、霊長類のいとこたちと同じように、歯をむき出しにした表情によって他者の強さを評価している（Sell et al., 2014）。これは限定合理性という考え方と関連しており、人間は自分が持っている情報と認知の制限の中で最善の決定を下そうとする（Simon, 1972, 1991）。

ノイズの多い自己相関環境

Fawcettら(2014)は、認知バイアスの進化に関する文献をレビューした。彼らは、いくつかのバイアスは自己相関のあるノイズの多い環境に起因すると主張している。例えば、一連の嫌な経験の後、臨床レベルの抑うつとそれに伴う無気力は、自己相関のある環境では適応的である（Trimmer et al.）さらに、ホットハンドの誤謬は、自己相関のある環境では適応的である（Wilke and Barrett, 2009）。ある行動が継続すると予測することは、貴重なヒューリスティックである。

ノイズの多い環境では、いくつかの認知バイアスも有益である。情報が不明瞭な場合、自分自身の強さに関する知識を持つことは適応的である（Ramirez and Marshall, 2015; Johnson and Fowler, 2011）。治癒にコストがかかる場合、プラセボ効果は騒がしい。環境で適応的である(Trimmer et al., 2013)。環境の安全性が隠されている場合、修復のためにコストを支払うことは得策ではないかもしれない。他者（医師など）がその環境が安全であることを明らかにすれば、治癒に必要なエネルギーを費やすことができる。

エラー管理の効果

エラー管理理論（EMT）は、さまざまな行動が非対称な便益/コストにつながるノイズの多い環境では、意思決定時に情報を偏らせることが最適になりうると予測する（Johnson et al., 2013; Buss and Kenrick, 1998）。この基本的な考え方は、McKayら(2009)の例でよく説明できる。完璧な煙探知機を作ることが不可能な場合、用心するに越したことはない。火災が発生していないのに警報を鳴らすのは迷惑だが、火災が発生しているのに警報を鳴らさないのは致命的だ。したがって、感知器を高感度に偏らせた方が有利なのである。その結果、エラーは増えるが、死は減るが迷惑は増えるという低いコストを支払うことになる。

煙探知機の原理 | 自然淘汰と防衛反応の制御

The smoke detector principle. Natural selection and the regulation of defensive responses ランドルフ・M・ネッセ（Randolph M. Nesse）ミシガン大学精神医学部、ミシガン州アナ

EMTは主に、予測不可能な環境では、ある事象が発生する確率を偏らせた方が有利であることを主張するために使われてきた。前述したように、人間はポジティブな体験の可能性について楽観的に予測を偏らせる傾向がある（Sharot et al., 2007）。EMTは、予測不可能な世界では、ノイズの多い環境を補正することで、このようなバイアスを最適化できることを示している（Haselton and Nettle, 2006; McKay et al.）さらにEMTは、偏った確率的思考が、不安（Bateson et al., 2011）、神への信仰（Johnson, 2009）、性的魅力の認知（Haselton and Buss, 2000）、病気の可能性のある人に対する社会的排斥（Kurzban and Leary, 2001）などに関連する人間の行動を説明するのに使われてきた。第4章では、EMTが、ある出来事の後に自分がどう感じるかを一貫して予測し誤る理由も説明できることを示す。

戦略的に間違っていることの進化：対人欺瞞

Kurzban(2012)は、「誤信念」と比べて少し異なる表現を使っている。彼の関心は、戦略的に間違っていることが個人にとって有益である場合を診断することである。言葉は変わっても、クルツバンは本質的に「誤信念」の進化について論じている。「間違い」は誤った信念と同じだ。さらにクルツバンにとって「戦略的」とは、間違っていることが何らかの利点をもたらすことを意味する。この意味で、適応的な誤信念と戦略的に間違っていることを一緒くたにすることができる。どちらも、虚偽の信念が真実の信念に比べて何らかの利益をもたらすことを必要とする。

前述したように、Kurzban(2011)は自己欺瞞の議論が混乱していると考えている。彼が主張するように、心がそれぞれ異なる仕事を任された複数の構成要素で構成されているのであれば（Kurzban and Athena Aktipis, 2007）、欺かれる統一された「自己」という概念は議論をいたずらに混乱させるだけだ。しかし、Kurzban (2012)はTriversと同意見であり、対人的な欺瞞は戦略的に間違っていることを示す唯一の有効な手段であるとし、他の当事者も欺かれていない限り、真実な情報の欠如から自己が利益を得ることができるという考え方を否定している。

ほとんどの偏った行動は誤った信念を必要としない

McKayら(2009)は、前述のバイアスの多くは信念を必要としないと論じている。そのため、それらは誤信念という見出しで括られるべきではない。彼らは、誤信念は肯定的な錯覚の場合にのみ適応的であると示唆している。エラー管理タスクは偏った行動につながる可能性はあるが、必ずしも偏った信念につながるとは限らない（McKay and Efferson, 2010）。例えば、道路を横断する前に、たとえ対向車が来ていないと確信していても、両側を見てから横断する。このような人は、対向車が存在するという誤った信念を持っているわけではなく、間違いを犯すと高い代償を払うことになるため、再確認する価値があると認識しているのである（McKay et al.）マッケイとデネットは、肯定的錯覚は、信念の虚偽性が利益を得るための必要条件である唯一の誤信念であると論じている。

反対　情報ではなく意思決定ルールを変える

ピンカー(2011)は、システムを設計する際には、知覚レベルではなく、意思決定レベルでバイアスをかける方が常に良いと主張している。サーモスタットの温度が60◦F（摂氏15度）以下のときにセーターを着たとしよう。しかし、62◦Fのときに寒いことに気づく。この問題を解決するには、a) 62◦Fのときにセーターを着るように判断ルールを変更するか、b) 実際の温度より2度低く表示されるようにサーモスタットを変更する。そうすると、サーモスタットを使用するすべてのシステムが偏った情報を受け取ることになる(Pinker, 2011)。

これに関連して、Trimmerら(2011)は、ある事象の発生確率を学習しようとするとき、バイアスを加えることが有利かどうかを分析した。彼らは、学習アルゴリズムによってはバイアスを加えることが有利であることを示した。妥当な事前分布があれば、ベイズ更新はバイアスを必要としない(Marshall et al., 2013b)。しかし、人間の頭ではベイズ更新の複雑さに対処できないことはよく知られている。その結果、成功確率を理解することの認知的限界を考えると、ヒューリスティックスによってベイズ的合理性を近似することは、自分の信念にバイアスをかけることを含むかもしれない(Marshall et al., 2013a; McKay and Efferson, 2010)。

2.3 まとめ

自己欺瞞の理論的研究に対する3つの障害

自己欺瞞、誤信念、戦略的に間違っていることの進化論的実現可能性に関する現在の文献を概観してきたが、さらなる研究は現在3つの要因によって制限されていると私は考えている。第一に、理論的な文献の中で、自己欺瞞の定義と、それに関連する誤信念と戦略的に間違っているという概念が混乱している。第二に、かなりの研究がなされているにもかかわらず、どの理論が機能的自己欺瞞の説明に成功しているかどうかについては、ほとんどコンセンサスが得られていない。最後に、私の知る限り、自己欺瞞の進化につながりうる環境のタイプを分析するための体系的な枠組みを提案した者はいない。これらの点について順番に論じていく。

2.3.1 私たちは何について話しているのか？

自己欺瞞の欺瞞的側面に関する哲学的・進化論的な議論は、バラバラである（Mitchell, 1986）。哲学者たちは、欺瞞が意図的であることの必要性を議論することに重点を置いてきたが、多くの理論家たちは、偽りの信念を必要とするだけだ。自己欺瞞が心理的利益をもたらすと考える理論家にとっては、自己を高める錯覚を生み出す進化したプロセスだけが必要条件であるようだ（Taylor and Brown, 1988; Ramachandran, 1996; Greenberg et al.）自己欺瞞が対人欺瞞を助けるために進化したと主張する人々にとって、唯一の必要条件は、情報収集に対する自己強化エラーまたはバイアスを生成する進化したメカニズムである（von Hippel, 2015; von Hippel and Trivers, 2011a）。どちらの仮説も、騙される側の意識的な意図や動機付けを必要としない。自己欺瞞と誤信念に関する研究の多くは、同一ではないにせよ、同様の現象に焦点を当ててきたように思われる。唯一の必要条件は、適応的な誤信念である。

2.3.2 大きな意見の相違が残る

もし自己欺瞞と誤信念の進化に関する研究が同じ現象に焦点を当ててきたのであれば、提案されている解決策がこれほどまでに食い違うのはなぜだろうか。自己欺瞞の進化に対する潜在的な選択的圧力は、いまだに激しく議論されている。自己欺瞞は心理的な幸福感を高めると主張する者もいるが（Taylor and Brown, 1988; Ramachandran, 1996）、経験的な結果も進化論的な首尾一貫性も論争の的となっている。臨床例が誤分類される可能性があるだけでなく（McKay et al., 2005）、仮説全体が自然淘汰の必要条件に抵触する可能性がある（von Hippel and Trivers, 2011a; Kurzban, 2012; McKay et al., 2009）。自己欺瞞が対人欺瞞のために進化したという考えに対する反対派は、人類が進化したのが小規模で緊密な集団であったことを考えると、そのような行動は成り立たないと主張する（Dunning, 2011; Bandura, 2011）。さらに、仮にその理論が正しいとしても、進化が欺瞞発見メカニズムを好んだという推定は、特に個人が嘘を見抜く能力が低いことを考えると、議論の余地がある（Fridland, 2011; Vrij, 2011）。

Kurzban(2012)は、対人欺瞞が虚偽の信念に対する選択的圧力を引き起こすという考えに同意している。しかし、彼や他の人々は、自己欺瞞は混同された用語であり、偽りの信念の進化に関する研究に置き換えるべきだと主張している（Harnad, 2011; Kurzban and Athena Aktipis, 2007; Fridland, 2011）。McKay(2011)は、対人欺瞞に関するKurzbanの議論に同意しているが、範囲が限定されすぎていると考えており、肯定的な錯覚も含めるべきだと提案している。GalperinとHaselton (2012)は、肯定的な錯覚だけが虚偽の信念に対する現存する選択的圧力であるという結論に反論している(McKay et al., 2009)。エラー・マネジメント理論では、認知バイアスが行動を引き起こす必要はないが、それでも人間は認知バイアスを示すようだ。

2.3.3 その場限りのカテゴリー化

自己欺瞞の研究を取り巻くまとまりのなさを無視したとしても、別の問題が存在する。自己欺瞞が発展しうる文脈を診断する体系的な分析はなされていない。議論のほとんどは、ある理論を別の理論よりも分析することに集中している。私の知る限り、自己欺瞞の進化につながるような圧力のタイプを分類した人はいない。自己欺瞞につながる選択的圧力を分類しようとする試みに焦点を当てた数少ない研究は、事後分析によって行われた。彼らは、認知バイアスの進化に関する現在の研究をすべて検討し、それらをグループに分類した（Haselton et al., 2015;Fawcett et al., 2014）。これは非常に役に立ったが、自己欺瞞が適応的である追加の文脈を探索する方法を診断するものではない。

次のセクションでは、まさにそのような診断を試みる。私は、自己欺瞞の進化に関する研究は、自己欺瞞現象の進化に必要な条件の分析によって助けられると提案する。自己欺瞞の進化を構成する部分を分析することによって、研究の道が発見され、現象全体としての適応的な性質に光が当てられるかもしれない。

2.4 自己欺瞞の進化に必要な条件

ここでは、自己欺瞞の哲学的定義と理論的議論を統一し、自己欺瞞の進化に必要な条件に収束させることを試みる。適応的誤信念が自己欺瞞の進化に必要な条件であることは、ほとんどすべての人（意図論者、動機づけ論者、進化論者）が同意している。それが自己欺瞞の十分条件であると考える人もいるかもしれないが、ほとんどすべての人が必要条件であると考えているのであれば、偽りの信念の進化的有効性に関する研究が進めば、自己欺瞞の進化可能性についての洞察が得られるはずだ。

2.4.1 必要条件1：自己欺瞞の行動は利点を提供しなければならない（あるいは、少なくとも不利点を提供しなければならない）

第1章で述べたように、進化論の基本的な考え方の一つは、「自然淘汰は必然的に、その人が住むどの国にも最もよく適応する体質を持って生まれた個体を保存する傾向がある」（Darwin, 1872, p.161）というものである。自己欺瞞の進化に関する理論も、この基準の例外ではない（Trivers, 2000）。もし自己欺瞞が進化するとすれば、ある環境においては、自己欺瞞を行った個体の行動は、少なくとも自己欺瞞を行っていない個体と同程度のパフォーマンスを示すと予想される。もし自己欺瞞を行う個体が欺かれない個体よりも優れていれば、欺かれた個体が繁殖上有利になるため、その行動が選択される可能性が高い。もし自己欺瞞を行った個体が、真実を知っている個体と同じような成績を収めれば、自己欺瞞は中立的に集団に流れ込む可能性がある。自己欺瞞が他者と比較して有害でない限り、自己欺瞞はその無害な性質によって集団に流れ込む可能性がある2。

重要なのは、前述の哲学的定義が、真実の知識を持つ人たちよりも優位に立つ必要性に制約されていないことである。意図論者と動機づけ論者の双方にとって、自己欺瞞は有害でありうる（実際、有害でないことの方が多い）。しかし、自己欺瞞が自然淘汰を生き残るためには、他者との相対的な優位性をもたらす行動につながる必要がある。

2.4.2 必要条件2：自己欺瞞が誤った信念を持っている

自己欺瞞の定義はすべて、自己欺瞞に陥った人が偽りの信念を持っていることを要求している。Mele (2012)が言うように、もし個人が真実の信念を持っているなら、どうやって欺くのだろう？たとえ誰かにだまされて本当の信念を持たされたとしても、その人はまだ本当の信念を持っている。真理を信じるように騙されたかもしれないが、騙されてはいないのだ。デイヴィッド・リヴィングストン・スミスもこれに同意し、「意図的な欺瞞と非意図的な欺瞞に共通するのは、私が誤信念と特徴づけた状態を誘発するという目的を持つことである」（Smith, 2014, p.189）と指摘している。

2.4.3 必要条件3：誤信念は適応行動を促進しなければならない

自然選択は表現型にのみ作用する。では、いつ自然淘汰が誤った信念を持つ素因に作用するのだろうか？歴史的に、進化論者は信念と、その信念が生み出す行動を区別してきた（Cloak, 1975; Dawkins, 1982; Dennett, 1995）。誤った信念を持っていても、その信念が行動によって表現される必要はない。例えば、ある個人が「月はチーズでできている」と自分を欺くことはできるが、意思決定をする際にその情報を使うことがなければ、他の人と比較して選択されたり反対されたりすることはない。

しかし、自己欺瞞が進化するためには、それが何らかの利益をもたらす必要がある（条件1）。自己欺瞞の必要条件が虚偽の信念を持つこと（条件2）であるとすれば、最後の必要条件は最初の2つを統合するものである。適応行動（条件1）を駆り立てる力は、偽りの信念（条件2）でなければならない。重要なのは、条件1の場合と同様に、これは自己欺瞞の必要条件ではなく、むしろ自己欺瞞の進化なのである。

2.4.4 動機づけ主義は脱落する

3つの条件が満たされると、動機づけ主義は脱落するように見える。動機づけ論者にとっては、自己欺瞞には虚偽の信念だけでなく、その信念を維持する動機も必要なのである。進化はその動機を与えてくれる。偽りの信念を使うことで、選択的優位が生まれるのであれば、それを維持する理由があるのだ。

2.4.5 意図主義者の条件

これら3つの条件は、意図主義者にとって必要だが不十分な基準であるように思われる。条件1は進化論的な要件であるため、信奉する自己欺瞞の筋とは無関係だ。条件2は、意図論者が静的パラドックスを解決することの難しさを認めているように、簡単に満たされる。

– 誰かが真の信念と偽の信念の両方を持っているという静的パラドックスを解決することの難しさを、意図論者は認めているからだ。条件3は意図論者にとって必要条件ではないが、やはり自己欺瞞を進化させるためには必要条件である。

しかし意図論者は、自己欺瞞に陥った人が自分自身を欺くことを意図していなければならないという動的パラドックスも解決しなければならない。セクション2.1.4では、進化論的枠組みを導入することで、この動的パラドックスを解決することができるかもしれないことを論じている。しかし、たとえ意図論者が自己欺瞞の機能的定義を支持しないとしても、強硬な意図論者は前述の3つの条件を必要とする。

2.4.6 理論家の要求

2.3.1節で述べたように、進化論者の多くは自己欺瞞を誤った信念の維持と定義している。自己欺瞞が自分の心理的幸福を向上させるにせよ、対人欺瞞を助けるにせよ、唯一の必要条件は適応的な誤信念である。したがって、前述した理論家のほとんどが、自己欺瞞の進化に必要な十分な条件（必要条件は言うに及ばず）として、誤った信念の進化を受け入れようとしないのであれば、私は驚きを禁じ得ない。

2.4.7 誤信と戦略的に間違っていることの条件

これらの3つの条件は、誤信念と戦略的に間違っていることの進化にとって十分である。条件2は誤信念の保有を必要とする。定義によれば、これは誤信念の進化と戦略的に間違っていることの条件である。他の要件は進化的な制約、すなわち、真実の信念を持つエージェントに比べて、誤信念が優位性をもたらすことだけだ。

2.4.8 まとめ

要約すると、自己欺瞞の定義と病因をめぐって議論が続いているが、ほとんどすべての定義が、個人が誤った信念を持っていることを要求している（条件2）。さらに、この現象が自然淘汰を生き残るためには、誤った信念が行動に転換され（条件3）、その行動が他者と比較して優位性をもたらす必要がある（条件1）。

動機づけ論者と意図論者は、自己欺瞞に機能主義的なアプローチを取り入れることで、議論に一貫性が加わることに同意しないかもしれない。動機づけ論者は、動機づけは進化的な力からではなく、個人の意識的な自覚から来るものでなければならないと主張するかもしれない。意図論者は、欺こうとする意図の責任を進化に転嫁することは、この現象に対する興味を失わせると主張するかもしれない。しかし私は、彼らでさえも、自己欺瞞の進化に最低限必要なのは、偽りの信念が何らかの利点をもたらすことだと認めざるを得ないと提案する。

動機づけ論者が意識的な自覚を必要とするのであれば、適応的な偽りの信念という要件は十分条件ではないが、それでも必要条件である。意図論者も同様である。欺く意図を意識的に要求しても、虚偽の信念という必要条件がなくなるわけではない。さらに、自己欺瞞の進化、誤信念の進化、戦略的に間違っていることに関する理論の多くは、すべて誤信念の進化に焦点を当てている。まとめると、自己欺瞞の概念には、どのような定義のニュアンスがあろうとも、誤った信念の進化が必要であるということが基礎となっている。

2.5 信念の進化可能性を分析することの難しさ

自己欺瞞の進化に関する理論が、誤った信念が適応的である文脈を診断することによって拡張できるとしても、依然として大きな問題が立ちはだかっている。誤った信念の進化可能性を理論的にどのように分析するのだろうか？誤った信念を持っているからといって、それが意思決定に用いられるとは限らない。例えば、¬pを信じているが、行動選択時にpを使うエージェントを想像することができる。

「信念」という概念には長い哲学の歴史がある。信念がどの程度行動と結びついていなければならないかは、多くの議論が行われてきた戦場である（Schwitzgebel, 2015）。信念は行動と結びついているかもしれないし、結びついていないかもしれない、あるいは民間心理学の有用な構成要素としてしか存在しないかもしれない（Churchland, 1981）。さらに、「信念」をどのように定義しようとも、信念の存在を診断する唯一の方法はおそらく行動である（Dennett, 1987）。しかし、少なくとも時折、信念と行動が食い違うことがあるようだ（Gendler, 2008b）。アリーフ（alief）という用語は、信念と行動が不一致である場合を説明するのに使われてきた（Gendler, 2008a）。例えば、グランドキャニオンの手すりの向こう側で、自分は安全だと信じているにもかかわらず、体が抑えきれずに震えてしまうような場合である。

もし自己欺瞞の進化的実行可能性が、誤信念が適応的行動に寄与すること（条件3）にかかっているのだとしたら、そしてもし信念と行動を明確に結びつけることができないのだとしたら、理論はどのように前進できるのだろうか。この問題は、偽の情報に基づいて行動することの有用性を議論することで、回避することができると私は提案する。

2.6 前進する。偽情報を使うことの進化

意思決定において偽情報を使用することが、真実の情報を使用することよりも優れているという文脈が存在するかどうかを考えることで、信念の進化可能性と定義に関する議論を回避することができる。偽の信念が進化するためには、その信念が適応的な行動を生み出す必要がある（条件3）。そのため、信念は行動で使われなければならない。これによって、エージェントが¬pを信じているにもかかわらず、意思決定の際にpを使うという、前述のような難問はなくなる。pという誤った信念は、行動の生成に使用されなければならない。したがって、偽の信念を進化させるには、偽の情報を使用する必要がある。

偽情報の使用を進化させるためには、必然的に偽の信念が存在する必要はない。しかし、誤った信念の進化には、誤った情報の使用が必要である。これは重要な推論につながる：

もし自己欺瞞の進化のすべての定義が偽の信念の進化を必要とし、偽の信念の進化が偽の情報によって規定される行動を必要とするならば、自己欺瞞の理論は、偽の情報を使うことが適応的である環境を診断することによって拡張されるかもしれない。

この推論と、自己欺瞞の進化に必要な3つの条件が妥当であると仮定すれば、自己欺瞞の進化の理論的実現可能性に関する研究は、偽情報を用いることで真実の知識を用いる場合よりも優位に立てる環境を発見することで拡張できるかもしれない。本論文はまさにそれを試みるものであり、真実の情報を偏らせたり無視したりすることが適応的である環境に関する知識を拡張するものである。

偽りの信念が自己欺瞞に十分であり、偽りの信念がしばしば行動に用いられることを受け入れるならば、本論文は自己欺瞞が適応的である状況が偏在していることを論証する。これらの条件を、自己欺瞞の進化に必要ではあるが不十分であるとして受け入れるならば、本論文はまだ多くの必要な洞察を提供していることになる。少なくとも、自己欺瞞の進化に必要な条件のひとつは、ユビキタスで発見されることを示している。いずれにせよ、必要条件の進化的実現可能性は、現象全体の体系的な探索を始めるのに適した場所である。

2.7 結論

本章では、自己欺瞞の定義と進化的実現可能性の両方に関する文献の状況を概観した。どちらの面でも議論は続いている。意図論者は、自己欺瞞者は自分自身を欺くつもりでなければならないと主張する。動機づけ論者は、偏った情報探索で十分だと主張する。自己欺瞞の進化をめぐる仮説は、対人関係の欺瞞を要求するものから、自尊心を高めるものまで様々であり、特に焦点が絞られているわけではない。しかし、自己欺瞞を選択する環境のタイプを系統的に探索することには、ほとんど注意が払われていない。この現象の進化に必要な条件を診断し、その条件の実現可能性の探索を行った者はいないようだ。

ここでは、自己欺瞞の進化に必要な条件についての議論を展開する。自己欺瞞の定義がどのようなものであれ（多くの定義がある）、その進化的実行可能性は、偽の情報によって適応的な行動を生み出すことに依存している。そのため、自己欺瞞は、真実の情報を欠くことに対する選択圧を生み出す環境について、より厳密な調査を行うことで恩恵を受けるかもしれない。本論文の残りの部分では、まさにそのような調査を始める。次の6章では、検証可能な情報を偏らせたり無視したりすることが、検証可能な情報を用いる人よりも優れているという、これまで診断されていなかった様々な文脈が存在することを証明する。検証的知識を欠くことが適応的であることを証明することで、いくつかの放置された科学的疑問を解決する。さらに、この研究は自己欺瞞の普遍性を説明し始めるかもしれない。確かな知識を欠くことへの選択的圧力は、自己欺瞞の進化に必要な条件の一つであるため、自己欺瞞が人類の進化に一役買っているという考えを真剣に考える時期に来ているのかもしれない。

3　価値観の同類性は協力に利益をもたらすが、誤った社会情報を用いる動機となる

しかし時折、彼は人間の願望がいかに浅薄で、気まぐれで、無意味なものであるか、そして人間の本当の衝動がいかに虚しく、私たちが抱いていると公言する尊大な理想と対照的であるかを目の当たりにせずにはいられなかった。そして、夢の贅沢さや人為的なものに対して、彼らが教えてくれた丁寧な笑いに頼ることになる。私たちの世界の日常生活も、同じように贅沢で人為的なものであり、美しさにおける貧しさや、自らの理性や目的の欠如を認めたがらない愚かさゆえに、尊敬に値しないことを彼は知っていたからだ。

H.P.ラヴクラフト『銀の鍵』

人間の虚構について最も驚くべきことは、それが有史以前から社会世界に薄っぺらな天蓋のように垂れ下がっていたことではなく、彼がそれを発見するようになったことなのだ。”

アーネスト・ベッカー『壊れやすいフィクション』

3.1 まとめ

噂話には間違いが起こりやすいという事実があるにもかかわらず、個人はしばしば自分の経験ではなく、第三者の噂話に基づいて他人を判断する。たとえそれが自由な知識であったとしても、私たちは他人の長所を判断するのではなく、第三者の意見に基づいて判断する。ここでは、この観察を協力の進化という文脈で理解しようとする。もし個人が実力ではなく社会的評判で判断されるなら、エージェントはそれを利用し、協力の持続可能性を損なうかもしれない。私たちは、間接的互恵性による協力の進化をシミュレートするために用いられてきた囚人のジレンマのバージョン（寄付ゲーム）を採用する。まず、同類性（同じような信念を持つ他者と相互作用する傾向）を社会に加えることで、協力の持続可能性が高まるという命題を検証する。しかし、このことは、集団内のステータスを正確にシグナリングすることと、他のエージェントの行動を正確に報告することの間に、進化的な対立を生み出す。私たちは、最終的に協力を広める最良の方法として、集団内の地位のシグナリングが正直さを凌駕する条件が存在することを発見した。

3.2 はじめに

個人学習と比較して社会学習の進化を促す重要な利点は、社会学習がより少ないコストでより多くの、あるいはより優れた情報を提供することである、とよく議論される。他人が知っていることから利益を得ることができる個人は、自分の身近な生活上の出来事に限定された個人よりも低い個人リスクで、より幅広い経験から知識を引き出すことができる（Boyd and Richerson, 1985; Ferna´ndez-Juricicic and Kacelnik, 2004; King and Cowlishaw, 2007; Magurran and Higham, 1988; Rendell et al.）しかし、社会的に認知された情報が誤りであることを発見した場合、どうなるのだろうか。もし正しさが最重要事項であれば、社会的に学習された誤った情報は、より信頼できる情報源（例えば実体験）によって置き換えられると予想される。

しかし、ヒトはこのようなことをしないという証拠が増えつつある。Sommerfeldら(2008)は、ある参加者がどのような状況で他の個人にお金を寄付するかをテストした。各ラウンドで、参加者はペアになり、1人（ドナー）はもう1人（レシピエント）に寄付する機会を与えられた。各寄付者は、a) 受領者が寄付者であったときの寄付傾向の直接観察された履歴、b) 受領者の第三者からのゴシップで広まった評判、のいずれかを与えられた。直接観察に比べ、評判によって説明される寄付傾向のばらつきの方が有意に大きかった。さらに、Lorenz et al. (2011)は、他の人の回答に基づいて、質問に対する自分の回答を編集することを示したが、この場合、グループの平均的な回答の正しさが低くなることが多い。他の種と比較しても、ヒトは他の霊長類よりも不正確な社会的見解を長く持ち続けている（Whiten et al.）

帰無仮説は、上記の行動は通常適応的ヒューリスティックであるものに対する不適応な例外である、というものである。社会的学習は、時間を含む正確な情報を得るための全コストを考慮すると、エラーの発生率が高いにもかかわらず、最良の戦略である可能性がある（Mitchell et al., 2013;Bryson et al., prep）。さらに、研究者たちは、人間が最も有用な社会的に獲得された情報の探索にバイアスをかける複数のヒューリスティックスを提唱している。適合性バイアス-多数派に合わせて行動する（Henrich and Boyd, 1998）、名声バイアス-最も名声のある人を真似る（Henrich and Gil-White, 2001）、ペイオフバイアス-最も成功した人を真似る（Messon et al.）(Mesoudi,2011)などがその例だ。さらに、社会的な情報伝達が誤りをもたらすこともあるが、個人学習も同様である。したがって、正しい直接観察が容易に行える稀な状況（Sommerfeld et al. 2008など）において、個人は直接観察された正しい情報の代わりにノイズの多い社会的情報を用いるかもしれない。

これらの説明では、エラーの起こりやすい社会的学習は「最低最悪の」選択肢であり、有用でない文脈で社会的情報を利用する人間の傾向は、一般的に適応的なヒューリスティックに対する局所的な例外に過ぎないと論じている。しかし、その根底にある仮定は、（ゴシップであれ非社会的なものであれ）情報の有用性は情報の正確さにかかっているというものである。ここでは、社会的情報を優先して正確な個人的経験を無視する別の説明を提案する。もし社会的情報が、その情報の活用に関する社会的規定とともに提供されるのであれば、情報を活用するかどうかの決定に影響を与える要因は、正確さだけにとどまらないかもしれない。

私たちは、特定の文脈において、真実の個人的経験を無視することが、より一般的な情報の協力的交換を促進する可能性があることを示す。特に、一般的に協力を促進するメカニズムは、2つのレベルの情報の間にジレンマを生じさせる可能性がある。私たちは、評判によって協力が規制される社会のモデルから始める。エージェントは他のエージェントに寄付をするかどうかを決定し、エージェントの評判は集団全体に広がる。このモデルにホモフィリー（同じような信念を共有する他者と行動を共にする傾向）を加えると、コミュニケーションの誤りに対する協力の頑健性が高まることを示す。しかし、その結果、個々のエージェントが正しい情報にアクセスできる場合でも、誤った社会的情報を採用することが適応的になる。不正確な情報に基づいて行動するコストよりも、集団の全会一致に対するペイオフが上回るような条件下では、規範に従う選択的圧力が生じる。

私たちの検証は、コンピュータ・シミュレーションと公式分析の両方を用い、以下のように進める。まず、同類性と協力の進化に関する文献を簡単に紹介する。次に、誤差が協力の進化に及ぼす影響を調べるために、寄付ゲームをモデル化する。寄付ゲームは、移動性の高い社会における協力の進化に関する存在証明として利用されてきた（Nowak and Sigmund, 2005）。これは、囚人のジレンマの具体的なインスタンスとして記述することができ（Suzuki and Kimura, 2013; Masuda, 2012; Uchida and Sigmund, 2010）、理論的にも協力の研究に使われ続けている（Tanabe et al. 2013; Masuda, 2012; Hilbe et al., 2013; Stewart and Plotkin, 2013; Uchida and Sasaki, 2013; Marshall, 2011, 2009; Nakamura and Masuda, 2012）だけでなく、実験的（Angerer et al.）私たちは、寄付ゲームと評判の拡散が協力を維持するために利用できることを示す（Panchanathan and Boyd, 2003; Nowak and Sigmund, 2005）。この結果は、協力を測定するためのベースラインとして採用される。

次に、価値同類性（自分と同じ信念を持つ人々と相互作用する傾向）が協力に及ぼす影響を分析する。私たちは、相互作用が共有された信念に偏るにつれて、協力が誤差に対してますます頑健になることを発見した。最後に、個人が受け取った社会的情報が間違っているかどうかを単独で発見できるようにする。この情報に基づいて行動した場合の結果を検証する。その結果、同族社会では、正しい情報を用いているエージェントが、既知の誤りを伝えるエージェントに侵入されることがわかった。このことは、自集団のメンバーに関する正直なシグナリングが、他者の行動に関する正直なシグナリングの重要性を上回る可能性があることを示している。この結果が自己欺瞞に関する文献に与える影響について考察する。

3.3 モデルと文脈

3.3.1 協力の問題

これらの問題を探求するためには、ある条件を満たす文脈が必要である。第一に、エージェントは社会的に価値ある情報を学ばなければならない。第二に、その情報は誤りの影響を受けなければならない。そして最後に、個人は社会的に学んだことを覆す能力を持たなければならないが、そうすることで社会規範に違反することになる。私たちのモデルでは、「囚人のジレンマ」の一種である「寄付ゲーム」（Marshall, 2011）を用いている。このゲームは、個人が他者の評判に関する社会的情報を交換することで、社会で協力が成立することを示すために用いられてきた（Nowak and Sigmund, 1998, 2005）。モデルの詳細は次節で述べるが、その前に協力の問題についての背景情報を述べておこう。

協力的な社会とは、集団的に離反がないことで個人が利益を得る社会と定義される（Axelrod and Hamilton, 1981）。しかし、他のメンバーが協力的であれば、どのメンバーにとっても離反が有利に働くことが多い。このような離反の問題を克服するメカニズムとして、いくつかの仮説が立てられている。互恵的利他主義では、あるエージェントが他のエージェントに対して向社会的な行動をとることで、他のエージェントが後日それに応えてくれるというものである。しかし、人間のような移動社会は、しばしばフリーライダーに対して脆弱であると考えられている（Enquist and Leimar (1993)、ただしSchonmann et al.(2013)を参照）。個人は日和見的に離反し、その行動の結果が追いつく前に移動してしまうかもしれない。そのような場合、協力を説明するために別のメカニズムが必要になるかもしれない。

間接的互恵性（Nowak and Sigmund, 1998）は、エージェントが他のエージェントから利益を受け取る可能性が高いため、他のエージェントに対して向社会的に行動することで、この問題を解決する。これは、個人がお互いを観察し、規範に従って行動を判断し、社会的伝達を通じて結果として生じる評判を伝えることで達成できる。脱落者は、どんなに機動力があろうとも、相互作用のたびに評判が先行し、コストを被る可能性がある限り、もはやフリーライドすることはできない。

例えば、個人の評判が実際の行動とどの程度一致しているかなどである。しかし、上述の仮説を検証するためには、さらに規範的な意味を持つ情報が必要である。したがって、1次と2次を区別する必要がある。

表31：一次規範エージェントは、受け手の評判に関係なく、協力するアクションを実行することで良い評判を受ける。エージェントは協力しなかった場合、悪い評判を受ける。

表32：判断規範。エージェントは、良いエージェントに協力したり、悪いエージェントに対して離反したりすることで、良い評判を得る。この2次規範は、協力を強制することができるが、記述的／規範的対立を引き起こす。さらに本文を参照のこと。

3.3.2 1次規範と2次規範

評判の広がりがどのように協力を成立させるかに関する先行研究では、一次規範が採用されている（表31参照）。エージェントが協力すれば、良い評判を受け取る。評判を意識したエージェントは、良いエージェントと協力したり、悪いエージェントと対立したりする。しかし、一次規範を採用すると、無差別に善を行う者という予期せぬソースから、協力社会に対する脅威がもたらされる（Nowak and Sigmund, 1998）。協力的な社会では、無差別的な協力者が中立的な漂流によって集団に侵入する可能性がある。無差別的な協力者は他人の評判を気にしないので、直接的に離反をもたらすことはないが、無差別的な協力者で構成される社会は、排除によって離反者を罰することができないので、離反者によって侵略される可能性が高い。したがって、善悪の評判を利用することだけでは協力には不十分である。その代わり、協力には、善人には善いことを、悪人には悪いことをするという評判への影響も必要である–二次的判断である（表32参照）。

しかし、第2次規範への移行は、社会的知識と非社会的知識によって動機づけられた行動との間に葛藤が生じるリスクを導入することなしに行うことはできない。ある個人が、社会的に否定的な評判を得ている他人と交流しているが、その相手の評判が虚偽であることを孤立した状態で発見した場合、その個人の最善の戦略は何だろうか。もし「正直に」、つまり相手に関する記述的知識に従って対応すれば、その行為者は仲間たちが採用している規範に違反するリスクを負うことになる。

3.3.3 記述的対規範的

私たちは、有用性が記述の対象に関する正確さに依存する知識を記述的側面と呼ぶ。ここで検証される私たちの仮説は、情報の有用性がその正確さのみによって構成されるわけではない場合があるかもしれないということである。社会的な情報が、単に記述的なものだけではない意味を持つ場合があることを説明するために、次のような思考実験を考えてみよう。ある友人が別の友人にあるレストランはやめたほうがいいと忠告したが、忠告にもかかわらず後者はそのレストランで食事をした。そのレストランの最終的な質はともかくとして、同僚と位相がずれていることに意味があるのだろうか？

個人が他者からの情報を受け入れるとき、記述的なものを超えた知識の仮説的な側面を、私たちは規範的と呼ぶ。規範的なものと記述的なものとの区別が顕著になるのは、社会通念と矛盾するような正確な個人的経験を持っている場合である。この場合、情報の有用性がもっぱら記述的なものであれば、最善の戦略は明らかだ。しかし、社会的情報が直接的な評価以上の意味を持つ場合、選択はそれほど単純ではない。情報の正確さを優先することで得られる利益は、評判の点で発生するコストに勝るかもしれない。この場合、ゴシップに対する規範的な反応を純粋に記述的な反応よりも優先させれば、個人は嘘だとわかっている情報を使うことで利益を得ることができる。本稿では、エージェントがこのような選択をした場合の結果を探る。

3.3.4 価値の同類性

このジレンマに直面する可能性は、ゴシップの誤りの量だけでなく、ゴシップが伝達される社会ネットワークのトポロジーにも依存する。様々な研究が、社会的ネットワーク構造が協力に与える影響を考察してきた（Ohtsuki et al., 2006; Santos et al., 2008; Taylor et al., 2007）。しかし、私たちは、エージェントが同じ社会的に不正確な情報を共有する他のエージェントと相互作用する確率を変化させた場合の結果を探索する。そのために、価値同類性（value homophily）という概念を用いる。

価値同類性とは、同じような信念や価値観を共有する個人と付き合う傾向のことである（McPherson et al.）計算モデルによって、同類性行動バイアスの進化的実現可能性が論じられ（Fu et al., 2012）、同類性の傾向は、グローバルな信念が異なるローカルな文化的収束につながる可能性があるとされている（Axelrod, 1997）。

さらに、価値観の同類性は人間社会で広く診断されている。Curry and Dunbar (2013)は、共通の趣味、道徳的信念、ユーモアのセンスが友人間のコミュニケーション頻度と相関することを示した。人間は、デート（Fiore and Donath, 2005）、薬物使用（Kandel, 1978）、その他いくつかの自己報告された性格特性（Adamic et al.）人間は、志を同じくする個人はより知的で、道徳的で、時事問題に詳しいと期待する（Byrne, 1961）。Rossら(2013)は、地理的・文化的な地形による民話の違いを研究した。彼らは、「100km離れた場所で発見された同じ文化の民話は、10km離れた異なる文化圏で発見された民話と平均して類似している」ことを発見した（Ross et al.）価値観の同類性のレベルを調整することで、不正確な社会情報よりも正確な個人情報を採用することの利点を考える。

図3-1: 寄付ゲームのラウンド中、ドナー（D）はレシーバー（R）に協力する（コストcを支払う）か（利益bを得る）、あるいは、拒否する（コストを支払わない）。寄付者の行動は観察者(O)によって規範に基づいて判断され、それに応じて評判が変更される。そしてオブザーバは、新しく形成された評判を残りのエージェントに広める。(x1…xn)。しかし、評判はある程度の誤差を伴って広まる可能性がある。

3.4 モデル 1: 間接的な互恵関係による協力

3.4.1 シミュレーション

ここでは、寄付ゲームを用いて協力の進化を実証する。この実験は、すでによく知られていることを再現している。評判は、コミュニケーションに誤りがあっても協力を維持することができる（Panchanathan and Boyd, 2003）。私たちはこれを、以降の実験における協力の持続性を判断するためのベースラインとして使用する。このように、私たちは、後続の実験が既存の文献と比較できるように、寄付ゲームの過去のインスタンスに沿ったパラメータを選択した。

寄付ゲームのラウンドでは、個人は他のエージェントに利益を与えるためにコストを支払う機会がある。最初は2人のプレイヤーがいて、ドナーはレシーバーに協力するか離反するかを決める。協力が選択された場合、ドナーは受益者に利益bを与えるためにコストcを支払う。もしドナーに欠陥があれば、ペイオフは両プレーヤーともゼロとなる。その結果、寄付をしたエージェントは正の（または負の）評判を得ることができ、後日他の誰かに助けられる（または助けられない）。

本文を参照のこと。

表33: 自由パラメータ、現在の図で使用されている値、およびテストされた値の範囲を含む感度レポートの表。

寄付ゲームの3人用バージョンを使用する。ここでは、追加プレイヤー（オブザーバー）が相互作用を監視することが許されている（図3-1参照）。そして、オブザーバーは寄付者に対する評判判断を広める。本稿では、すべての相互作用にオブザーバーが存在し、オブザーバーが「判断する」社会規範によって寄付者の評判を判断すると仮定する（付録で他の規範についても検討する）。

観察者は、広く受け入れられている社会規範（文献では「判断規範」（Nakamura and Masuda, 2012）と呼ばれる）を介して、ドナーの評判に対する信念を変更する。観察者がこの規範を用いる場合、間接的互恵性によって協力が維持されることが分かっている（大槻・岩佐, 2006, 2004; 内田・佐々木, 2013; 内田・シグムンド, 2010）。表32は判断規範を示している。もし援助者が協力を選択し、観察者が被援助者の評判が良いと考えるならば、観察者は援助者に良い評判を付与する。逆に、提供者が協力しても、観察者が受け手の評判が悪いと考えるなら、観察者は提供者を悪いと評価する。提供者が不良であればその逆である。その後、オブザーバーはドナーに対する新しい評判の見方を他の集団と共有し、彼らはそれに従って信念を更新する（図3-1参照）。

NowakとSigmund (1998)のように、3つの戦略が考えられる：常に欠陥(ALLD)、常に協力(ALLC)、差別(DISC)である。提供者として、弁別する（DISC）エージェントは、受信者の評判を信じることに基づいて、協力するか、または欠陥する。ドナーはエージェントが善良であると信じていれば協力し、そうでなければ離反する。他の2つの戦略は、受信者の評判を考慮せず、その名の通り常に協力か欠陥かを決定する。

誤差(e)は[0…1]の範囲に限定され、オブザーバーから間違った評判の調整を受けた集団のパーセンテージを表す。もしe = 0ならば、オブザーバーはドナーの新しい評判を全住民に納得させる。そうでない場合、集団の何割かが間違った評判を受け取る。例えば、e = 0.2の場合、集団の20%がそのドナーに対する評判を不正確に更新する（図3-1参照）。どの個人が間違った評判の更新を受けるかは、各インタラクションの間にランダムに選択される。したがって、あるエージェントはエージェントAに対して不正確な情報を持っているかもしれないが、エージェントBは持っていないかもしれない。

N=100の個体集団があり、それぞれが戦略を表す1つの試行遺伝子座と、他のすべての個体の評判についての信念を表すリスト（サイズN-1）を持っていると仮定する。

リストの各要素は2つの状態のいずれかに存在し、私たちはこれを良い状態と悪い状態と呼ぶ。協力社会の持続可能性を検証するために、最初はDISCエージェントのみで集団を構成する。そして、侵入してくるALLDに直面しても、あるいはALLDに対して脆弱なALLCを介して間接的に、協力関係を維持できるかどうかを分析する。

各ラウンド(r)において、ランダムに選ばれた3つのエージェントが受領者、提供者、観察者の役割を担う寄付ゲームのインスタンスが発生する。その戦略に基づいて、ドナーはレシーバーに寄付するかどうかを選択する。もしドナーが協力すれば、個人的コストcを支払って受け手に利益bを与える。ドナーの行動と、観察者が受け手の評判を信じることに基づいて、集団の一部（1 – e）は、観察者の新しい信念と同期するように、ドナーに対する評判の信念を変更する。残りの集団(e)は、観察者の信念と正反対の信念に誤って更新する。

このような相互作用がr = 10,000ラウンド繰り返され、1世代となる。世代が終わると、総ペイオフ（世代中に各個体が支払ったコストと受け取った利益の合計）が計算される。これは個体iのフィットネス（pi）を表し、次の世代における様々な戦略の割合を計算するのに使われる。これを行うために、進化的選択アルゴリズムである適合度比例選択（Goldberg and Deb, 1991）を採用する。適合度比例淘汰では、新しい世代の各メンバーは、前の世代から個体を選択することによって決定され、個体iが選択される確率は、個体iのペイオフを集団の総ペイオフで割ったpi/( n j=1 pj)となる。突然変異u = 0.01の確率は小さく、エージェントの戦略は3つの利用可能な戦略のうちの1つに変化する。実験はg = 500世代にわたって実行される（パラメータと感度については表33を参照）。

結果

図3-2はその結果を示しており、最後の50世代における世代ごとの平均的な協力行動の割合を示している。この図は、エラー率（e）と利益/コスト（b/c）比のパラメータ掃引を通して、協調行動の割合を表示している。明らかに、不連続の閾値が存在する。曲線の白い領域では大部分の行動が協力的であり、暗い領域では協力が不安定になりALLDが侵入する。b = 1.5、e = 0の異常値は、エラー率が低い場合にALLCが侵入し、その後ALLDに対して脆弱になることがあることを示している（Fishman, 2003; Ohtsuki and Iwasa, 2004）。一般に、この図は、利益／コスト比が大きくなるにつれて、協力的な社会は、風評発信におけるエラーの増加に対応できることを示している。しかし、利益／費用にかかわらず、協力は約0.2のエラー率によって制限されるようだ。

【本文参照】

図3-2: 500世代中最後の50世代で協力的であった寄付ゲームの平均割合。エラー率とベネフィット/コスト比のパラメータスイープは、協力の進化的持続性が両パラメータの相互作用に依存することを示している。パラメータの詳細については表33を参照のこと。

3.5 モデル2：同類性

3.5.1 シミュレーション

モデル1は、エージェントがランダムに相互作用する場合、コミュニケーションのエラーによって協力の選択が制限されることを示している。しかし、人間社会ではランダムな相互作用はまれであり、個人の信念と相互作用傾向の間に相関があることが頻繁に発見される(Adamic et al., 2003; Curry and Dunbar, 2013; Fiore and Donath, 2005; Kandel, 1978; McPherson et al., 2001)。モデル2では、コンピュータ・シミュレーションと分析的分析の両方を用いて、価値同類性と呼ばれるこの現象の効果を検証する。

価値同相性が親社会的行動の進化に及ぼす影響を分析するために、私たちは価値同相性を情報的関連性と交流傾向の相関と定義する。したがって、ランダムに相互作用する社会（価値同相性の低い社会）と、個人が志を同じくする他者と相互作用する傾向のある社会（価値同相性の高い社会）を比較する。

私たちは、評判の分布に影響を与える抽象化された文化的変数が存在すると仮定する。すなわち、エージェントは、ランダムな相互作用と比較して、与えられた受信者に対する評判評価を共有する他のエージェントと、より頻繁に相互作用する。したがって、私たちは新しい変数、同族性、h = [0…1]を追加した。

特定の社会構造やネットワークを定義するのではなく、私たちは同族性を、ドナーがレシピエントの評判に対する信念に同意するオブザーバーと相互作用する確率として運用した。最初は、各インタラクションにおいて、ドナー、レシピエント、オブザーバーはランダムに選ばれ、これは変わらない。しかし、もしドナーとオブザーバーがレシピエントの評判について同意しない場合、hは（そのようなエージェントが存在する場合）レシピエントの評判に対するドナーの評価に同意するエージェントでオブザーバーを置き換える確率を表す。例として、h = 0.2の場合、ドナーとオブザーバーが不一致の場合、20%の確率で異なるオブザーバーが選ばれる。このオブザーバーは、特定のレシピエントに関してドナーの信念を共有するエージェントのサブセットから選ばれる。

重要なことは、母集団内でも同じ量の誤差が伝播する（つまり存在する）ということである。誤差は、観察者が母集団のeパーセントに誤情報を与えることによって完全にもたらされる。モデル1と2の唯一の違いは、観察者の選択基準を介することである。したがって、提供者が無作為に選択された場合、提供者が受領者の評判を誤って信じる確率は最初のモデルと変わらない。

また、同類性をドナーとレシピエントではなく、ドナーとオブザーバーの間の一致として定義している理由も注目に値する。なぜ提供者が同じ志を持つ受領者と出会う可能性が高いような価値同相性を実装しないのだろうか？内集団／外集団のダイナミクスを含む間接的互恵性に関する最近の研究では、同じ集団に属するのは、援助者と観察者ではなく、援助者と被援助者である（Nakamura and Masuda, 2012; Masuda, 2012; Jusup et al.）

私たちは、間接的互恵性の中で内集団を考慮する別の方法を提案する。観察者は被援助者と同様に援助者の社会的ネットワークを共有している可能性が高い。間接的互恵はエージェントが二度会わないという前提で成り立っているため、モバイルエージェントを使った例を紹介する。村XではエージェントAは評判が良いが、村YではエージェントAは評判が悪い。移動性の高いエージェントが村Xを訪れ、エージェントAの評判を聞き、エージェントAに会う。移動性の高いエージェントは村Xを訪れているので、エージェントAに会ったとき、村Yの人よりも村Xの人に観察される確率が高い。この意味で、エージェントは交流するグループを持たないが、あるエージェントと交流すると、流浪するエージェントに受け手の評判を知らせたエージェントによって観察される。議論の中でこの点に戻り、同類性の定義を変えた場合の結果を検証する。

結果

図3-3は、同類性が協力の持続性に及ぼす結果を示している。図3-3(a)-同類性の最大度(h = 1)を示す-と図3-2(h = 0)を並べると、提供者と観察者の間に一致性があれば、安定した協力はより大きな誤差を許容できることが明らかだ。図3-2では、誤差e = 0.2程度で協力は失敗する。図3-3(a)の同類性では、協力は約e = 0.4のエラーレートを維持できる。さらに、この結果は様々な環境で再現可能である。A.1.1では、この結果が他の社会規範（StandingやShunningなど）にも拡張されることを示す。A.2では、評判が二値的ではなく、より連続的な場合に、この結果が再現される。

図3-3(b)は、図3-2および図3-3(a)の結果の一部を示しており、便益/費用比は5である。グラフは、完全な同類性（h = 1）と無作為に選択された観察者の元のインスタンス化（h = 0）の両方について、協力的行為の平均割合を示している。与えられたエラー率に対して、提供者とオブザーバーが受信者の評判に同意すると、評判の精度に関係なく、協力行為の数が増加する。h = 0の場合、協力はe≈0.2で失敗するが、評判評価における全会一致は、エラーレートの2倍（e≈0.4）でも安定した協力を可能にする。さらに、同類社会はより多くのエラーに対して協力を維持するだけでなく、どちらの社会でも協力が維持される場合、同類社会はより多くの協力行為を行う。例えば、e = 0.1では同類社会でも非同類社会でも協力は安定しているが、h = 1ではより多くの協力行為が行われる。

図3-3：(a) 最後の50世代にわたって協力的であった寄付ゲームの平均割合を示す。同類性は100%である（h = 1）。(b)h=1とh=0での協力的行為の割合の比較。ベネフィット/コストは5で固定。エラーレートは0.01刻みで[0,0.5]に変化する。

3.5.2 簡略化された分析モデル

シミュレーションでは、結果の根底にあるメカニズムを解明することは難しい。ここでは、同類性が協力に及ぼす影響を解析的にモデル化することを試みる。シミュレーションからいくつかの単純化した仮定を置くが、それが結果に重大な影響を与えることはないだろう。第一に、エージェントはまずドナーとして選ばれ、次にレシピエントとして選ばれると仮定する。第二に、DISCとALLDの2つの戦略のみを考慮する。判定規範とコミュニケーションにおけるエラーにより、ALLCエージェントが集団に流れ込み、その後のALLD侵入のリスクになる危険性は比較的低い（Takahashi and Mashima, 2006; Fishman, 2003; Ohtsuki and Iwasa, 2004）。その結果、私たちはALLDがいつDISCの社会に侵入するのか、そして同族社会がどのようにそれを防御するのかに注目する。最終的に、私たちは進化を用いず、むしろ希少なALLDが、ほぼDISCのみで構成される集団よりも優れたパフォーマンスを発揮する場合のみを検証する。

私たちは、寄付ゲームが有限ではあるが長期間プレイされる無限の集団を想定している。PrとPdを、それぞれDISC（つまり相互援助者）とALLDと相互作用する確率と定義する。各ゲーム終了後、wは次のラウンドの寄付ゲームが行われる確率である。Panchanathan (2011)と同様に、2ラウンド目には評判の割合が平衡になると仮定する。このことから、ALLDのフィットネス（πd）は次のように表される：

πd = bPr + w

w　1 – w (bPrGd) (3.1)

最初のラウンドでは、各エージェントは良いエージェントとみなされるので、ALLD エージェントは DISC エージェント(bPr)に出会えば利益を受ける。それ以降のラウンドでは、ALLDエージェントはDISCエージェントに出会えば利益を受け、DISCエージェントはALLDエージェントが善良であると考える。Gdは他のエージェントがALLDエージェントを良いと考える確率を表す。

DISCエージェントの適合度は3.2式で表される。最初のラウンドでは、エージェントは他のDISCと相互作用すれば利益を受ける。さらに、各エージェントは良い評判(bPr – c)から始まるので、常に協力のコストを支払うことになる。それ以降のラウンドでは、エージェントが他のDISCと相互作用し、そのエージェントがDISCを良い（Gr）と思えば、エージェントは利益を受ける。そのエージェントが善であると信じているエージェントと相互作用すれば、そのエージェントは協力のコストを支払うことになる。

πr = bPr – c + 1 – w [bPrGr – c(PrGr + PdGd)] (3.2)

私たちのシミュレーションでは、DISCの集団が侵略に強いかどうかをテストする。分析モデルでは、DISCエージェントの平均体力がALLDエージェントの平均体力より大きい限り、これは正しい：

πr – πd > 0 (3.3)

さらに、侵攻シナリオでは、最初はPr≈1、Pd≈0であると仮定する。プレイが長期間続くと仮定すると（w≈1）、以下の場合、DISCの集団は侵攻に対して安定であると予想される（詳細は付録A.4.1を参照）：

G > bGd b – c (3.4)

式3.4は、DISC集団の安定性が、ある戦略のエージェントが良い評判を得ている可能性に依存していることを示している。良い評判を持つ確率は、ドナーの行動だけでなく、評判流布の誤り率や、異なる評判信念を持つエージェントがどのように相互作用する可能性にも依存する。これが同類性（homophily）が集団の相互作用を変える方法である。

ランダムに相互作用する集団（h = 0）では、DISCエージェントが良い評判を持つ確率は次のようになる：

Gh=0 = (1 – e)[(1 – e)2 + e2] + e[2e(1 – e)] (3.5)

判断の社会規範を考えると、観察者と援助者が以下のいずれかを満たす場合、援助者DISCエージェントは良い評判を得る：

a) 受信者の評判に同意し、その評判が正しく伝達されるか、b) 受信者の評判に同意せず、その評判が誤って伝達される。

最初のケースでは、提供者と観察者が受信者の評判に同意する方法は2つある。両者が受信者に関する正しい情報(1 – e)2を持っているか、両者が誤った社会情報e2を持っているかである。良い評判は、人口の（1-e）分の1に広まる。第2のケースでは、提供者と観察者は確率[2e(1 – e)]で不一致となり、DISCエージェントは悪い評判を受ける。しかし、母集団のe 分の1 は、提供者が善であると誤って信じている。

同族的相互作用(h)を持つ集団では、DISCエージェントが良い評判を持つ確率は変化する。式3.5は次のようになる：

Gr = h(1 – e) + (1 – h)Gh=0

(3.6)

もしh = 0ならば、各寄付ゲームはランダムに選ばれたエージェントで行われるので、式3.6 = 式3.5となる。h = 1の完全な同類社会では、寄付者と観察者は常に同意するので、DISCエージェントは常に良い評判を得る。しかし、伝達には誤差があるため、集団の1 – e 分の1だけが、ドナーは善良であると信じる。したがって、Gr = 1 – eである。

ALLDエージェントが良い評判を受ける確率（Gd）は次のようになる：

Gd = (1 – e)[Pr(1 – Gr) + Pd(1 – Gd)] + e[Pr(Gr) + Pd(Gd)] である。

Gd = (1 – e)(1 – Gr) + eGr (3.7)

ALLDは常に欠陥があるため、オブザーバーが受信者を悪いと信じていれば、良い評価を受ける。もし受信者がDISCエージェントであれば、オブザーバーは確率(1 – Gr)でそのエージェントが悪いと考える。同様に、受信者がALLDの場合、オブザーバは確率(1-Gd)で否定的な評判を持つ。そして、観察者はこの良い評判を（1 – e）母集団に広める。さらに、もしオブザーバーがエージェントを良いと信じていれば、ALLDのドナーに悪い評判を与えるが、集団のe分の1は誤ってエージェントを良いと考える。しかし、侵入の仮定はPr≈1、Pd≈0なので、式はGd = (1 – e)(1 – Gr) + eGrに単純化される。

エージェントがALLDエージェントを良いと考える確率(Gd)は同類性によって変化しない。同族間相互作用では、ドナーとレシピエントがランダムに選ばれる。観察者はドナーと同意するように選ばれるが、ドナーのレシピエントに対する意見は、観察者のレシピエントに対する意見と同じ確率から選ばれる。しかし、式3.7はどのような同類性の値でも変わらないが、Grの計算は変わるので、その意味でGdは変化する。

【本文参照】

図3-4：ホモフィリーの値が異なる場合の式3.4のプロット。黒い部分はALLDが侵入すると予測される場所を示している。灰色の領域は、ある値の同相性において、DISCが侵入に対して安定している場所を示している。薄い灰色は、濃い灰色の部分集合である。例えば、h = 0.0のDISC安定領域はh = 0.2の部分集合である。同類的相互作用の頻度が高くなるにつれて、DISCはコミュニケーションにおけるエラーの頻度が高くなるにもかかわらず、侵入を避けることができる。

結果

Gr > bGdをプロットした図3-4は、モデルがDISCの安定性を予測する場所を示している。b-cの利益（b）とエラー率（e）のパラメータスイープがテストされた。黒い領域は、GがbGdとなり、ALLD侵攻がb-cで予測される場所を定義している。灰色の領域は、あるb-c hの値でGr > bGdとなるパラメータ位置、つまりDISC個体群が安定するパラメータ位置を示している。

図3-4はシミュレーション結果と一致している。図3-4の最も白い曲線は図3-2に匹敵し、最も濃い灰色（黒ではない）は図3-3(a)に匹敵する。ALLCが含まれ、進化がないにもかかわらず、解析モデルは同様のDISC安定性を予測している。

注目すべきは、シミュレーションによって、同族社会では協力がエラーに対してより頑健であることを示したことである。ここではその理由を示す。同族性は良いDISCの比率を良いALLDよりも高める（すなわちGr/Gd）。利益(b)、コスト(c)、エラー率(e)が一定であれば、hの値が大きいほど協力社会の頑健性が増す。一般に、コンピュータ・シミュレーションと分析的分析の両方が、同族社会が風評発信における誤りに対して協力を維持するのに役立つことを示している。

(a) DISC (b) VDISC

図3-5：検証的（VDISC）エージェントと社会的に偏った（DISC）エージェントの違い。提供者（D）は社会的に受け手（R）が善良であると知らされていたが、その情報が不正確であることを発見した。

(a) DISCエージェントは社会的情報に基づいて行動することを決定する。(b) VDISCのドナーは、否定的な規範的結果にもかかわらず、正確な情報に基づいて行動することを決定する。

3.6 モデル3：誤った社会的情報v.正しい個人的情報

3.6.1 シミュレーション

最後に、記述的情報と規範的情報の対立を紹介する。ここまでは、評判の誤りは意図せずランダムに広まると仮定してきた。しかし、評判が広まっている間に、ある個人が他のエージェントに関する社会的に獲得した評判（規範的）信念が誤りであることに気づくかもしれない。このような状況では、そのエージェントは評判信念を更新し、正確な（記述的な）情報に基づいて行動するのが得策なのだろうか。それとも、不正確な社会的情報に基づいて行動し続ける方が良いのだろうか？

もしv = 0であれば、寄付をするエージェントは、受益者に対して協力するか亡命するかを選択する際に、常に社会的に受け取った評判信念を採用することになる。モデル1と2では、vは暗黙的に0であった。ドナーエージェントは常に受領者の評判の信念に基づいて行動する。もしv = 1であれば、ドナーエージェントはレシピエントと相互作用する際に、正しく記述的な情報にアクセスし、それを利用することになる。これを行うために、ドナーに、もしエラーレートがなければレシピエントが獲得したであろう評判へのアクセスを与える。そうすることで、受信者は、誤りを犯しやすい噂話ではなく、その良し悪しで判断することができる。おそらく現実的ではないが（Fetchenhauer and Dunning (2010)やSigmund (2009)を参照）、このような情報を自由に入手できることの影響を理解するために、極限的なケースとしてテストする。無料であっても正しい情報を採用することがエージェントの最善の利益にならないのであれば、情報を得るためにコストを支払うことはないだろう。

ここで第4のエージェント戦略、検証的DISC（VDISC）を追加する。VDISCエージェントはDISCエージェントと同様に行動するが、VDISCエージェントが提供者であり、エージェントの受信者に対する評判信念が誤っている場合、VDISCは社会的に受け取った規範的知識ではなく、記述的知識に基づいて行動する。

図3-5はVDISC戦略とDISC戦略の違いを示している。図3-5(a)と図3-5(b)の両方において、提供者は被提供者が善良であることを社会的に知らされている。さらに、提供者はこの社会的に獲得された情報が誤りであることを学んだか、観察することができる。図3-5(a)は識別(DISC)エージェントの例だ。この新しい情報にもかかわらず、エージェントは社会的情報を使い続けている。図3-5(b)では、検証的識別エージェント(VDISC)が正確な情報を伝えている。

真実性の効果を分析するために、VDISCエージェントがDISCに侵略されるかどうかをテストする。そのため、初期集団はVDISCエージェントのみで構成される。突然変異により、Si∈｛ALLD, ALLC, DISC, V DISC｝の4つの戦略が集団に入る可能性がある。私たちはh({0, 0.5, 1})の3つの値で結果を観察した。

h > 0の条件では、同好のオブザーバを見つけることが、ドナーが評判信念を正しい情報にシフトするかどうかの決定に先行する。いったんドナーが選択されると、その観察者がドナーの受け手に対する評判信念に同意しない場合、ドナーと同意する新しい観察者が選択されるかもしれない（実験2の同類性の説明を参照）。このことから、次のような問いを提起することができる：通常、同意しているが誤りであることが判明するかもしれないエージェントと相互作用する場合、既知の真実に基づいて行動することに切り替えることに有用性があるのだろうか？

結果

図3-6は、同類性の値を変化させた500世代後のDISCとVDISCからなる集団の割合を示している。0世代では母集団全体がVDISCで構成されていたので、この図はh = 1またはh = 0.5のときにDISCが侵入することを示している（これはA.1.2のStanding規範とShunning規範では再現されるが、Image Scoringでは再現されない）。図3-6(a)と図3-6(b)は、完全な同類性(h = 1)が与えられた場合の結果を例示している。一般に、正しい情報に基づいて行動するエージェントは、社会的に収集された情報に基づいて行動するエージェントに侵略される。h=0.5の場合、DISC戦略は依然としてVDISCエージェントに侵入するが、その程度はより小さい（図3-6(c)と3-6(d)）。最後に、図3-6(e)と図3-6(f)は、相互作用が与えられた受信者の信念から完全に独立している環境（h = 0）では、VDISCはDISCに対して安定していることを示している。

3.6.2 VDISCの安定性：単純化された分析モデル

次に、DISCがいつVDISCの集団に侵入するかを理解するための分析的アプローチを採用する。私たちはALLCとALLDを考慮せず、戦略を考慮した2つの評判の相互作用に焦点を当てる。ほとんどの仮定はセクション3.5.2から変わっていない。各エージェントは良い評判でスタートし、良い評判を持つエージェントのパーセンテージはラウンド2までに均衡すると仮定する。母集団はほとんどがVDISCで、DISCは少なく、VDISCと相互作用する確率はほぼ1（Pv≈1）、DISCと出会う確率はほぼ0（Pr≈0）である。

図3-6：500世代後の戦略で構成される集団の割合。初期集団はVDISCSのみで構成されている。

DISCエージェントのフィットネス（πr）は次のように定義できる：

πr = b – c + 1 – w [b(PrGr + PvGr) – c(PrGr + PvGv)] (3.8)

最初のラウンドでは、各エージェントは正の評判を受けるので、DISC は利益を受け、かつ協力する。(b – c)。それ以降のラウンドでは、DISCエージェントは、それを良いと考えるDISCまたはVDISCと相互作用した場合に利益を受け取る、b(PrGr + PvGr)。GvとGrはそれぞれ、エージェントがVDISCとDISCを良いと考える確率である。さらに、DISCエージェントは、良いと考えるエージェントと相互作用する場合、c(PrGr + PvGv)のコストを支払う。

VDISCエージェントの適合度(πv)は以下の通り：

πv = b – c + 1 – w [b(PrGv + bPvGv) – c(PrGr + PvGv)] (3.9)

DISCと同様に、最初のラウンドでは、VDISCは利益を受け取り、かつ協力する(b – c)。それ以降のラウンドでは、VDISCは、それを良いと考えるエージェントに出会えば、利益を受け取る。VDISCは、自分が良いと考えるエージェントに出会えば、コストを支払って協力する。VDISCがDISCの侵略を撃退できるかどうかを検証するために、VDISCエージェントのフィットネスがDISCのフィットネスより大きい場合を分析する：

πv – πr > 0 (3.10)

Pv≒1、Pr≒0、w≒1と仮定するので、式3.10は次のように単純化される（詳細はA.4.2参照）：

Gv > Gr (3.11)

もしVDISCが良いとされる確率がDISCのそれよりも大きければ、VDISCの集団は安定している。次に、GvとGrの両方がエラー率(e)と同相性(h)の関数であることを示す。次に、VDISC集団の安定性に関する両者の相互作用を分析する。

ランダムな相互作用を持つ社会（h = 0）では、良いVDISCエージェントの割合は次のようになる：

Gh=0 = [Pv + Pr(1 – e)](1 – e) + (Pr(e))2 (3.12)

VDISCエージェントは、DISCエージェントと同様に、ドナーの評判についてオブザーバーと一致する場合、良い評判を受け取る。VDISCの提供者は常に正しい情報に切り替えるので、確率1 – eで観察者と同意する。さらに、VDISCが受信者になったとき、この良い評判は[Pv + Pr(1 – e)]によって正確に利用される。集団の（1 – e）分の1だけが正しい社会的情報を聞くが、すべてのVDISCは正しい評判を採用する。最後に、オブザーバーが誤っている場合、VDISCとオブザーバーは意見が対立し、VDISCは悪い評判を得る。しかし、VDISCが受信者になったとき、提供者が元の誤りを犯したDISCであれば、VDISCは利益を受ける。Pv≒1、Pr≒0と仮定するので、式は次のように単純化される：

Gh=0 = 1 – e (3.13)

同族性を加えると、VDISC受領者と相互作用するドナー・エージェントが受領者の財を考慮する確率は、次のようになる：

Gv = h(1 – e)[Pv + Pr(1 – e)] + (1 – h)Gh=0

(3.14)

同族的相互作用では、VDISCのドナーは、レシピエントの評判に関する同じ社会的情報を聞いたオブザーバーとマッチングされる。しかし、VDISCドナーはレシピエントの正しい評判を発見し、それを採用する。この評判は、ドナーによって確率[Pv + Pr(1 – e)]で採用される。正しい、良い評判は常にVDISCによって採用され、ゴシップによって正しい情報を聞いた場合はPr(1 – e)でDISCによって採用される。Pv≒1、Pr≒0と仮定すると、式は次のように単純化される：

Gv = h(1 – e) + (1 – h)(1 – e) (3.15)

ランダムに相互作用する集団（h = 0）内のDISCエージェントの場合、良い評判を持つ確率は次のようになる：

Gh=0 = [Pv + Pr(1 – e)][(1 – e)2 + e2] + Pre[2e(1 – e)] (3.16)

そして、エージェントは受信者として、（正しい情報に基づいて行動する）VDISCドナー、または正しい噂話を聞いたDISCドナー（[Pv + Pr(1 – e)]）と相互作用する。さらに、[2e(1 – e)]に同意しない観察者と相互作用する場合、それは良いとみなされる。侵襲の場合、これは次のように単純化される：

Gh=0 = (1 – e)2 + e2 (3.17)

同族性を加える：

Gr = h[Pv + Pr(1 – e)] + (1 – h)Gh=0

(3.18)

h = 0ならば、各寄付ゲームは無作為に選ばれたエージェントで行われるので、式3.18 = 式3.16となる. h = 1の完全同族社会では、寄付者と観察者は常に同意するので、DISCエージェントは常に良い評判を得る。しかし、伝達には誤差があるため

【本文参照】

図3-7：図3-7: 誤り率(e)と同相性(h)のパラメータスイープに対するG.のプロット。正の差は、VDISCの集団がDISCからの侵入に対して安定している位相空間を表す。負の差は侵入を示唆する。白はVDISCに対する強い選択を表す。薄い灰色はVDISCの選択が弱いことを表す。黒はDISCに対する強い選択を示す。ダークグレーはDISCの選択が弱いことを示す。薄い灰色と濃い灰色の間の境界は、VDISCとDISCのフィットネスが等しいところを示す。

Pv+Pr(1-e)集団の何分の一かは、ドナーが良いと考える。ここでも、Pv≈1、Pr≈0と仮定し、Gh=0を代入すると、良いDISCエージェントの割合は次のようになる：

Gr = h + (1 – h)[(1 – e)2 + e2] (3.19)

式3.11によれば、式3.15～式3.19＞0であれば、VDISC集団はDISCの侵入に対して安定：

h(1 – e) + (1 – h)(1 – e) – (h + (1 – h)[(1 – e)2 + e2]) > 0 (3.20)

結果

式をグラフ化した図3-7は、VDISCがDISCに対して安定である位相空間を表している。この図は、式3.11を式3.20によってeとhの関数に還元したものである。エラー率(e)と同相性(h)のパラメータ掃引にわたってプロットされている。正の差は、VDISCの集団がDISCからの侵入に対して安定していることを示す。負の差は侵入を示唆する。

薄いグレーと濃いグレーの間の曲線は、両方の戦略が同じように機能する場所を表す。

差が大きいほど選択が強いことを示すので、グラフは｜Gv – Gr｜< 0.05｜のところで区別している。

この結果は図3-6のシミュレーション結果を説明するもので、VDISCは同族的相互作用がない場合（h = 0）には侵入に対して安定だが、h = 0.5またはh = 1の場合には侵入される。同族性が高まるにつれて、VDISCは侵略を防ぐために、より忠実なコミュニケーションを必要とする。しかし、h ≥ 0.5の場合、コミュニケーションに誤差があるとDISCエージェントは有利になる。

私たちの単純な解析モデルは、集団がほぼ全てVDISCで構成されている場合にのみ、VDISCとDISCのフィットネスを比較していることに注意すべきである。シミュレーションは、より複雑で進化的な解を提供する。これは、DISCの頻度が増加し、ALLDやALLCエージェントと相互作用することによる影響を考慮している。シミュレーション結果（図3-6）において、VDISCとDISCの両方が、あるエラー率においてALLDエージェントに侵入されるのはこのためだ。

3.7 考察

私たちは3つの実験を行ったが、最初の2つはよく知られるようになってきた結果を示した。第一に、全体的な利益がコストを上回れば、協力は適応的である。第二に、価値観の同類性（homophily）を含む多くの種類の社会構造は、協力が栄える、あるいは固定化することができるコスト／便益比の範囲を拡大する。不当な評判は協力を脅かす可能性があり、先行研究では集団から偽の評判を除去する方法が模索されている（中丸・川田 2004）。本論文では、協力を脅かす偽の評判の割合を検証し、正しい情報を持つ者と誤った情報を持つ者の相互作用傾向を層別化することで、協力が増強されることを発見した。

しかし、3つ目の実験では真に斬新な結果が得られた。価値観の同類性が高まると、協力社会の頑健性が高まるだけでなく、逆説的だが、正しい情報が自由に利用できる場合でも、誤りを犯しやすい社会的情報を採用する選択的圧力が高まる。規範的圧力が高まると、協力は強化されるが、その結果、適合への圧力が高まり、記述的情報の相対的有用性が低下する。価値の同類性がない場合、他者の戦略に関する記述的（真実的）情報が優位に立つ。しかし、価値の同類性が配備されている場合、規範への適合は、少なくともこれらの単純なエージェントの文脈では、真実に基づいて行動するよりも適応的である。

3.7.1 ゴシップ

ゴシップは人間に広く浸透しているが（Dessalles, 2007）、同時に広く軽蔑されてもいる。中世ヨーロッパではゴシップは焼き捨てられ（Emler, 1990）、特に女性はそれを避けるために抑圧されてきた（Funder, 1995; Gilmore, 1978）。ゴシップはしばしば虚偽であり、陰謀的であり、検証不可能であり、悪意がある。しかし、ゴシップが人間の行動に広く影響を与えていることを示す証拠もある（Ellwardt et al.） さらに、経験則に基づく研究によると、ゴシップの多くは真実でポジティブなものに焦点を当てており（Ellwardt et al., 2012; Herrmann et al., 2012; Ingram and Bering, 2010; Sommerfeld et al., 2008）、今回報告されたものを含む理論的な結果は、個人が交流する相手を選択できるようにする情報を広めるために有益であり得ることを示している（Giardini and Conte, 2012; Mitchell et al.）私たちの結果は、ゴシップの否定的な能力とその蔓延する存在との間の一見矛盾を解決する一つの方法を示唆している。誤ったゴシップの対象である個人に対して時折不公平な行動をとることは、全体として利益をもたらすのである。

【本文参照】

図3-8: 実験3の結果と協力の比較。各線は、利益／コストを4.5としたときの協力行動の割合を示している。同族社会では、真実の情報の代わりに社会的情報を用いるエージェントは、抽象化された文化的バイアスなしに相互作用する真実のエージェント（h = 0）と同様に協力を維持する。

GiardiniとConte (2012)は、ゴシップは必ずしも正確な記述的情報を伝達するわけではないが、記述的情報であると他者が信じるもの（みなしメタ評価）を伝達する可能性が高いとしている。寄付ゲームの人間実験において、Sommerfeldら(2008)は、ゴシップ（すなわち、被援助者の評判）が、記述的情報（すなわち、被援助者の行動履歴）よりも、寄付者が協力するか離反するかの意思決定のより良い予測因子であることを実証した。彼らは、個人が「地元グループの世論から逸脱しないように自分の行動を調整するかもしれない、彼らは目立ちたくないのだ」と仮定している（Sommerfeld et al.）すなわち、メタ評価は記述的情報であり、ゴシップに埋め込まれた規範的圧力が評判の記述的情報の有用性を凌駕する可能性があるため、考慮されるべきであるということである。

3.7.2 協力

DISCがVDISCに侵入するのは同族性が高いレベルであることを示したが、2つの戦略が協力に及ぼす影響については議論しなかった。図3-8は実験3の各条件における協力行動の割合を示している。h = 0のとき、VDISCエージェントはh = 1のときDISCエージェントと同じように効果的にエラーに対して協力を維持する。これは、どちらの条件においても、VDISCは記述的な（真実の）情報を利用し、DISCは誤りを犯しやすいゴシップを利用しているにもかかわらずである。

同族性（正しい情報を無視するエージェントを育てる）によって協力の頑健性を生み出すよりも、社会は正しい情報を採用するランダムに相互作用するエージェントを育てる可能性が示唆される。これは事実だが、自然界では情報の正しさは一般的に高い代償を伴うと考えられる。私たちのモデルでは、正確な情報をコストなしで提供したが、これはDISCがこのような非現実的な極端な状況でも侵入することを説明するためだ。私たちは、自然界においてコストのかからない記述情報が実現可能だとは考えていない。これとは対照的に、リアルワールドでは価値の同類性を示す重要な証拠がある（Adamic et al., 2003; Curry and Dunbar, 2013; Fiore and Donath, 2005; Kandel, 1978; McPherson et al.）私たちの結果は、協力行動を生み出す上で、またより一般的には新規適応形質を利用し発展させる上で、同類性の有用性を示す証拠の蓄積に貢献するものである（Dieckmann and Doebeli, 1999; Panhuis et al.）

さらに、個人的に収集された情報は、社会的に収集された知識よりもノイズが少ないかもしれないが、エラーがないわけではない。私たちのモデルでは、個人情報は常に真実であり、したがって個人情報を利用するエージェントは実現不可能な利益を与えられる。ここでも、これは限定的なケースとして採用された。もしこの制約が解除され、個人的に収集された情報の誤差がモデルに含まれた場合、記述的に偏ったエージェントのフィットネスが低下する可能性がある。協力に関しては、理論的には同じように効果的な2つの戦略を示したが、実際にもっともらしいのは1つだけだ。

3.7.3 集団内と間接的互恵性

人間はグループ内外の個人を区別して扱う傾向がある。近年、間接互恵性研究は集団内バイアスを研究し始めている（Nakamura and Masuda, 2012; Masuda, 2012; Jusup et al., 2014; Matsuo et al.）私たちのモデルと現在の文献との間には2つの大きな違いがある。第一に、既存のモデルはあらかじめ定義されたグループ構造を前提としている。第二に、前述したように、グループ内ダイナミクスは、ドナーとオブザーバーではなく、ドナーとレシピエントが同じグループ内にいる可能性によって定義される。この2つの結果について、順番に考察する。

Nakamura and Masuda (2012)は、エージェントの各グループが他のエージェントの評判に同意するようなグループ構造を仮定している。中村・増田(2012)は、集団内の強い好意主義を発展させるには、この規範と「判断規範」があれば十分であることを示している。私たちのモデルと同様に、グループ内の個人は、エージェントの評判について常に合意している。そのため、グループメンバーが相互作用すると（たとえ合意された評判に誤りがあったとしても）、DISCエージェントは良い評判を受ける。このため、グループ内のメンバーは、グループ外のエージェントに比べて、互いにより高い割合の良い評判を持つことになり、グループ内の好意とみなされる。

このモデルは集団構造を前提としていない。同類社会では、あるエージェントがエージェントAを善であると信じている場合、エージェントAを善であると信じている他のエージェントと相互作用する。その後、悪い受け手であるエージェントBに出会えば、エージェントBが悪いと信じている集団の全く異なる部分集合によって観察されることになる。私たちのモデルでは、あるエージェントがすべての情報を共有するエージェントの部分集合は存在しない。これは、セクション3.5で示した移動性の高いエージェントのアナロジーのように考えることができる。エージェントは相互作用するグループを持たないが、あるエージェントと相互作用するとき、流浪するエージェントに受信者の評判を知らせたエージェントによって観察される。

このモデルと他の文献との2つ目の違いは、グループ内行動が提供者と受信者の関係によって定義されることである。私たちのモデルでは、受領者は常にランダムに選ばれ、合意するのは提供者と観察者である。A.3では、ホモフィリーをa)ドナーとレシピエント、またはb)オブザーバーとレシピエントの間の一致と定義した場合の社会への反響を分析する。いずれの場合も、再定義された同類性は、協力に利益をもたらさないし、妨げもしない。このような違いを考慮すると、ある個人がグループの評判が間違っていることを知り、正しい評判に切り替えようとした場合、Nakamura and Masuda (2012)のモデルにどのような結果がもたらされるかを見ることは興味深いと考えられる。

3.7.4 自己欺瞞

真実を伝えないことで協力が得られる社会は、悲惨な世界のように思える。しかし、自然界でこのようなことが実際にあるだろうか？集団とアライメントをとるために、個人が故意に偽りを伝えているのだろうか？私たちのモデルは、エージェントの意図性については不可知論である。重要なのは行動（つまり規範的な情報にアライメントすること）であり、欺く意図があるかどうかではない。von Hippel and Trivers (2011a)は、意図的な欺瞞は認知的な負荷が高く、そのコストを軽減するために自己欺瞞が進化した可能性があると論じている。自己欺瞞を可能にする、自然に観察される2つのメカニズムは、(i.)確証バイアスと(ii.)集団思考である。

確証バイアスは、個人が既存の信念に忠実であるように情報収集にバイアスをかける現象である（Nickerson、1998;Jonas et al., s01;Schulz-Hardt et al., t00）。私たちのモデルのように、正しい情報を採用することが有益でない場合、エージェントは真実を学ぼうとせず、正しい情報を所有することで生じる葛藤に直面することはない。第二に、自分が他者を欺いていることを知らなければ、他者を欺くことが容易になるのであれば（Trivers, 1991）、エージェントはある知識に明示的にアクセスしない方がよいかもしれない、つまり、たとえ「無意識的」に知識を獲得しているとしても、その知識に基づいて行動することはできないはずである（Bryson, 2009）。これは、集団の中にいると個人の情報処理方法に偏りが生じるという集団思考（Groupthink）の現象と関連しているように思われる（Janis, 1971; Turner and Pratkanis, 1998）。集団の文脈では、個人は自分が持っている情報や、集団の影響を受けなければ展開したであろう意見に気づかないかもしれない（Janis, 1972; Be´nabou, 2013）。他人を欺くことは有利に働く可能性があるが、発見された場合のコストは高いと思われる。正確な情報の方が不正確な情報よりも性能が悪く、欺くことにコストがかかるのであれば、エージェントはそもそも情報を取得しない（確証バイアスなど）、あるいは行動文脈によっては情報にアクセスできない（集団思考など）ために、何らかのコストを支払っても構わないというところで均衡が保たれるかもしれない。

3.7.5 正しい情報が無視される決定的な原因

最後に、この単純なモデルと自然界との相関関係は明らかに推測の域を出ない。しかし、寄付ゲームは、評判の広がりを介した協力の進化に関する存在証明として用いられてきた（Nowak and Sigmund, 1998）。私たちは、この単純なモデルに1つの追加制約（すなわち価値同相性）を加えることで、自然界で見られる現象が生じることを示す。ある個人が他の人に寄付をするかどうかのばらつきは、寄付を受けた人の過去の行動を正確に記録するよりも、誤りを犯しやすい評判を用いることで説明できる（Sommerfeld et al., 2008）。少なくとも、このモデルによって、自然界で目撃される。現象を引き起こすために必要な変数に対する洞察が深まると考えられる。

3.8 結論

社会レベルの協力を維持するために寄付ゲームを用いる際の同族性と誤情報の役割について、私たちは2つの主張を行う。第一に、同族性を高めると協力が促進される。情報が高い確率で誤って伝達される場合でも、社会的情報は協力を維持しやすくなる。第二に、もし社会が同類性を採用しているならば、正確さか集団の一致かの選択に直面したとき、個人の利益は後者を優先することになる。したがって、全体的な結論としては、社会規範が協力を達成する場合、記述的な虚偽性を知っているにもかかわらず、不正確な規範的に獲得された情報を維持することが有利であり、進化する傾向があるという文脈（同族社会など）が存在するということである。

4　インパクトバイアスの進化：ノイズの多い環境における意思決定のための感情予測の最適化

神が…であると賭けることの利益と損失を天秤にかけてみよう。得をすれば、すべてを得る;

損をすれば、何も失うことはない。ならば、躊躇することなく、神がおられることに賭けよう。

ブレーズ・パスカル『パンセ』

恋をするとき、人はいつも自分を欺くことから始まり、他人を欺くことで終わる。

オスカー・ワイルド『ドリアン・グレイの絵』

4.1 まとめ

ある出来事の前に、人間はその出来事の後に自分がどう感じるかを系統的に予測できない。実際の感情体験に比べてより強い感情を予測するが、これはインパクトバイアスとして知られる現象である。さらに、このような失敗を経験した後では、感情予測を改善することを学ばないことが多い。

予測に役立つ正確な社会的助言を得る機会が与えられても、自分の誤った予測に頼りたがることが多い。ここで、私たちは可能な説明を提供する。私たちは、インパクトバイアスがノイズの多い環境における意思決定の最適化に適応的であることを示す。この結果は、過去の経験や社会的助言から学習しない場合にも当てはまる。最後に、私たちの簡潔な説明が重要な経験データを説明できることを示す。

4.2 はじめに

人は予期される経験に対して自分がどう感じるかを系統的に正確に予測できない、という確かな証拠がある。出来事の前に、人は実際の感情体験と比較して、肯定的な出来事の場合はより幸福になり、否定的な出来事の場合はより不幸になると予測する（Wilson and Gilbert, 2013; Wilson et al., 2000; Schkade and Kahneman, 1998; Wilson et al., 2003a; Wilson and Gilbert, 2003; Gilbert et al., 1998）。これはインパクト・バイアスと呼ばれている（Gilbert et al., 2002）。人間関係（Eastwick et al., 2008）、スポーツの結果（Wilson et al., 2000）、人生の満足度（Schkade and Kahneman、1998）、政治（Gilbert et al., 1998）の各分野において、個人は実際の経験と比較して、高いほうを予測し、低いほうを予測することが示されている。個人は自分の感情的反応を予測できないだけでなく、予測の誤りから学ぶこともないようである（Meyvis et al., 2010; Lacey et al., 2006; Scheibe et al.）さらに、個人は自分の予測誤差を最小化するために社会的助言を求めず、正確な社会的助言を提供されても、しばしば自分の不正確な予測を採用する（Gilbert et al.）一見すると、感情体験を正しく予測できないことは有害に見えるが、インパクト・バイアスが偏在していることから、最近、このバイアスが何らかの機能を果たしているかどうかを発見することが求められている（Miloyan and Suddendorf, 2015）。

なぜ私たちは一貫して、大げさに自分の感情体験の予測にバイアスをかけるのだろうか？最近の研究では、インパクトバイアスが意欲を高めることが実証されている（Morewedge and Buechel, 2013）。しかし、不正確な感情予測に基づいて行動すると、最適な意思決定ができなくなるはずだ（Gilbert and Wilson, 2009; Loewenstein, 2007; Mellers, 2000; Gilbert and Ebert, 2002）。可能であれば、過去の誤った予測から学ぶか、あるいはそれを除けば、先人の助言に耳を傾ける方が有利ではないだろうか。

個人が以前の感情的誤りから学ばない理由については、多くの仮説が立てられている（McConnell et al., 2011; Gilbert et al., 2004; Hoerger et al., 2009; Hsee and Zhang, 2004; Kahneman and Sugden, 2005）。これらのほとんどは、インパクト・バイアスは有害であり、偏った記憶（Morewedge他 2005;Fredrickson他、1993）、現在の焦点の過度の強調（焦点主義バイアス、Schkade and Kahneman、1998;Strack他、1988;Gilbert他、1998;Kahneman他 2006）、将来の出来事の想像の限界（Kushlev and Dunn、2012;Gilbert and Wilson 2009）など、人間の認知の失敗によって引き起こされると仮定している。これらはバイアスの近接メカニズムを説明するが、バイアスが最終的にどのように自然淘汰を生き延びたかは説明しない。意外なことに、衝撃バイアスがなぜ有益なのかについての説明はほとんどなされていない（Miloyan and Suddendorf, 2015; Marroqu´ın et al.）

ここでは、インパクト・バイアスに関する究極の説明を提示する。インパクト・バイアスの選択圧を発生させるために必要なのは、ノイズの多い環境だけであることを実証する。私たちはエラー管理理論（Johnson et al., 2013; Haselton and Nettle, 2006）の研究を拡張し、進化はエラーの量とは対照的に、期待される全体的なコストを最小化すると主張している（McKay et al., 2009）。私たちは、ノイズの多い環境では、感情予測を誇張することが最適であることを示す。次に、感情予測を誇張することで利益がある場合、過去の感情経験から予測を更新しようとしたり、正確な社会的アドバイスに耳を傾けたりすると、個人のパフォーマンスが低下する可能性があることを示す。最後に、このモデルがこれまでのモデルよりも多くの実験的証拠を説明できることを議論する（総論参照）。

4.3 背景

4.3.1 インパクト・バイアスの動機づけ力

インパクト・バイアスが適応的な役割を果たしているかどうかを分析する前に、まずインパクト・バイアスが行動を調整する役割を果たしているかどうかを問うべきである。もし個人が将来の感情体験にバイアスをかけるが、不正確な予測に基づいて行動しないのであれば、インパクト・バイアスは無害である。興味深いことに、感情予測が動機づけの力を持つだけでなく、インパクト・バイアスが実際に健康的な選択につながる可能性があることを示す証拠もある。

個人は、感情予測が高まるにつれて、タスクの達成により多くの努力を傾けるようになる（Morewedge and Buechel, 2013; Greitemeyer, 2009）。不可能な課題を与えられたとき、無駄な行為に固執することは、感情予測が高くなることと関連している（Greitemeyer et al.）さらに、不正確な感情予測は意欲を高める可能性がある。参加者に2つの課題から1つを選択するよう求めると、選択した課題に対するインパクト・バイアスが増加する（Morewedge and Buechel, 2013）。

興味深いことに、インパクトバイアスは実際に健康的な行動を動機付ける可能性がある。世界と関わる意欲の低下は、インパクト・バイアスと逆相関している。将来の感情体験の楽しさを正確に予測すること（すなわちインパクト・バイアスの減少）は、自殺企図や逃避妄想と相関している（Marroqu´ın et al.）さらに、活動が否定的な価である場合、インパクトバイアスは行動を抑制するようだ。ある行動の否定的な結果を誇張的に予測すると、その行動を行う可能性が低くなる。問題ギャンブラーはインパクト・バイアスを示さず、負けた後の気分の悪さを正確に予測する(Willner-Reid et al., 2012)。

重要なことは、バイアスがより健康的な行動につながるというこの証拠にもかかわらず、インパクト・バイアスが有害であることがわかることである。個人は、運動は実際よりも楽しくないものだと予測している。インパクト・バイアスを減らすと、運動意向が高まる(Ruby et al., 2011)。大腸内視鏡検査を受けない最も顕著な理由の一つは、痛みへの恐怖である。(Janz et al., 2007; Dillard et al., 2010)。痛みに対する誇張された予測のために、癌について無知でいることは明らかに有害である。さらに、ある状況が失敗する運命にあるとわかっている場合、感情予測が大きいと、それにもかかわらず行動を実りなく続けることになる（Greitemeyer et al.）インパクト・バイアスが少なくともいくつかの望ましくない行動を動機づけると考えられることから、インパクト・バイアスがどのようなときに利益をもたらすのか、また、どのようなときに排除したほうがよいのかを明らかにすることが不可欠になる。

4.3.2 学習に対する頑健性

失敗から学ぶことによってインパクト・バイアスを修正することができれば、インパクト・バイアスに驚くことはなくなるだろう。しかし、このバイアスは経験的学習に対しては頑健であるようだ（Meyvis et al., 2010; Lacey et al., 2006; Scheibe et al.） 一般に、私たちは自分の予測の誤りに気づかないため、自分が犯していることに気づかない過ちから学ぶことが難しくなる（Kahneman, 2011）。ジェリービーンズの楽しさを予測するとき、被験者は試行が失敗しても一貫して予測を更新しない。参加者は、自分の誤りを知らされて初めて予測を修正する（Novemsky and Ratner, 2003）。しかし、彼らはまだ他の偏った評価、例えばジェリービーンズから音楽にレッスンを一般化しない。Meyvisら(2010)は、様々な文脈において、個人が自分の予測の正確さを誤って記憶し、客観的にそうであった場合よりも正確に予測したと信じていることを実証した。この誤った記憶は、以前の間違いから学ぶことを難しくし、インパクトバイアスの持続と相関していた(Meyvis et al., 2010)。

経験から学ばないだけでなく、他人の話にも耳を傾けない。人類が社会的情報を利用していることは広く浸透しており、その進化的重要性を暗黙のうちに裏付けている（Boyd and Richerson, 1985; Rendell et al., 2010）。社会的情報の有用性は明らかで、個人的な経験によって情報を得ることは、悪く言えば危険であり、良く言えば時間がかかるが、社会的情報は同種の生物間で素早く伝達することができる（Ferna´ndez-Juricicic and Kacelnik, 2004; King and Cowlishaw, 2007; Magurran and Higham, 1988）。実際、人間は社会的情報が間違っている場合でも、それを採用する方向に偏っているようだ（Whiten et al., 2009; Sommerfeld et al., 2008; Rauwolf et al., 2015）。しかし興味深いのは、多くの文脈で個人が社会的情報に偏り、不正確な社会的情報を適用する一方で、感情予測の領域では正確な社会的情報を利用することを拒否することが多いということである。

Gilbertら(2009)では、参加者はスピードデートの楽しさを予測する課題を課された。(i)デート相手の資料、(ii)デート相手に会ったことのある別の人の感情経験である。参加者がデートに出かけた後、元の社会的助言の方が、彼らの予測と比較して、彼ら自身の経験の有意に良い予測因子であったにもかかわらず、大多数は資料を要求した（Gilbert et al.）さらに、社会的助言と差し迫った経験に関する情報の両方が与えられた場合、個人は依然として、自分の不正確な個人的信念に予測を大幅に偏らせる(Guarnaccia, 2012)。もし人間が一般的に社会的情報を利用する傾向があるのなら、なぜ感情予測の領域では、一貫して偏った個人的予測の代わりに、正確な社会的情報を無視するのだろうか？

4.3.3 近接的説明

インパクトバイアスを維持する近接メカニズムについては、かなりの研究がなされている。（McConnellら, 2011; Gilbert and Wilson, 2009; Kahnemanら, 1997; Gilbertら, 2004; Hoergerら, 2009; Hsee and Zhang, 2004; Kahneman and Sugden, 2005）。バイアスは、近視眼的焦点（Schkade and Kahneman, 1998; Strack et al., 1988; Gilbert et al., 1998; Kahneman et al., 2006）や偏った記憶（Morewedge et al., 2005; Fredrickson et al., 1993）などのメカニズムによって生成されるようであるため、インパクト・バイアスは最適以下の意思決定を生成し、可能であれば規制されるべきであると考えることは容易であった（Feys and Anseel, 2015; Peters et al., 2014）。しかし、インパクト・バイアスに有用性があるとすれば、バイアスを生み出し維持するために進化したメカニズムは、まさに偏った記憶や近視眼的な焦点の傾向のように見えるかもしれない。

個人がインパクト・バイアスを示すのは、近視眼的に意思決定の結果に注目するときである。例えば、サッカーチームが勝利したときの幸福感を予測するとき、個人は洗濯物など生活の他の側面を忘れてしまう;その結果、サッカーの勝利の影響を誇張してしまう（Wilson et al.）生活における他の要因を思い出させることで、バイアスを軽減または除去することができる（Schkade and Kahneman, 1998; Buehler and McFarland, 2001; Hoerger et al.）日常生活について日記をつけていれば、感情予測の偏りは少なくなる（Wilson et al.）

時間が経っても予測を改善することを学ばない理由については、近接的な理由も仮説として唱えられている。そのような仮説のひとつは、記憶のバイアスに責任があるとするものである。過去の出来事の記憶は、非典型的な経験（Morewedge et al., e05）や最近の経験（Fredrickson et al., n93）に偏っていることがわかっている。経験を間違って記憶してしまうと、予測誤差を修正することが難しくなる（Kahneman et al., 1997）。さらに、将来の状態を想像するとき、最も典型的な記憶ではなく、最も利用可能な記憶を採用する（Gilbert and Wilson, 2009）。したがって、最も記憶に残る経験に基づいて予測を立て、その記憶が外れた経験に偏っていれば、予測が誇張されるのは当然である。

このような研究は、インパクト・バイアスを生み出すメカニズム（近接メカニズム）を解明する一方で、バイアスがどのように進化を生き延びてきたかを語るものではない。インパクト・バイアスは、平凡な活動を思い出させることで減衰させることができるが、このような研究は、バイアスをいつ淘汰するのが最善なのかについては考慮していない。前述のように、インパクト・バイアスは健全な行動（Marroquın et al. したがって、インパクトバイアスが有害であると先験的に推定するのは危険かもしれない。重要な未解決の問題は、バイアスが全体的な機能的有用性をもたらすかどうかである。

4.3.4 インパクト・バイアスは選択的な利点をもたらすか？

インパクト・バイアスの広範性と動機づけの力を考えると、インパクト・バイアスが機能を果たすかどうかを検討した研究は驚くほど少ない（Miloyan and Suddendorf, 2015; Marroqu´ın et al.）私たちの知る限り、Robson and Samuelson (2011)は、インパクト・バイアスが自然淘汰を生き延びた理由を説明する唯一の進化モデルを提示している。これは、快楽的適応（Perez-Truglia, 2012; Graham and Oswald, 2010; Rayo and Becker, 2007）を説明しようとするモデルの一群を拡張することで実現している。

快楽順応とは、時間が経つにつれて感情が平均値に回帰する傾向のことである（Frederick and Loewenstein, 1999）。例えば、宝くじに当選した2年後の人は、金銭的な恩恵にあずかる前と同程度に幸せである（Brickman et al., n78）。ヘドニック適応はかなり広く浸透しているが、人生の出来事に適応するかどうかは、文脈によって大きく左右されるようだ。例えば、昇給（Tella et al., 2010）や寡婦化（Clark et al., 2008）にはすぐに適応するが、失業（Clark et al., 2008）や交通騒音（Weinstein, 1982）には適応しない。

個人の感情経験の予測が不正確であると思われる理由の1つは、予測時に快楽的適応を補正しないためである（Gilbert et al., 1998; Ubel et al., 2005; Nelson and Meyvis, 2008）。これに関連して、インパクトバイアスの強さは、個人の対処メカニズムの成否と相関しているという証拠がある（Gilbert et al.）個人は、自分がどの程度うまく対処できるかを補償しないため、対処メカニズムが改善されると、インパクトバイアスが大きくなる。

RobsonとSamuelson(2011)は、このような快楽的適応の無知が、インパクト・バイアスに対する選択圧につながる可能性があると論じている。もし(i)感情の強さ、(ii)同じような効用を持つ目標状態を区別する能力に生理的な限界があるならば、将来の経験に対する無知は適応的でありうる。RobsonとSamuelson(2011)が提示した議論の直感は、インパクト・バイアスを示す個人は行動の効用を正しく予測しているが、行動を起こした後、個人の感情体験はすぐに別の目標に適応するというものである。

しかし、この説明には潜在的な問題がある。コーピングとヘドニック適応の無視はインパクト・バイアスと相関しているが、どちらのメカニズムも時間がかかるのに対し、インパクト・バイアスは出来事直後に現れる（Wilson and Gilbert, 2013、ただしLevine et al.） Gilbert et al. (1998)では、対処能力を実験的に操作し、(i)出来事直後と(ii)10分後の両方で、感情予測と感情経験を比較測定した。出来事から10分後、対処が容易なグループは対処が困難なグループよりも快楽的に適応していた。どちらのグループも10分後には対処すると予測していなかったため、予測と経験の差（すなわちインパクトバイアス）は対処グループの方が大きかった。しかし、出来事の直後には、両群の感情体験に測定可能な差はなかった-対処と快楽的適応はまだ起こっていなかったのである。興味深いことに、インパクトバイアスは依然としてはっきりと存在していた。対処メカニズムに関係なく、出来事直後、個人は依然として自分の感情体験を正しく予測していなかった（Wilson and Gilbert, 2013）。

RobsonとSamuelson(2011)は、インパクト・バイアスの機能を説明するのにある程度の距離を置いたが、まだやるべきことはたくさんある。快楽順応とコーピングは実験結果の一部を説明できるかもしれないが、情動体験の直後にインパクト・バイアスが存在する理由を説明することはできない。さらに、インパクト・バイアスに関しては、まだ説明されていない個人差がある。

4.3.5 個人差

インパクト・バイアスに関する個人差のデータはかなり新しいものである（Wenze et al.）しかし、インパクト・バイアスの機能を説明する試みは、個人差を説明することを試みるべきである。対処メカニズムだけでなく、インパクト・バイアスの大きさには、(i)出来事の重要性の認識、(ii)情動的知性という2つの要因が関連しているようだ。

インパクト・バイアスの大きさは、出来事の重要性の認知度と相関しており、期待される感情が強ければ強いほど、感情予測と経験の誤差が大きくなる。恋愛関係が楽しければ楽しいほど、別れの痛みを考慮したときのインパクト・バイアスは大きくなる（Eastwick et al.）さらに、選挙の重要性の認知度は、バイアスの大きさと相関する（Hoerger et al.）この傾向は、イベントの重要性を実験的に操作した場合でも維持される（Greitemeyer, 2009）。

第二の要因は、情動的知性がインパクトバイアスと逆相関していることである。自分の感情をよりよく感じ取ることができれば、インパクト・バイアスはより少なくなる(Hoerger et al., 2012)。Dunnら(2007)は、インパクト・バイアスは、感情の知覚、思考を促進するための感情の利用、感情の理解、感情の管理など、情動知能のいくつかの特徴と逆相関することを示した。さらに、マインドフルネスの一側面である、感情と外生的事象との相互作用の理解は、インパクト・バイアスと関連している（Emanuel et al.）

本稿では、インパクト・バイアスの進化的な利点を説明するだけでなく、なぜインパクト・バイアスが出来事の激しさと相関し、エモーショナル・インテリジェンスと逆相関するのかも説明する。そのために、エラー管理理論に関する文献を拡張する。ノイズの多い環境で意思決定する場合、インパクト・バイアスは適応的であると主張する。

4.3.6 エラー管理理論

エラー管理理論（EMT）は、さまざまな行動が非対称な利益/コストにつながるノイズの多い環境では、意思決定時に情報にバイアスをかけることが最適になりうると予測している（Johnson et al.）この基本的な考え方は、McKayら(2009)の例でよく説明できる。完璧な煙探知機を作ることが不可能な場合、用心するに越したことはない。火災が発生していないのに警報を鳴らすのは迷惑だが、火災が発生しているのに警報を鳴らさないのは致命的だ。したがって、感知器を高感度に偏らせた方が有利なのである。その結果、エラーは増えるが、死は減るが迷惑は増えるという低いコストを支払うことになる。

EMTは主に、予測不可能な環境では、ある事象が発生する確率に偏りを持たせた方が有利であることを主張するために使われてきた。一般的に、人間は平均的な人と比べて、ポジティブな出来事に遭遇する可能性が高く、ネガティブな出来事に直面する可能性は低いと予測し、経験の可能性に関する予測を偏らせる傾向がある（Alicke et al., 1995）。私たちは、他の人と比べて自分は運転が上手で（DeJoy, 1989; Dalziel and Job, 1997）、離婚の可能性が低く（Weinstein, 1980）、長生きすると信じている（Weinstein, 1980, 素晴らしいレビューはSharot et al.） EMTは、予測不可能な世界では、ノイズの多い環境を補正することで、このようなバイアスを最適化できることを示している（Haselton and Nettle, 2006; McKay et al.）さらにEMTは、偏った確率的思考が、不安（Bateson et al., 2011）、神への信仰（Johnson, 2009）、性的魅力の認知（Haselton and Buss, 2000）、病気の可能性のある人に対する社会的排斥（Kurzban and Leary, 2001）に関連する人間の行動をどのように説明するかを説明するために使われてきた。

本稿では、エラー管理理論が、人がある出来事の発生可能性を誇張する理由（楽観バイアスなど）だけでなく、ある行動に対して予測される報酬を誇張する理由（インパクト・バイアスなど）を説明する可能性があると考える。EMTは、ノイズのもとで意思決定を行う際に情報を誇張することが有益であることを示しているが、事象の可能性を誇張することが最善なのか、行動の報酬に対する確信を誇張することが最善なのかについては不可知論である。ある出来事が起こる確率を誇張することは行動を動機付けるはずだが、行動の報酬を誇張することも同じだ。

図4-1：エージェントはa1またはa2を選択し、ある確率（p1またはp2）で成功し、[-1, 1]の範囲の利益（b1またはb2）を受け取る。失敗した場合は、コストcを支払う。

しかし、EMTが楽観主義やインパクト・バイアス（McKay and Efferson, 2010）のような認知バイアスにつながるかどうかについては、議論がある。Trimmerら(2011)は、ある事象の発生確率を学習しようとするときに、バイアスを加えることが有利かどうかを分析した。彼らは、確率を学習しようとするときに行使されるアルゴリズムに依存することを示した。しかし、このような研究は、時間をかけて静的な確率を学習しようとすることに焦点を当てている。自然界では、事象の発生確率自体が確率的である場合がある。ある事象が、ある状況では0.3の確率で発生しても、別の状況では0.4の確率で発生する。意思決定に関する進化モデルに静的確率を用いるという前提は、最近批判を浴びている（Fawcett et al.）

本稿では、この制約を是正すると同時に、静的確率を学習する際にバイアスが必ずしも有利ではないという事実を回避する（Trimmer et al.）私たちのモデルでは、ラウンドごとに、タスクに成功する確率が新たに生成される。この意味で、環境は予測可能ではなく、より自然である。

次の2つのセクションでは、EMTに関する研究をインパクト・バイアスに拡張する。インパクト・バイアスがノイズの多い環境でどのように適応的であるかを分析する。さらに、過去の感情体験から学習しない方がよい理由を示す。最後に、このモデルの予測が個人差のデータと一致することを示し、インパクト・バイアスはノイズ下での意思決定を補強するために少なくとも部分的には進化したのではないかという仮説の信憑性を示す。

4.4 研究1：ノイズ環境における最適意思決定

4.4.1 モデル1a：予測可能な環境

インパクトバイアスが適応可能かどうかを分析するために、エージェントベースの進化的アプローチを用いる。個体が2つの行動のどちらを取るかを、その行動の利益を予測しながら決めなければならない状況をシミュレートする。そして、感情予測を誇張することが有利な文脈があるかどうかを分析する。まず、各エージェントが自然に対して複数ラウンドのゲームを行うエージェントの集団から始める。

各ラウンドにおいて、エージェントは行動1（a1）と行動2（a2）の2つの行動を選択しなければならない。行動を選択した後、エージェントはタスクに成功するか失敗するかのどちらかを選ぶ。選択する前に、各エージェントは選択されたアクションを達成する確率（[0, 1]の範囲でp1とp2）を与えられる。もしエージェントが行動を選択して成功すれば、エージェントの適性値に何らかの利益（[-1, 1]の範囲でb1またはb2）が加えられる。そうでない場合、エージェントは重いコストc = -2を支払う（図4-1参照）。

意思決定に使用される情報は、意思決定効用と呼ばれる。(Kahneman et al., 1997)。最適な意思決定効用は、次のような場合にa1を選択する：

p1b1 + (1 – p1)c ≥ p2b2 + (1 – p2)c (4.1)

各ゲームにおいて、エージェントはp1、p2、c、b2を与えられるが、b1は与えられない。各エージェントは、b1の利益に対する信念を表す1つの遺伝子からなり、b′1として表される。a1に成功したときの実際の利益はエージェントには隠されているので、各エージェントはb1に対する信念（b′1）を決定効用の一部として用いる。すなわち、エージェントは以下の場合にa1を選択する：

p1b′1 + (1 – p1)c ≥ p2b2 + (1 – p2)c (4.2)

各ラウンドで新しいp1、p2、b2が選択される。母集団はN = 3000のエージェントからなり、g = 2000の各世代で各エージェントはr = 3000ラウンドのゲームをプレイする。各エージェントの信念(b′1)は[-1, 1]の範囲からランダムに選ばれる。各世代の終わりに、エージェントは相対的なフィットネスに基づいて次の世代に選ばれる。(Zitzler and Thiele, 1998)。選択されたエージェントの対立遺伝子(b′1)とガウス突然変異率(μmut = 0 and σmut = 0.01)が次の世代に使われる。エージェントの初期信念は[-1, 1]の範囲に制限されるが、その範囲外で突然変異を起こす可能性がある。ここで進化的アルゴリズムを採用しているのは、感情予測が遺伝的に保存されていると考えているからではなく、最適な信念を探索するアルゴリズムとして採用している。

【本文参照】

図4-2: 過去300世代におけるb′1の平均値。各色は p1とp2に加えられたノイズの分散を表す。左のバー：ノイズなし（モデル1a）。中央のバー：σ = 0.2、右のバー：σ = 0.3（モデル1b）。

結果

b1の値を変えてモデルを実行した。図4-2の青（左）のバーは、g世代後の集団のb′1の平均値を示している。予想されるように、エージェントはb′1 = b1のときに最も良い結果を出す。これは、エージェントの決定効用（式4.2）が最適決定効用（式4.1）に等しいからだ。b1はタスクa1に成功した場合にエージェントが受け取る報酬なので、b1はエージェントの実際の感情経験を表す。エージェントの感情予測b′1が、エージェントが経験する報酬b1を正しく予測しているとき、エージェントは最適なパフォーマンスをする。インパクト・バイアスの証拠はない。

4.4.2 モデル1b：予測不可能な環境

環境は完全には予測できないことが多い。これをモデル化するために、成功確率 (p1とp2)にノイズ (↪Ll_3F5)を加える。p1とp2の正確な値はエージェントにはわからないようにする。各エージェントにはp′iが与えられ、ここでp′i = pi + ϵiである。↪Ll_3F5 は、μ = 0とある定数σを持つガウス分布上でラウンドごとにランダムに選択される。

エージェントはa1を選択する：

結果　p′1b′1 + (1 – p′1)c ≥ p′2b2 + (1 – p′2)c (4.3)

図4-2は、確率に加えられるノイズ(↪Ll_5)の分散（σ）を0,0.2,0.3としたときのb′1の母集団の平均値を示している。モデル1aは、↪Ll_3F5 = 0の予測可能な環境を表し、エージェントは、経験の予測が実際の経験と一致するとき、最適なパフォーマンスを行う（すなわち、b′1 = b1）。p1とp2にノイズが加わると、最適な信念（b′1）は実際の利益b1ではなくなる。b1がゼロより下がると、b′1＜b1が有益である。b1がゼロより高くなると、b′1 > b1が有益である。

さらに注目すべき結果が2つある。第一に、実際の感情の強さ（｜b1｜）は、最適バイアスの大きさ（｜b′1 – b1｜）と相関している。図4-2は、｜b1｜が増加すると｜b′1 – b1｜も増加することを示している。第二に、ノイズの量はバイアスの大きさと相関がある。σ = 0.3のとき、最適バイアスはσ = 0.2のときよりも大きくなる。これらの知見の意味するところは、総論で分析する。

考察

インパクトバイアスは、肯定的な感情体験と否定的な感情体験の両方を誇張的に予測することで定義される。個人は、実際の経験と比較して、肯定的な出来事に対してはより幸福になり、否定的な出来事に対してはより幸福にならないと予測する。研究1は、ノイズの多い環境において、適切なインパクト・バイアスを採用したエージェントは、インパクト・バイアスのないエージェントよりも優れていることを示している。意思決定を行い、行動の利益を予測するとき、エージェントは肯定的な事象に対しては過度に肯定的な信念を持ち（b′1 > b1 > 0）、否定的な事象に対しては誇張的に否定的な信念を持つ（b′1< b1< 0）。したがって、インパクト・バイアスに対する選択圧が存在する。この結果は、インパクト・バイアスが動機づけを増加させることを実証した最近の研究（Morewedge and Buechel, 2013; Kwong et al.）感情予測を誇張することで意思決定を動機付けることは、ノイズの多い環境では有利に働く可能性がある。この結果は、エラー管理理論に関する文献をインパクト・バイアスに拡張するものである。ノイズは意思決定プロセスに誤差をもたらす。それを補うために、エージェントは意思決定を平均してより大きな利益に偏らせる。b1 > 0のとき、利益は平均してb2より大きくなるため、エージェントはb1の信念を高くバイアスすることで、b1をより頻繁に選択する。b1< 0のとき、エージェントは決定をb2に偏らせ、b1の信念を下げる。

4.5 研究2：個人的経験から学習する（または学習しない）

4.5.1 モデル

ここで、経験から学ぶことが有益かどうかを問う。私たちは、エージェントの感情的な経験が、その経験のフィットネス的な利点と一致するように進化したと仮定する。つまり、あるエージェントがb1を受け取ると、そのエージェントはb1を感情的に経験する。

エージェントはb1を繰り返し経験することで、それを記憶する。どの行動を選択するかを決めるとき、進化した信念b′1か、過去の経験b1の知識を使うことができる。進化した信念を使う場合は、式4.3に基づいて決定する。経験を使う場合は、式4.3のb′1をb1に置き換える。

各エージェントに追加遺伝子αを加える以外は、研究1の条件は変わらない。ここでαは、ゲームの各ラウンドで、エージェントが進化した信念（b′1）の代わりに感情経験（b1）を使う確率のパーセンテージを表す。各エージェントのゲノムはa1（すなわちb′1）の利益に対する信念とαからなる。エージェントが次の世代に選ばれるとき、両方の形質が受け継がれ、μmut = 0、σmut = 0.01のガウス突然変異を受ける。初期エージェントのαは[0, 1]の範囲でランダムに選ばれる。αがその範囲外で変異した場合は、決定式に適用する際に最も近い極限に正規化される。

結果

図4-3は、b1 = -0.8のとき、ノイズ率が異なる環境における集団のαの平均値を示している。

-0.8. b1=-0.8という値は、わかりやすくするために選んだもので、インパクト・バイアスが有利であればどこでも結果は成り立つ。ノイズがない場合（丸印）、αは正に選択される。- 直接経験が有利である。ノイズがあると（三角形と四角形）、αはゼロを下回る。経験から学ばないエージェントは、経験から学ぶエージェントを上回る。

考察

ノイズのない環境では、b′1 = b1が最適である（研究1a）。インパクト・バイアスを持つことは有利ではないので、経験から学ぶ選択圧も存在する（図4-3：○）。ノイズの多い環境では、経験から得られる実際の利益（｜b′1｜＞｜b1｜）を誇張することが最適であり、インパクト・バイアスを持つことが有利である（研究1b）。その結果、エージェントにバイアスを排除して経験から学ぶ機会が与えられると、進化はこの申し出を拒否し、インパクト・バイアスを採用して個人的経験を無視する（図4-3：三角形と四角形）。このことは、ヒトが感情的な誤予測から学ばないように見える理由（Meyvisら, 2010; Laceyら, 2006; Scheibeら, 2011; Novemsky and Ratner, 2003）を説明する可能性を示している。

注意すべきは、ヒトがすべての行動に対して信念を進化させたと主張しているのではないことだ。このモデルは、ノイズの多い環境では、ある種のバイアスを進化させることが有利であることの存在証明である。さらに、私たちは個人が感情経験から学習しないと主張しているわけではない。個人は経験から学ぶかもしれないが、その後、意思決定時に使用するためのインパクトバイアスを加えるかもしれない。感情的な経験は依然として意思決定の効用を根拠づけている可能性が高い。私たちの単純なモデルでは、エージェントはバイアスのかかった経験を変えることができないので、それを無視した。もし人間が（無意識のうちに）バイアスのかかった経験を更新しているのであれば、私たちのモデルは、個人が経験から学ばないように見える理由を推測する。例えば、ある人は1～10の尺度で恋愛の別れは3のように感じると学習するかもしれない。しかし、影響のバイアスが有利であれば、別れの予測を無意識のうちに1に偏らせ、意思決定を最適化するかもしれない。その結果、あたかも学習しなかったかのように見える。

図4-3: ノイズ環境と非ノイズ環境における母集団の平均α、10回の実行の平均。円：

ノイズなし、σ = 0.0 三角形：ノイズあり、σ = 0.2。四角：σ = 0.3

最後に、この結果は、人がなぜ正確な社会的助言を無視するのかについて説明するものである（Gilbert et al., 2009; Guarnaccia, 2012）。このモデルでは、個人がある行動の利益に関する情報（b1）を与えられ、その情報を使うか、偏った信念（b′1）に頼るかを決めなければならない。b1に関する情報は、直接の経験から来ることもあるが、他人の経験から来ることもある。Gilbert et al. (2009)で示されているように、ある出来事に関する個人の実際の経験（b1）と、ある出来事に関する他人の経験はかなり似ている。ある出来事に関する個人的な知識を他人のアドバイスに置き換えても、モデルの結果は変わらない。ある出来事に関する2人の経験は同一ではないが、十分に近ければ、個人的な経験が無視されるべき理由と同じ理由で、社会的な助言は無視されるべきである。このことは、人類が社会的情報を広く利用しているにもかかわらず、感情予測を行う際に社会的情報を無視している理由を説明できるかもしれない。

4.6 総論

インパクト・バイアスに関する究極の進化的説明と、経験学習と社会学習の両方に対する頑健性を示した。ノイズの多い環境では、自分の感情経験に比べて自分の感情予測を誇張することが有利であり、その結果、(i)過去の経験から学んだり、(ii)社会的アドバイスに耳を傾けたりしないことが有利になる。次に、このモデルがこれまで説明のつかなかった個人差データに対する洞察を提供し、インパクトバイアスは少なくとも部分的には、ノイズの多い状況での意思決定を最適化するためにヒトで進化したという仮説に信憑性を与えることを示す。

4.6.1 強度はインパクト・バイアスを増加させる

図4-2は、実際の利益の強さ（｜b1｜）が増加するにつれて、最適インパクト・バイアス（｜b′1 – b1｜）の大きさも増加することを示している。もし私たちの仮説が正しく、インパクト・バイアスが人間がノイズの多い環境をナビゲートするために進化したのであれば、この相関関係が自然界にも現れると予想される。そのようだ。恋愛関係の終了時、その関係を楽しんでいれば楽しんでいるほど、予測誤差は大きくなる（Eastwick et al.）大統領選挙後の自分の感情を予測する場合、インパクトバイアスの大きさは、選挙の重要性の認知度と相関している（Hoerger et al.）ある出来事の重要性を実験的に操作した場合でも、体験中に強い感情を感じた人は、体験前の予測がより不正確になる(Greitemeyer, 2009)。

4.6.2 ノイズが増えるとインパクト・バイアスが増加する

図4-2は、ノイズの量が増えると最適バイアスが増加することを示している。ここでもし、もしインパクト・バイアスが人間がノイズの多い環境をナビゲートするために進化したのであれば、このような現象が起こることが予想される。その通りである。インパクト・バイアスは、個人が自分自身をよりよく感じ取れるようになると減少するという証拠がある。感情予測の精度は、感情的知性の一側面である感情知覚と相関している（Hoerger et al.）自分の感情をより正確に知覚している人は、自分の感情をより正確に予測することもできる。実際、影響の偏りは、EI（Emotional Intelligence）のいくつかのベクトルと逆相関している（Dunn et al. 関連して、マインドフルネスの一側面である「内的感情と外的事象の相互作用に関する知識」は、個人のインパクト・バイアスと逆相関している（Emanuel et al.）

私たちのモデルは、ノイズが環境の予測不可能性に由来するのか、それともエージェントが自身の反応を知覚する能力の限界に由来するのかについては不可知論である。もし個人が環境（自分自身の反応を含む）を予測する能力が高ければ、補償バイアスの必要性は低くなる。対照的に、誰かが自分の感情を感知することに長けていない場合、彼らの感情体験は実際の感情のノイズ信号であり、インパクトバイアスはノイズの負の影響を緩和する。

4.6.3 確率的情報が感情予測を変える

最近、ある事象の発生可能性に関する知識が感情予測をどのように変化させるかについて研究が始まっている。報酬を受け取る確率が90%か10%かで、感情予測は異なる。(Buechel et al., 2014)。対戦ゲームの準備をするとき、対戦相手の正体を確実に知っている参加者は、勝利したときの喜びを予測するときに、より大きなインパクトバイアスを示す（Morewedge and Buechel, 2013）。なぜ出来事の可能性の変化が感情予測に影響を与えるのだろうか？

一見すると、報酬を得る可能性によって報酬の価値が変わるというのは、あまり理にかなっていないように思える。確かに、成功の可能性によって報酬を追求する動機は変わるはずだが、価値そのものは変わらない。例えば、ある個人がリンゴをもらう機会を与えられたとする。その瞬間、そのリンゴはいくらかの価値、仮にXとする。リンゴを獲得できる可能性が0.1か0.9であったとしても、そのことはリンゴの予測価値に影響しないはずだ。すなわち、リンゴの価値はX+バイアスとなる。つまり、リンゴの価値はX+バイアスである。しかし、異なる確率が知覚価値を変えることはないはずだ。

インパクト・バイアスを発生させる要因は必ずいくつかある。私たちは、これまで説明できなかった実験データを統合する理論を提示した。しかし、なぜ成功確率が異なると感情予測が変化するのかについては説明していない。おそらく、Morewedge and Buechel(2013)の仮説のように、確率的情報が個人のモチベーションに影響を与え、感情予測へのフィードバックを引き起こすのだろう。この研究と私たちの理論を統合した研究がさらに進めば、興味深いことになるだろう。ノイジーな確率的情報と「クリーンな」確率的情報の混在がどのようにインパクトバイアスに影響するかなど、未解決の疑問が残る。

4.6.4 ノイズのない状況におけるインパクト・バイアス

このモデルに対する潜在的な批判は、情報が確実な研究においてインパクト・バイアスが持続することである。もしインパクト・バイアスがノイズの多い環境をナビゲートするために進化したのであれば、なぜ予測可能な状況でインパクト・バイアスが持続するのだろうか？

私たちはこの批判を受け入れるが、自然界では個人が確実な情報を得ることはめったにないことを示唆する。上述したように、外界が予測可能であっても、自己理解は不完全でノイズが多い。睡眠不足のような単純なことが認知に影響を与えることもある（Gruber et al.）さらに、情報がかなり確実なものであっても、それを正確に処理できないという証拠もある。感情的な結果について意思決定する際、個人は確率的な変動に鈍感であることを示唆する証拠がある（Loewenstein et al.） RottenstreichとHsee (2001)は、人間が99%の確率でショックを受けるのと、1%の確率でショックを受けるのとでは、まったく同じように処理することを示している。選択肢が情動に富んでいる場合、個人は確率にあまり敏感でない（Pachur et al.）将来の感情体験を予測する場合、感情強度を高めると確率に対する感度が低下する（Buechel et al.） Suterら(2015)は、情動の豊かな文脈と情動の乏しい文脈では、根底にある認知的意思決定メカニズムが異なると仮説を立てている。彼らの研究では、情動の豊かな文脈における人間の意思決定を予測するための最良のモデルには、確率的情報を無視することが含まれている。確率的な鈍感さはノイズの一種であるため、インパクトバイアスは有利に働く可能性がある。

しかし、重要なことは、インパクト・バイアスが常に有益であると主張しているわけではないということである。先に述べたように、インパクト・バイアスは最適な決定を下回ることもある（Ruby et al., 2011; Janz et al., 2007; Dillard et al., 2010）。ここでは、ノイズの多い環境では、バイアスが機能的であることを示した。情報が透明で既知である状況でインパクト・バイアスを用いると、バイアスは最適でない意思決定につながると予想される。この研究が、いつ、どのようにインパクト・バイアスを治療的に制御すべきかについて、議論を進展させることを期待している。

4.6.5 自己欺瞞

なぜ私たちは一般的に、自分の感情予測能力が低いことに気づかないのだろうか(Kahneman, 2011)。感情予測にバイアスをかけることが最適であるとしても、なぜその事実に気づかず、わかっていながら予測にバイアスをかけてしまうのだろうか。この疑問は、自己欺瞞の理論や進化論的有用性（von Hippel and Trivers, 2011a; Trivers, 1991; McKay et al., 2009; Smith, 2014; Mele, 2001; Trivers, 2011）と関係があるのではないかと考えている。インパクト・バイアスは、自分の行動と自分の行動に対する認知的理解が乖離しているように見える状況、つまり自己欺瞞を例証しているように見える。

最近、自己欺瞞はノイズの多い情報を補うために適応的に起こりうることが示された（Ramirez and Marshall, 2015）。RamirezとMarshall(2015)の基礎となるメカニズムは、今回紹介したものと非常によく似ている。彼らは、ある資源をめぐって争うかどうかを決めるとき、成功の確率に関する知識がノイジーであれば、自分が実際よりも強いと信じることが有利に働く可能性があることを示している。しかし、重要なことは、偏った情報を使うことが有益であっても、偏った情報が真実であると信じる必要はないということである（McKay and Efferson, 2010）。RamirezとMarshall(2015)では、あるエージェントが客観的な事実よりも強いと信じたとき、そのエージェントのフィットネスが上昇した。しかし、エージェントは勝つ確率を正確に予測しながら、あたかも自分がそうだ。よりも強いかのように行動することが最適であることを知っていれば、同じように良いパフォーマンスを示すだろう(Frankish, 2009)。

インパクト・バイアスと同様に、最適な行動はバイアスを維持することだが、これには2つの方法がある。人は不正確な予測をし、その誤りに気づかないままでいることができる。これは実験データで見られることである。このように無知であるため、人は自分の行動を更新することを学ばず、バイアスが維持される。この場合、その人は自己欺瞞に陥っている。しかし、自分の感情体験を正確に予測しながらも、意思決定をする際に予測にバイアスをかけることが有利であることを知っていれば、人は同じようにうまくいくだろう。この場合、その人は自己欺瞞には陥らない。彼らは感情予測を偏らせることが有益であることを知っているので、経験から予測を更新することはないだろう。進化が世界を正確に理解することよりも自己欺瞞を選ぶのはどのような場合だろうか？典型的な議論の中心は、世界を完全に正確に理解するよりも、自己欺瞞を進化させた方が安上がりか、あるいは簡単かという点である（McKay and Dennett, 2009）。そのため、心の発達をもたらした進化上の圧力や制約を、進化モデルにおいてより頻繁に考慮する必要がある（McNamara and Houston, 2009）。残念ながら、現在までのところ、自己欺瞞のような認知バイアスの進化を予測することはほとんど知られていない（Haselton and Buss, 2009; Marshall et al.）しかし、個人は一貫して自分の予測の誤りに気づいておらず（Kahneman, 2011; Novemsky and Ratner, 2003）、また、社会的情報が広く利用されているにもかかわらず、予測する際に正確な社会的アドバイスを無視する傾向があることを考えると（Gilbert et al., 2009; Guarnaccia, 2012）、自己欺瞞が人類の進化に一役買っているという考えを真剣に考える時期に来ているのかもしれない。

4.6.6 結論

私たちは進化モデルを採用し、インパクト・バイアスと、なぜ個体が経験的学習や社会的学習によって感情予測を更新しないように見えるのかについて、究極的な進化的説明を仮定した。ノイズの多い環境では、インパクト・バイアスを利用するエージェントがそうでないエージェントを凌駕することを示す。さらに、エージェントの成功は、感情経験から学習しないことや、正確な社会的助言を適用しないことに依存している可能性があることを示す。

インパクト・バイアスの機能的説明を仮定した先行モデルはほとんどない（Miloyan and Suddendorf, 2015; Marroqu´ın et al.）その中でも、人々が時間の経過とともに快楽的に適応していく傾向に注目したものがある（Robson and Samuelson, 2011）。私たちの説明は、インパクト・バイアスが経験直後に存在する理由を説明することで、これまでの研究を超えている。

すなわち、感情の強さと雑音の増加の両方がバイアスを増幅させる。私たちは、この研究と既存の経験的証拠のさらなる分析が、インパクト・バイアスが重要な機能を果たす可能性があることを示していると考えている。患者においてこのバイアスに対処するかどうか、いつ、どのように対処するかに関する探究は、意思決定におけるこのバイアスの潜在的な重要な役割を考慮すべきである。

5　信頼は、部分的な情報とパートナーの選択が与えられた場合に、高価な罰を媒介する

「私を見る人は、私の言葉をほとんど信用しない」

ジャン=ポール・サルトル『悪魔と善き主』より

私は、他の人々がその人を見限った後でも、その人をずっと信用することを人生のルールとしてきた。

もう二度と人間を信用することはできないだろう。

ユリシーズ・S・グラント（アメリカ合衆国18代大統領）

5.1 まとめ

他者に対する盲目的な信頼と、他者を公平に扱おうとしない者に対する高価な罰は、それぞれ独立に人間の社会性に不可欠なものである。しかし、信頼も罰も、標準的な進化論では容易に説明できないことが証明されている。信頼ゲームを分析することで、この2つの現象が、部分的な情報と相手選択の文脈において適応的でありうることを示す。盲目的な信頼は、社会が信頼に足るものであるという事前の経験に基づいて発展し、その結果、既知のオファーと未知のオファーの間に競争を発生させることで、高価な罰の進化的実現可能性を媒介する。そして、不公正であることが分かっている有利な申し出の拒絶を通じた高価な罰が適応的になり、不安定でありながら信頼性の高い協力を生み出す文脈が形成される。この結果は、信頼、公正さ、そして高価な罰の進化的実行可能性が、部分的な情報とパートナー選択というもっともらしい仮定を与えられた場合にのみ関連する可能性があることを実証しており、重要だ。公正さと協力がこれらによってもたらされるということは、情報の透明性が高まる時代において、公正さの規範がより脆くなる可能性を示唆しているのかもしれない。

注：本章では、真実の知識がないことが適応的であるような状況を示していない。

しかし、この作業は第6章と第7章の基礎となるものである。

5.2 はじめに

トラスト・ゲームでは、個人が他者に投資する機会を提供し、他者がより多くの投資を返してくれると期待する。投資の機会が提供されたとき、人間のプレイヤーは2つの一見最適とは言えない逆説的な決定を下す傾向がある。第一に、相手が信頼に足る人物であるかどうかの情報がない場合、サブゲーム完全戦略では相手が離反するにもかかわらず、信頼して投資する（Berg et al.）第二に、参加者は取引が利益を生むとわかっていても、その取引が公正でない限り拒否する。

一方では有益な申し出を拒否し、他方では未知の（したがって潜在的に有害な）申し出を受け入れるのはなぜ有益なのだろうか？ここでは、盲目的な信頼とコストのかかる罰が収益最大化につながることを実証する。私たちは、投資家がパートナーの選択と潜在的なパートナーの信頼性に関する部分的な情報の両方を持つ状況で信頼ゲームを分析する。その結果、信頼と高価な罰はともに進化しうること、そして信頼が高価な罰の進化を媒介することがわかった。パラドックスというよりは、信頼する傾向と高価な処罰は、互いの文脈でとらえた場合、収益最大化戦略であり、公正規範の発展に対する簡潔な説明を提供するものである。

5.3 信頼ゲームの文脈における費用的処罰

信頼ゲーム（TG）では、個人（投資家）は1単位の貨幣を与えられる。投資家は、そのお金をそのまま持ち逃げするか、他の個人（受託者）に投資するかのどちらかを選ぶ。投資された場合、そのお金にはある係数bが掛けられ、受託者はその一部を投資家に返すことを選択できる。返される金額は、受託者の収益率rによって決定される。1/bより大きい収益率は、投資家に利益をもたらす（表1参照）。投資家が受託者に関する情報を一切持っていない一発勝負のゲームでは、離反がサブゲーム完全均衡である。受託者が投資家に何かを返すことで利益を得ることはないため、投資家は信用すべきではない。しかし、人間はその非最適性にもかかわらず信頼し、投資する傾向がある（Berg et al.）この盲目的信頼の傾向を診断する試みは、実証的なもの（Johnson and Mislin, 2011; Burks et al., 2003; Charness and Dufwenberg, 2006; Al-Ubaydli et al. 2009; Delgado et al., 2005; Kosfeld et al., 2005; Pfattheicher and Keller, 2014）と理論的（Gu¨th and Kliemt, 2000; Masuda and Nakamura, 2012; Bravo and Tamburino, 2008）な分野である。

最近、理論的な文献では、実験的に観察された信頼の水準が、受託者の収益率についてある程度の知識を持つ投資家を仮定することで説明できるかどうかが研究されている。その直感は、もし人間が評判を隠すことが困難な小集団で進化してきたのであれば、おそらく実験で観察された信頼水準は適応的であろうというものである。Manapatら(2012)は、受託者の返報率を知る機会がある閾値を超えると、信頼の選択圧が生じる可能性があることを示している。これは、情報が遅延し一貫性がない場合にも当てはまる（Manapat and Rand, 2012）。さらに、集団構造と受託者の返報率情報は相乗的に信頼を可能にする（Tarnita, 2015）。

信頼ゲームに開放的個体論的知識を導入することで、人間の遊びを考察する新しい方法が開かれる。私たちは今、TGを最後通牒ゲーム（UG）に関連して考え、信頼の失敗を高価な罰の一形態として認識することができる。UGでは、提案者が回答者に何分の一かの富を提供する。応答側は、提示された分割を受け入れるか、拒否するかを決定する。サブゲーム・パーフェクトの均衡は、回答者がどのような申し出でも受け入れることだが、UGの回答者の多くは不公正な申し出を拒否する（Marlowe et al. TGでは、投資家が受託者の期待収益率rを知っていれば、彼らの投資判断はUGにおける回答者の判断と相対化できるようになる（Tarnita, 2015）。最近、実験的研究では、投資するかどうかを決定する前に、受託者の収益率に関する情報をトラスト・ゲームの投資家に提供する効果が検討されている。投資家は、より公正なリターン（すなわちr≈1/2）を暗黙のうちに要求していることを示唆し、利益になるオファー（r > 1/b）を拒否することが多い（Manapat et al.）したがって、投資家にとって純利益をもたらすオファーであっても拒否することは、コスト的懲罰の一形態と解釈することができる。

高価な罰は、現代の人間社会で表現される協力のレベルを理解する鍵であると考えられている（Gintis et al.）とはいえ、高価な罰の最終的な原因も近接的な原因も、いまだ未解決の問題である（Rankin et al., 2009; Sylwester et al., 2013a; Hauser et al., 2014）。古い理論的研究は、フリーライダーに対する利他的な罰が協力を支援する可能性を示しているように思われたが、これらのモデルは、経験的に観察された罰の全範囲に照らして崩壊している。通常、公共財ゲームの文脈でのみ定義されるが、信頼ゲームにおける有益だが不公正な申し出の拒否もまた、反社会的処罰の一形態と見なされるかもしれない。

一部の研究者は、高価な罰は公正さに対する人間の素質によって説明される、つまり、個人は公正さの規範を維持するために喜んでお金を払うのだと示唆している（Fehr and Schmidt, 1999; Gintis et al.）もしそうであれば、高価な罰を与える人は他の文脈でも公正に行動すると考えられるが、高価な罰が必ずしも向社会的行動と相関しないことを示す証拠がある（Yamagishi et al.）実験データによると、罰は復讐や公正さへの素因など、複数の理由で表現されることが示唆されている（Bone and Raihani, 2015）。社会に利益をもたらす場合であっても、罰はしばしば怒りによって動機づけられ（Hopfensitz and Reuben, 2009）、社会的優位性と関連していることが知られている（Pfattheicher et al.）進化ゲーム理論では、選択的圧力が絶対的ペイオフではなく相対的ペイオフに集中する場合（Barclay and Stoller, 2014; Huck and Oechssler, 1999）、または選択的圧力が弱い場合（Rand et al.）

【本文参照】

表51：信頼ゲーム。投資家は、まず1ユニットのフィットネスを持つ。その投資家は、受託者を信頼して投資するか、離反するかを選択する。もし投資家が脱落した場合、投資家はペイオフである1を維持し、受託者は0を受け取る。受託者がr≧1/bを返せば、投資家は利益を得る。

信託ゲームに高価な罰という観点を加えると、問題をさらに混乱させるように見えるかもしれない。一方では有利な申し出を拒否し（高価な罰を与える）、他方では未知の-したがって潜在的に有害な-質の申し出を受け入れる（盲目的に信頼する）ことが、なぜ有益なのだろうか？もし人間が公正さを求める傾向があるのなら、なぜ高価な罰は他者を信頼することと相関しないのだろうか（Yamagishi et al.）もし人間が相対的なペイオフ（Huck and Oechssler, 1999）を通じて互いに競争しようとするのであれば、なぜ信頼するような行動をとるのだろうか（Berg et al.）

パートナー選択とその結果として生じる市場ダイナミクスは、この難問の一部を解決するかもしれない（Noe¨ and Hammerstein, 1994; dos Santos, 2014）。人々が評判を形成し、パートナーを選択することができれば、より高いレベルの協力が実験室で目撃される（Sylwester and Roberts, 2013）。最近の研究では、公正さはパートナーの選択から生じうることが示されている（Debove et al., 2015; Andre´ and Baumard, 2011; Sylwester and Roberts, 2010; Chiang, 2010）。しかし、これらの結果は、なぜ個人がすべての不公正なオファーを拒否するのか（すなわち、高価な罰）を説明することはできない。

ここで私たちは、高価な罰が信頼と協調して最もよく説明できることを実証する。様々な収益率を持つ多様な集団と、部分的な情報という条件だけを仮定することで、信頼ゲームはパートナー選択の状況へと変化する。(i)個々の収益率が既知である受託者と、(ii)個々の収益率が未知である受託者との間に競争を生じさせることで、見知らぬ人を盲目的に信頼することと、費用のかかる罰を与えることが、ともに適応的でありうることを発見する。さらに、この文脈では、信頼がなければ高価な罰は進化せず、そのような罰は部分的な情報の環境においてのみ適応的であることを示す。すべての既知のオファーを拒否することは、未知のオファーを信頼するという暗黙の脅しが含まれている場合にのみ、有利になりうる。

5.4 信頼の進化

5.4.1 モデル

Manapatら(2012)は、実験室で実証された信頼は、人間が部分的情報を持つ小集団で進化した結果かもしれないと主張している。ここでは、シミュレーション進化を用いて彼らの結果を再現する。私たちは、パートナーの選択と受託者の収益率に関する時々の知識の両方があれば、信頼は適応的であることを示す。集団はNi = 500人の投資家とNt = 500人の受託者から構成される。受託者はr∈[0…1]で遺伝的にコード化されている。これは、受託者が投資家に返す投資額の割合である。各投資家は信頼属性t∈[0…1]を持ち、これは投資家が受託者のリターン率に関する情報を持たない場合に、受託者を信頼する確率を表す。ここで示すすべてのシミュレーションでは、b = 3とした。確率tで、投資家は受託者を信頼し、受託者はb = 3を与えられる。その後、受託者はrbを投資家に返し、(1 – r)bを自分のために保持する（表51参照）。確率(1 – t)で、投資家は信用せず、1単位の適合度を保持し、受託者には何も残らない。

投資家が受託者の収益率に関する情報を持たない一発勝負のゲームでは、サブゲーム完全均衡は信用しないことである。これは、投資家が(i)複数の受託者の中から1人を選択する可能性があり、(ii)受託者の収益率についてある程度の知識を持つ可能性がある場合に変化する。このモデルでは、各投資家はk人の委託者を提示され、その1人に投資することができる。qは、ある委託者の収益率rを知る確率である。

ある受託者については情報を持っているが、他の受託者については情報を持っていない場合、投資家はどのように多くの潜在的なパートナーの中から選択すべきであろうか？ここでは、Manapat et al. 投資家は、受託者のリターン・レートが1/b（この場合は1/3）より大きい場合にのみ儲かることを念頭に置き、投資家は(i) r > 1/bである限り、既知の最も高いリターン・レートを選択すると仮定する。

(ii) そのような収益率が存在せず、投資家が信頼している場合は、未知の収益率に投資し、そうでない場合は、(iii) 投資を行わず、1ユニットのフィットネスを保持する。

これは形式的に書くことができる。特定のゲームでは、投資家はqの値に基づいて、k人の受託者のうちj人の収益率を知る。その結果、投資家は収益率riの受託者iを確率で選択する：

【本文参照】

リターン率riが既知の中で最も高く、リターン率が1/bより大きければ、投資家はそれを選択する。riは既知だが、より大きな既知のリターン・レートが他にある場合、それは選択されない。このように、投資家の信頼が高まるにつれて、投資家はリスクを取って未知の受託者に投資する可能性が高くなる。

図5-1: 投資家の信頼（左）と受託者のリターン率（右）の選択。いずれも、投資家が受託者について持つ情報（q）と、各ラウンドで利用可能なパートナーの数（k）の関数である。描かれている値は、各実行の最後の500世代を平均した500の母集団で10回実行した平均値である。(左:) 投資家が1/bより大きい既知の最高のリターンを受け入れる場合の、投資家集団の平均信頼t。右：）受託者集団の平均リターン率r。

この決定ルールが採用された理由はいくつかある。第一に、投資家は情報が既知の場合、利潤を最大化する。すべての受託者のリターン・レートが既知（q = 1）の場合、投資家は最も高いリターン・レートを選択し、最も高いオファーが利益を生むと仮定する（r > 1/b）。第二に、この決定ルールは、高価な罰という潜在的な交絡を伴わずに、信頼の利点をテストする。投資家は、未知のオファーのリスクを冒す前に、常に既知の最も収益性の高いオファーを受け入れるので、エージェントはコスト的な罰を与えることはない。- 投資家は、信頼するために収益性の高い（r > 1/b）オファーを拒否することはない。したがって、このシミュレーションでは、コスト的処罰を行わない利益最大化投資家において、信頼が適応的であるかどうかを検証する。後続のセクションでは、投資家がコスト的処罰を表明する可能性がある場合に、信頼が適応的であるかどうかを評価する。

各ラウンドにおいて、投資家はランダムに選ばれたk人の受託者のうちの1人と投資する機会を与えられる。各投資家はx = 500ラウンドのゲームをプレイし、500ラウンド後に新しい世代の投資家と受託者が選ばれる1。ある投資家の信頼度（t）または受託者の収益率（r）が他の投資家より優れている場合、そのエージェントとその属性は次の世代に登場する可能性が高くなる。Manapat et al. (2012)に従い、各エージェントはペアワイズ比較プロセス(Traulsen et al., 2007)を用いて次世代に選択される。初期状態では、rとt は [0…1]の範囲でランダムにインスタンス化され、作業全体を通して b = 3 である。次の世代に属性が追加されるときは、μ = 0とσ = 0.01のガウス分布上でわずかに変異される。g = 1000世代が実行され、母集団の平均信頼率と回帰率が考慮される。

1すべてのモデルと図のコードは、補足資料で入手できる（または出版時に入手できる）。

5.4.2 結果

図5-1は、Manapat et al. (2012)の結果を、式5.1に記述された新しい決定ルールで再現したものである。図5-1（左）は、信頼の適応性が市場規模(k)と情報所有の可能性(q)に依存することを示している。一般に、信頼は高い水準で推移する。投資家は、個々の投資家のリターン率を知らないにもかかわらず、喜んで受託者に投資する。しかし、注目すべき点がいくつかある。第一に、情報を所有する可能性が十分に低い場合、信頼は有利ではない。さらに、市場規模が小さくなるほど、信頼はより多くの情報を必要とする。パートナーの選択肢がない場合（k = 1）、q< 0.3のときに信頼は失敗し始める。最後に、情報の可能性が高い場合、信頼は低下する。しかし、これは信頼が不利だからではなく、信頼が必要でないだけである（考察参照）。図5-1（右）は、委託者の平均的な返品率を示している。パートナーが1人の場合、受託者は1/bをかろうじて上回る率を返す。パートナーの選択が加わると（k > 1）、受託者の返送率はkとqの両方の関数になる。パートナーの数kと情報の頻度qのいずれかが増加すると、平均返送率rも増加する。

5.4.3 考察

Manapatら(2012)は、少なくとも1つの返報率を知る確率が1/bより大きい限り、信頼は適応的であることを示した。私たちの結果はこの知見を裏付けている。パートナー候補の数が増えるにつれて、情報の頻度が少なくなるにもかかわらず、信頼は適応的である。

さらに、情報とパートナーの選択肢が増えるにつれて、信頼が低下する閾値が存在することがわかった（図5-1（右）参照）。これは信頼が有害だからではなく、むしろ信頼が不必要だからだ。情報化率が高ければ、各パートナー候補のリターン率は既知である可能性が高いため、投資家が未知のパートナーを信頼するというジレンマに直面することはほとんどない。その結果、信頼は中立的に推移し、信頼する投資家と信頼しない投資家は、信頼する必要がないため、同様のパフォーマンスを示す（Manapat et al.）

図5-1（右）は、委託者間の根本的な市場競争を描いている。受託者は、投資先として選ばれた場合にのみ資金を受け取ることができる。パートナーの選択がなければ（k = 1）、受託者は投資家に有利な最小限の価値を提供する（r > 1/b）。パートナーの数と情報の頻度の両方が増加するにつれて、投資家が複数のリターン・レートを知る可能性が高まる。そのため、受託者は選択競争をするために還元率を上げなければならない。情報が完全に透明な場合（q = 1）、受託者は他の受託者と競争するために、ほとんどすべてを提供せざるを得ない。

これはDebove et al. (2015)の研究と一致しており、彼らはアルティメイタムゲームにおいて、投資家と受託者の数が不均衡な場合、パートナー選択が大きなリターンにつながることを示している。しかし、ここでも、受託者のパートナー選択はより高い収益率を生み出すかもしれないが、収益性の高いオファーをすべて拒否する人間の傾向を説明することはできない。この点については、次の2つの実験で取り上げる。

5.5 部分的な情報により、高価な罰が進化する

ここでは、モデルを拡張し、高価な罰がパートナーの選択と部分的な情報によって進化することを示す。情報を完全に透明化しても、不公平なオファーを拒否することにはつながらないことを示す。むしろ、情報が部分的に難読化されている場合にのみ、公正さへの要求が発展する。

実験1では、投資家は既知の最大のリターン・レートを選択し、そのレートが1/bより大きいことを条件とした。その結果、投資家はコスト的懲罰（すなわち、利益の出るオファーを拒否すること）を許されなかった。上記の決定ルールを、最後通牒ゲームに見られる最小許容オファー（MAO）の概念と関連付けることができる。その名が示すように、MAOは投資家が考慮する最小限のオファーである。

実験1では、投資家のMAOは1/bに設定された。ここでは、MAOの進化を認める。こうすることで、コストのかかる罰が可能になる。投資家が1/b以上のオファーを拒否する場合、エージェントは有益なオファーを拒否していることになる。私たちは、パートナーの選択と部分的な情報が与えられた場合、より公平性(1/2)に近いMAOが適応的であることを示す。

5.5.1 モデル

各投資家に新しい変数、需要d∈[0…1]を追加する。需要とは、受託者のリターン・レートがわかっているときに投資家が受け入れるMAOのことである。投資家の需要が0.5の場合、投資家は公正かそれ以上のオファーしか受け入れない。投資家の要求が1/bの場合、投資家は以前と全く同じように行動する。

投資家の決定ルールを定式化することができる。情報の透明性qに基づき、投資家はk人の受託者のうちj人のリターン率を知っている。投資家は、確率的に収益率riを持つ受託者iに投資する：

【本文参照】

5.1式からの変更点は2つだけだ。第一に、収益率が既知の受託者は、その収益率が1/bではなく、d以上の場合にのみ選択される。第二に、投資家はその信頼度tに基づき、既知のリターン・レートのいずれもがエージェントのMAOを満たさない場合、未知の受託者に投資する。

ここでも、投資家はすべてのリターン・レートが既知であれば、常に収益を最大化するため、この決定ルールは有用である。模擬進化は最も高い配当率を持つエージェントを選択するので、この決定ルールはd、t、rの収益最大化値を見つけるプレッシャーを与える。

図5-2: 公正性の基準最初の実験のように、公正性の基準が1/bに固定されている場合と比較して、公正性の基準は進化する。

図5-2：公平基準と高価な罰は投資家に利益をもたらし、部分的情報とパートナー選択の条件下で選択される。（左）最終500世代における投資家の最小許容オファー(d)の平均、5回の実験の平均。（右）需要があるときの投資家の平均ペイオフ差。

5.5.2 結果

図5-2（左）は、qとkの値が異なる場合の母集団の平均MAO(d)を示している。パートナー選択がなく(k=1)、情報が適度に半透明である限り(q≥0.3)、1/bを超える収益率を要求することは有利ではない。しかし、投資家が複数のパートナーから選択できるようになると、k > 1となり、最適な最小許容オファーは増加する。平均して、投資家は利益率の高いオファーを拒否することを厭わない。

図5-2（右）は、需要を進化させた投資家と、MAOが1/bに固定された前回の実験での投資家との間のペイオフの差を表している。図5-2（右）は、需要を進化させた投資家と、MAOを1/bに固定した投資家のペイオフの差を表している。したがって、図5-2（右）において、ペイオフ差が正である場合、高価な罰を進化させる能力（すなわち、MAO＞1/3）は、投資家のペイオフを増加させ、その結果、進化的に有利になる。図が示すように、パートナーの選択（k≥2）があり、情報が完全に透明でない（q< 1）場合にのみ、有益なオファーを拒否することが有益である。興味深いことに、これらの結果は、信頼できるものではあるが、不安定なダイナミクスに由来する。

最後に、MAOの進化を許容しているにもかかわらず、信頼は依然として進化している。スペースの関係でグラフは示していないが、信頼の平均レベルは図5-1（左）と同様である。

5.5.3 考察

個人は未知の相手を信頼するが（Berg et al., 1995）、情報がわかっている場合は有益な申し出を拒否する（Manapat et al., 2012）、というのは逆説的に思える。ここで私たちは、このような行動が適応的である文脈が存在することを示した。部分的な情報を持つ小集団では、不公正なオファーは拒否し、未知のオファーは信頼するという選択圧が存在する。

【本文参照】

図5-3: k = 3; q = 0.5とした場合の、1つの模範実行における1000世代にわたる平均収益率(菱形)、信頼(四角)、MAO（丸）の共進化。信頼と返品率は不安定だが、平均的には確実に高い。需要も同様に不安定だが、公正値0.5付近で推移している。欠陥のある受託者は、淘汰される前に利益を得ることもある。

利益となるオファーを拒否することは、パラメータ空間の大部分を通じて進化したが（図5-2（左）参照）、そのような行動は必ずしも投資家のペイオフを増加させるとは限らない。例えば、パートナーの数と情報の普及率が高い場合（図5-2（右）の右上）、不公正なオファーを拒否することは有利ではない。なぜなら、リターン率を広く知っている（情報量が多い）場合、受託者間の競争によってリターン率が高い水準に押し上げられるからだ。受託者が常に0.9以上のリターンを提示している場合（図5-1（右）参照）、0.5のオファーを拒否する意志は無関係だ。したがって、需要dは無視できるほどの影響を与えず、中立的に推移する。

興味深いことに、有益なオファーを拒否することが有利になる状況が1つだけ存在する。それは、情報が部分的に欠落している場合（q< 1）と、パートナーの選択（k > 1）の両方が存在する場合である。部分的情報にはどのような特徴があるのだろうか？情報が完全に透明でない場合、投資家が未知の受託者を信頼する機会がある。情報が透明である場合、信頼は決して要因とはならない。なぜなら、定義上、信頼はリスクがある場合にのみ適用されるからだ。

私たちの結果は、高価な罰は市場に影響を与えるため適応的であることを示している。罰の利点は、受託者の選択的ランドスケープに影響を与えることに由来する。既知のオファーをすべて拒否することが適応的であるのは、受託者に選択的圧力を与え、受託者がオファーを増やさざるを得ないからだ。それはなぜだろうか？この現象をさらに検証するために、次に投資家から信頼を取り除いた場合の需要率を調べてみる。

図5-4：信頼がなければ、コスト的処罰は進化しない。投資家の平均MAO(d)は、信頼を0に固定した場合を示している。結果は最終500世代と10回の実行の平均である。

5.6 信頼がなければコスト的処罰は適応しない

ここでは、信頼とコスト的処罰の相互依存関係を分析する。上述では、部分的な情報のもとでは、信頼と高価な罰の両方がパートナー選択で適応的であることを示した。ここでは、信頼がなければ高価な罰は適応的ではないことを示す。

前回の実験では、投資家のMAOを上回るリターンを提供する受託者がいない場合、投資家は未知の受託者を信頼するか、1ユニットのフィットネスを維持するかを決定しなければならなかった。ここでは、すべての投資家の信頼をゼロにする。リターン率riを持つ受託者iを選択する確率は次のようになる：

【本文参照】

受託者の収益率が未知の場合（i > j）、その受託者が選択されることはない。投資家のMAOを満たす既知の受託者がいない場合、投資家は単にその1 ユニットの適合度を維持する。

5.6.1 結果

図5-4は、投資家が信頼していないt = 0のときの集団の平均MAO、dを示している。一般に、コストのかかる罰は進化せず、MAOが1/b以上に上昇することはほとんどない。情報量と投資家数の両方が多い場合にのみ、dは1/3を超える。

5.6.2 考察

一般に、コストがかかる罰は、信頼がなければ進化しない。しかし、図5-4の右上では、より高い最小許容オファーが発生している。これはやはり、情報の普及が競争の激化につながる文脈における中立ドリフトによるものである。進化した要求率がいずれも投資家に利点を与えないことを検証するために、別のシミュレーションを行った。前回と同様、信頼はゼロ（t = 0）に保ったが、今回は需要率もd = 1/3に固定した。このような状況では、投資家は有益なオファーをテーブルの上に残すことはないが、未知のオファーを信用することもない。dを進化させた投資家の平均ペイオフを、d = 1/3の投資家の平均ペイオフから差し引いた。d = 1/3の投資家を上回るペイオフを獲得した進化した投資家はいなかった（すべての数値がゼロ未満であったため、グラフは示していない）。その結果、図5-4で平均MAOが1/3以上にドリフトしても、利益は得られない。

信頼が適応的な高価な罰を媒介するという知見は、Balliet and Van Lange (2013)の知見と一致する。Balliet and Van Lange (2013)は、グローバルなメタ分析で、罰が協力を促進するのは信頼レベルが高い場合のみであることを示している。しかし、彼らの分析には潜在的な交絡がある。信頼と協力はともに富と相関しているのだ。信頼や協力、その他の公共財は、環境の環境収容力を十分に下回っている社会ほど普及している贅沢品なのかもしれない（Sylwester et al.）とはいえ、私たちの結果のダイナミクスは、抽象的なシミュレーションの経済的に中立な文脈にさえも当てはまるので、観察されたこの規則性を説明する最も単純な説明と考えなければならない。

要約すると、利益があるオファーを拒否することは、信頼なしでは進化しない。しかし、それはなぜだろうか？高い要求率は受託者を脅かすはずではないだろうか？もし受託者が高い要求に応じなければ、誰も投資しなくなる。しかし、進化的な文脈では、この脅威は受託者のリターンを高めるのに十分ではないことを示した。もし単に要求を引き上げるだけでリターンを高めるのに十分であれば、信頼がなくても高い最低許容オファーが進化していたはずだ。

不公正なオファーの拒否を可能にする信頼は何をもたらすのだろうか？高い信頼は、投資家が受託者のリターン率を知らないにもかかわらず受託者に投資する可能性を高める。もし信頼を取り除けば、利益率の高いオファーを拒否する利点がなくなるのであれば、受託者の収益率を高めるのはMAOの脅威だけではないことがわかる。むしろ、高いMAOと未知の受託者に投資するという脅威の組み合わせが、受託者の収益率を高めている。既知の収益率と未知の収益率の間の競争を排除することで、dに対する正の選択を排除している。

5.7 総論

私たちは、人間がなぜ未知の（したがって潜在的に不利な）オファーを信頼し、有益だが不公正なオファーを拒否するのかについて、新しい説明を提案した。部分的な情報を持つ小さな市場では、こうした一見逆説的な行動は適応的である。なぜなら、収益率が既知と未知の受託者間で競争を起こすことは、投資家にとって有利だからだ。

未知のパートナーを信頼しようとする意欲は、有益だが不公正な既知のオファーを拒否しようとする意欲とともに発生し、まさにそのような競争を生み出す。投資家は未知のパートナーとの提携にリスクを負うことを厭わないため、より高い最低受入可能額の提示を進化させることができる。未知の委託者と既知の委託者の間に競争が生まれれば、委託者は収益率を上げざるを得なくなる。委託者側の協力も離反も安定しないが、全体的な協力は十分に頻繁であるため、一般に公平性に対する期待は高い。これらが崩壊した場合でも、市場の力学はシステムが急速に回復するようなものである（図5-3）。しかし、投資家が未知のオファーを信頼しない場合、最低許容オファーを引き上げても利益は得られない。QuellerとStrassmann (2013)が示唆するように、信頼は不公正なオファーを拒否する進化のための前提条件であり、無視の尺度を必要とする。

私たちのシステムでは、信頼とコストのかかる罰が減衰するのは、どのパートナーのリターン・レートも高い確率で知ることができる場合か、単に既知のリターン・レートの十分な市場を提供するパートナーが多数存在する場合である。情報量が多い状況では、投資家（投資を倍増させることができる者）は利益のほとんどすべてを保持することができ、一緒に投資した者の協力の利益を大幅に減少させる。情報化時代において、このことは社会的な関心事かもしれない。

私たちの研究は、パートナー選択が公平性に及ぼす影響に関する分析の大半が、すべてのパートナーの収益率が既知であることを前提としているのとは対照的である（レビューはBaumard et al.）さらに、私たちの研究は、外部の選択肢が公正規範にどのような影響を与えるかに関する最近の議論を拡張するものである（Debove et al.）信頼が深まるにつれて潜在的な投資先の数が増え、投資家が未知ではあるが別のオファーを求めることができるようになると、弱いオファーの価値は低下する。私たちの知見は、何が公正とみなされるか（Henrich et al., 2001）や、より一般的な協力的投資（English et al., 2015）における、少なくとも個体内および個体間のばらつきを説明できるかもしれない。私たちの結果は、自己申告による優位性（Pfattheicher et al., 2014）やホルモンレベル（Pfattheicher and Keller, 2014）による罰の変動に関する経験的知見とも整合性がある。しかし、無差別に罰を与える者と純粋に集団の利益のために罰を与える者の間で観察される戦略の質的差異を説明するには、私たちのモデルでは不十分であろう（nas Garza et al.）高価な罰は積極的な傷害ではなく、交流の拒否という形をとるため、私たちのモデルはRaihani and Bshary (2015)が検討した罰の評判コストを回避する可能性もある。

潜在的な批判は、私たちの結果が進化的な時間枠で考察されていることである。人間は遺伝的に無条件に信頼できるわけではなく、過去の経験に基づいて戦略を調整することが多い（Bear and Rand, 2016; Rand et al.）個人は計算高く信頼する（Williamson, 1993）。私たちはこれに同意し、今回の結果は個人の生涯にわたって考えることができ、信頼の条件付き性質を実証していることを示唆する。進化的アルゴリズムは、戦略の頻度分布が各行動の結果に影響する集団において、有利な戦略を発見するのに特に有用である（Alexander, 2009）。進化的アルゴリズムは学習アルゴリズムであり、生涯を通じた学習にも生涯を通じた学習にも適用できる（McNamara and Weissing, 2010）。進化論的な比喩を取り払ったとしても、アルゴリズムは任意の時点で最良の戦略を探索する。各「世代」を、市場の現状を考慮した上で最良の行動の一つを見つける試みと見なせば、図5-3は信頼の条件付き性質を示している。一般的に信頼は有利だが、受託者が投資家の信頼を利用しようとすれば、信頼は急速に失われる。重要なことは、受託者が許容可能なリターン・レートを提示し始めると、信頼はすぐに回復することである。このことは、個人は自分の利益になるなら、有害な取引をすぐに許すという証拠と一致する（Fudenberg et al., 2012）。

本研究は、信頼と部分的な情報のみを必要とする、コストのかかる罰のための簡潔で自立的な制度の開発を示している。この制度が単純であることから、私たちの研究は、なぜ世界的に協力にばらつきがあるのかという疑問を投げかける（Henrich et al.）考えられる説明としては、競争が激しい地域の経済的要因によって、信頼性の能力が制限されている可能性がある（Sylwester et al., 2013b; Raihani et al.）制度としての信頼に話を戻すと、投資家と受託者が異なる集団のメンバーであることを期待する本質的な理由はない。私たちのモデルは、個人がこれら2つの異なる役割を担う際に、上記のように行動することだけを求めている。既知の意思決定理論（Tversky and Kahneman, 1981）に照らせば、文脈主導の行動矛盾は驚くべきことではない。実際、Esp´ın et al. (2015)は、最後通牒ゲームの文脈で、個人による返品率と要求されたオファーとの間に反相関があることを報告しており、両者が性格特性によって決定される可能性がある一方で、2つの異なる役割における行動の間には明示的または論理的な一致がないことを示している。

5.8 結論

私たちは、最小限の受け入れ可能なオファーと信頼が共進化する限り、有益なオファーを信頼することも拒否することも、収益最大化につながることを実証した。実験1では、盲目的な信頼はコストのかかる罰がなくても適応的であるという結果を再現した。実験2では、パートナー選択と部分的情報の環境において、信頼が存在すると仮定した場合、（有益なオファーの拒絶を通じて）高価な罰が有利であることを示した。最後に、信頼がなければ高価な罰は進化しないことを示した。これにより、一見不適応に見える高価な罰の特徴を比較的簡単に説明することができる。無知と信頼の両方がなければ、高価な罰は進化しない。公正なオファーを要求することは、それが未知のオファーを受け入れるという脅威を含んでいる場合にのみ、確実に有利になる。

6 高価な処罰戦略の異質性は適応的である

知識は行動を殺す。行動は幻想のベールを必要とする.

ニーチェ『悲劇の誕生』

6.1 まとめ

この短い章は前章を拡張するものである。第5章では、不当な申し出に対する高価な罰がいかに適応的であるかを分析したが、実験データに見られる多様な戦略を説明することはできなかった。ここでは、相手の選択と部分的な情報があれば、高価な罰の混合戦略が適応的であることを実証する。そのために、信頼ゲームに関する研究を拡張する。投資家が混合戦略をとった場合、受託者は収益率を上げざるを得ないが、これは投資家の半数が利益を失う提案を受け入れる場合でも同様である。最良の戦略に関する情報が未知であったり、入手が困難であったりする場合（すなわち、真実の知識がない場合）、多様な戦略は最適戦略とほぼ同じパフォーマンスを示すことがある。

6.2 はじめに

前章では、トラスト・ゲーム（TG）をプレイするとき、部分的情報とパートナー選択というもっともらしい条件のもとでは、高い最小許容オファー（MAO）が収益最大化になることを示した。しかし、高価な罰の進化的有用性を説明する研究は始まっているが（Barclay and Stoller, 2014; Huck and Oechssler, 1999; Rand et al. 実際、個人が受け入れる最小限のオファーは、文化内でも文化間でも、しばしば大きなばらつきがある（Henrich et al.）不公正な申し出に対する高価な罰が適応的であるなら、なぜ多くの人が公正でない申し出を受け入れるのだろうか。高価な処罰に対する選択的圧力は、高価な処罰を控えることが利益を減らし、戦略の実行可能性を制限することを意味する。このような戦略の多様性はどのように進化するのだろうか？

Manapatら（2012）は、進化的な観点から最小許容オファーのバリエーションについて考察した。彼らは、サブゲーム完全戦略が投資家が1/3以上のオファーを受け入れることであるトラスト・ゲームのMAOを参加者に尋ねた（第5章参照）。図6-1は彼らの実験結果である。公正なMAO（つまり1/2）を持っている人の割合が高い一方で、回答は非常に多様であった。Manapatら(2012)は、このようなばらつきが投資家の集団に利益をもたらすかどうかを考えた。これを検証するために、彼らはデータに最も適合するモデルとして、個人が「あいまいな」心を持っていることが必要であり、投資家が時折、有害なオファーを受け入れたり拒否したりすることを示した。しかし、進化ゲーム理論を用いて、彼らはファジーマインドが進化論的に成立しないことを証明した。ファジーマインドを持つ個体の集団は、合理的で利益を追求する個体に侵略される。その結果、彼らはコストのかかる懲罰戦略の異質性の進化を未解決の問題として残した。

高価な罰の適応的性質について考察した研究は数多くあるが、個々の罰戦略の異質性の根底にある原因を診断しようとした研究はほとんどない（Fischbacher et al.）ここでは、部分的な情報とパートナーの選択があれば、高価な罰戦略のバリエーションがどのように進化するかを実証する。第5章のモデルを拡張し、部分的な情報とパートナーの選択があれば、混合的な費用のかかる処罰戦略が有利であることを示す。これは、母集団の半数が採算のとれないオファーを喜んで受け入れる場合でも成り立つ。

6.3 モデル

前章と同じ、投資家と受託者のエージェントベースのモデルを採用する。思い起こせば、投資家は、信頼（t）とMAO（d）の2つの特性から構成される。最小許容オファーは、エージェントが受け入れる最低のオファーを表す。信頼は、MAOを満たす既知のオファーがない場合に、投資家が未知の受託者に投資する可能性を表す。受託者は、収益率（r）という1つの特性から構成される。これは、受託者が投資家に返す投資額の割合である。

第5章の実験2では、3つの変数の共進化を許容した。私たちは、高価な懲罰を許された投資家（d > 1/3）が、利益のあるオファーを受け入れる投資家（d = 1/3;第5章の実験1を参照）を上回ることを実証した。私たちは、部分的な情報とパートナーの選択が与えられた場合、コストのかかる罰を与える（すなわち、d＞1/3）ことが適応的であると結論づけた。

この実験では、MAO（d）を進化させるのではなく、投資家のMAOの分散を進化させる。前章の実験1と同様に、dを1/3に固定する。そして、投資家のMAOの分散を定義する新しい変数σを追加する。各ゲームで、投資家はMAOを[d – σ, d + σ]の範囲で一様に選択する。したがって、σ = 0.1であれば、各ラウンドのプレー中、投資家は、[0.23, 0.43]の範囲で一様に選択された異なるMAOを使用することになる。その結果、投資家がコストをかけて罰することもあれば（MAO > 1/3）、エージェントが採算の合わないオファーを受け入れることもある（MAO< 1/3）。σの進化を許すことで、コストのかかる罰の混合戦略が有利かどうかをテストすることができる（すなわち、σ＞0）。

前述したように、各ゲーム中、投資家はk人の受託者の1人と投資することができる。投資家が任意の受託者の収益率rを知っている確率はq である。投資家のMAOは現在、ある範囲にわたって定義されているので、yは[d – σ, d + σ]の範囲から選択された投資家の現在のMAOである。投資家はk人の受託者のうちj人の収益率を知っているので、エージェントが収益率riの受託者iに投資する可能性は次のように定義される：

【本文参照】

受託者 iの収益率が既知の最大の収益率であり、かつy よりも大きい場合、投資家はオファーを受け入れる。riが既知であっても、他の既知の収益率がriより大きい場合、それは決して選択されない。riが未知で、既知のリターン・レートがyより大きくない場合、投資家の信頼（t）に基づいてriが選択される。

6.4 結果

図6-2(a)は、潜在的なパートナー(k)と情報の透明性(q)のパラメータ掃引にわたるσの発展値を示している。投資家が複数のパートナーから選択できる場合（k > 1）、σは正となる。しかし、σの正の値が常に優位性をもたらすわけではない。図6-2(b)は受託者リターンを示している。

図6-2: 部分的情報とパートナー選択の条件下では、コストのかかる罰の分散が投資家に利益をもたらす。(a)最終500世代における投資家の費用的罰の平均分散（σ）、5回の実行の平均。(b)需要（σ）が進化する場合と0に固定される場合（dは1/3に固定される）の投資家の平均ペイオフの差。σを進化させる場合とσ=0; d=1/3の場合との率の差（第5章実験1参照）。パートナーの選択（k > 1）と部分的な情報（q< 1）があれば、コストのかかる罰（σ > 0）の分散は利益を高める。

6.5 考察

第5章では、高価な罰（d > 1/3）は、部分的情報とパートナー選択があれば適応的であることを示した。しかし、高価な罰の割合に個人差がある理由は説明できない。ここでは、高価な懲罰戦略の多様性が適応的でありうることを示した。

投資家はMAOのオファーを進化させるのではなく、MAOの分散を進化させた。毎ラウンド、投資家は[d – σ, d + σ]の範囲でMAOを選択した。dは1/3で固定されているため、σの値が0でないエージェントは、コストのかかる罰（y＞1/3）と同じ頻度で、不利益なオファー（y＜1/3）を受け入れることになる。興味深いことに、これは依然として投資家にとって有利である。投資家の半数は、いつでも利益減少協定を喜んで受け入れるという事実にもかかわらず、受託者の収益率は、時折発生する高価な処罰者を補うために上昇せざるを得ない。

6.5.1 検証可能な知識の欠如

第5章では、投資家は収益を最大化するために最適なMAOを学習することができた。この意味で、投資家は信頼ゲームを利用するために真実情報を利用した。最良の戦略を知っている者は報われた。しかし本章では、エージェントは最適戦略を学ぶことはなかった。その代わりに、投資家たちは様々な戦略を採用した。これは受託者にも同様の効果をもたらし、収益率は上昇した。最適戦略を習得するのが困難であったり、時間がかかったりする場合、人口の半数が不利益なオファーを喜んで受けるような混合戦略をとる方が、高価な罰のない世界よりもまだましである。

6.5.2なぜ d よりσを進化させるのか？

私たちは、σが進化した場合とdが進化した場合の受託者返却率を比較した（第5章実験2を参照-グラフは図示せず）。MAOが直接進化することが許される場合、受託者の収益率は高くなる。MAOの分散を進化させること（σ > 0; d = 1/3 ）は、高価な罰を許可しないこと（σ = 0; d = 1/3 ）よりも良いが、MAOを進化させること（σ = 0; d > 1/3 ）よりも悪い。そうだとすると、なぜ高価な罰の分散が興味深いのだろうか？

混合コスト罰戦略の適応的性質は、2つの理由から重要である。第一に、実験データと一致する。前述したように、高価な罰を受ける割合には個人によって大きなばらつきが見られる（Henrich and Gil-White, 2001; Manapat et al.）歴史的に、モデルは不公正な申し出に対する高価な罰を説明することに焦点を当ててきた（Barclay and Stoller, 2014; Huck and Oechssler, 1999; Rand et al.）その結果、懲罰戦略の異質性の説明は軽視されてきた（Fischbacher et al., 2013）。

本研究では、この難問を解決することに焦点を当てる。以前の研究では、個人が「ファジー・マインド」であり、時折不利益な取引を受け入れるのであれば、実験データが最もよく説明されることを発見した（Manapat et al.）しかし、そのような慣行が自然淘汰を生き残る方法を説明することはできなかった。ここでは、部分的な情報と相手の選択が与えられれば、「ファジーマインド」戦略は適応的である。たとえMAOの半分が採算に合わないとしても、時折高価な罰が与えられることで、受精率は強制的に高くなる。

この研究が重要である2つ目の理由は、MAOの分散を進化させることで、高価な罰を進化させる際のよく知られた困難、すなわち2次のフリーライダー問題を回避できる可能性があるからだ。高価な罰を与えることで離反者がいなくなる一方で、罰を拒否する協力的なプレイヤーは、罰を与えるコストを支払うことがないため、罰を与えるプレイヤーを凌駕する（Sasaki et al., 2015; Boyd and Richerson, 1992）。その結果、罰するコストの高いプレイヤーは、協力的だが罰しない戦略に侵食されることになる（Sigmund, 2007）。

最近、変化に富んだ確率的行動が、2次のただ乗り問題の解決に役立つことが示されている（Krasnow et al.） Krasnowら(2015)は、確率的罰が2次フリーライド問題の問題回避に役立つことを示した。本研究は、Krasnowら(2015)の知見を支持するものであり、コストのかかる罰戦略のバリエーションは適応的である。二次のただ乗り問題に照らして考えると、本研究は、実験データで見出された高価な処罰戦略の異質性における進化的有用性を説明する上で、一定の役割を果たすかもしれない。

6.6 結論

高価な罰が適応的であることを示した研究者は何人もいるが、個々の戦略の異質性を説明した研究者はほとんどいない。私たちは、パートナー選択と部分的情報の環境において、高価な罰の混合戦略が適応的であることを示した。たとえ集団の半数が有害な申し出を受け入れても、時折高価な罰を与えることで、より高い受託者返還率を強制するのに十分である。この研究は、2次のフリーライダー問題があるにもかかわらず、高価な罰がどのように適応的であるかについての洞察を与える可能性がある。

7 信頼と最後通牒ゲームにおいて、高価な罰は中立的にドリフトする

政治や宗教などに関する信念の特異な特徴は、誤りの私的反響が事実上存在しないことであり、非合理性の私的コストはゼロに設定される。”

ブライアン・キャプラン『合理的無知 vs. 合理的非合理性」

7.1 まとめ

最後通牒ゲーム（Ultimatum Game）において、個人は不公正な申し出を罰するために、しばしばコストをかけている。過去10年間、さまざまな理論がこの行動がいかに適応的であるかを説明してきた。しかし、未解決の問題が残っている。もし不公正な申し出を罰することが適応的であるならば、なぜ個人の費用的罰のレベルにこのような不均一性があるのだろうか。ここでは、高価な罰のばらつきがどのように進化しうるかを示す。そのためには、過去20年間の研究で明らかになったこと、すなわち、不当な申し出に対する高価な処罰は適応的である、と仮定する。この仮定により、多様な戦略が集団に漂着することを示す。このような異質性がそれ自体適応的だからではなく、異なる処罰戦略がペナルティなしに中立的に集団に流れ込むからだ。このように、実験的なばらつきを特定の適応関数に当てはめようとするのは間違いであると私たちは主張する。多くの異なる戦略が同じペイオフを返すのであれば、高価な罰の実験的変動を説明できる関数はない。

7.2 序論

最後通牒ゲーム（Ultimatum Game）では、提案者は金銭的な富を受け取り、その資源を自分と回答者の間で分割する任務を負う（表71参照）。そして、回答者は提案された分割を受け入れるか拒否するかを決める。もしレスポンダーがその提案を受け入れれば、それに応じてその賞金は分割され、そうでなければ両プレイヤーは何も受け取らない. このゲームのいくつかのバージョンでは、レスポンダは、自分が受け入れると思われるウィンドフォールの最小の割合を定義することを課され、これは個人の最小許容オファー（MAO）とみなされる. ゲームに最適な戦略は、回答者がゼロ以上のオファーを受け入れることであるにもかかわらず、被験者は一貫して有益なオファーを拒否し、しばしば資源の均等割りを要求するほどである（Henrich et al.）

このような有益なオファーの拒否は、応答者が有益なオファーを拒否し、提案者を罰することから、費用的罰と呼ばれている。有益なオファーの拒絶がレスポンダーにネガティブな影響を与えることを考えると、高価な罰がどのように適応的でありうるかについて重要な研究がなされてきた。絶対的なペイオフよりも相対的なペイオフが重要な場合（Barclay and Stoller, 2014; Huck and Oechssler, 1999）、あるいは選択圧が弱い場合（Rand et al.）さらに、Deboveら(2015)は、オファーを拒否することが提案者にとってより有害である場合、高価な罰が進化することを発見した。第5章では、高価な罰がパートナー選択と部分的情報の環境において適応的であることを示した。

理論的研究によって、不公正な申し出に対する高価な罰の進化的有用性が説明され始めているが、誰もが同じ頻度で罰を与えるわけではない。実際、個体が受け入れるオファーの下限には大きなばらつきがあることが多い（Zhao and Smillie, 2014）。過去10年間、この不均一性の近因が研究されてきた。パーソナリティ特性は、経済ゲームにおける個人の戦略と相関している（Zhao and Smillie, 2014; Karagonlar and Kuhlman, 2013）。罰の神経学的基盤が分析されている（Hiraishi et al., 2015; McDermott et al.）遺伝的要因も診断されている。アルティメイタムゲームをプレイする一卵性双生児と二卵性双生児を用いた研究では、プレイスタイルの個人差の40%が遺伝的に説明できる可能性が示された（Wallace et al., 2007）。さらに、宗教のようなプライミング効果は、個人によっては高価な罰を増加させる(McKay et al., 2011a)。

罰戦略の異質性の近接的な原因の理解は進んでいるが、究極的な原因に関する洞察は未解決のままである（Fischbacher et al.）不公正な申し出に対する高価な罰が適応的であるなら、なぜ多くの人が公正でない申し出を受け入れるのだろうか？高価な処罰に対する選択的圧力は、高価な処罰を控えることが利益を減らし、戦略の実行可能性を制限することを意味する。個々の戦略の異質性はどのようにして維持されるのだろうか？

Manapatら(2012)は、このようなバリエーションが回答者の集団に利益をもたらすかどうかを考え、進化の観点から最小許容オファーの異質性を検討した。回答者に個々のMAOを尋ねた後、Manapatら(2012)は、データに最も適合するモデルとして、回答者が時折有害なオファーを受け入れたり拒否したりする「あいまいな」心を持つことが必要であることを示した。しかし、彼らは進化ゲーム理論を用いて、ファジーマインドは進化的に生存可能ではないことを証明した。ファジーマインドを持つ個体の集団は、合理的で利益を追求する個体に侵略される。その結果、彼らは高価な罰戦略のバリエーションの進化を未解決の問題として残した。

個々の戦略の異質性の根本的な原因を解明するための予備的な試みは、頻度に依存する戦略が共存する文脈を見つけることに焦点が当てられている。McNamaraら（2009b）は、個体が情報の対価を支払うことができる環境では、異質な向社会性戦略が共存することを発見した。しかし、このような異質性の根底にある力に関する予備的研究はあるものの、より詳細な研究が求められている（Wolf, 2013; Fischbacher et al.）

ここでは、アルティメイタムゲームと、アルティメイタムゲームに類似した信頼ゲームの両方のバージョンにおいて、費用のかかる罰の変動がどのように発展しうるかを実証する。重要なのは、不公正な提案に対する高価な罰が適応的であることを実証した過去20年分の理論を真摯に受け止めることである（Debove et al., 2015; Barclay and Stoller, 2014; Huck and Oechssler, 1999; Rand et al., 2013）。これを仮定すると、私たちは、集団のMAOの頻度分布は、応答者のペイオフに悪影響を与えることなく、かなり変化する可能性があることを示す。もし提案者が、応答者の集団と対戦するときに所得最大化オファー（IMO）を選択しようとしているならば、ある数の応答者が公正な見返りを要求すれば、他のプレイヤーはペナルティなしでより低いMAOを持つことができる。合理的な提案者がいれば、様々な戦略がペナルティなしに中立的にドリフトするので、進化はレスポンダーのMAOの大きな変動を止めることはできない。

この結果は、個々の戦略の異質性を理解しようとするこれまでの試みよりも、より簡明である。これまでの説明では、集団における戦略の頻度分布を何らかの関数に対応付けることが試みられており（Manapat et al. 対照的に、本研究では、不公正なオファーをコストをかけて罰することが有利であると仮定した場合、集団の中に大きな戦略的バリエーションが漂うことを実証している。特定の関数が母集団内の戦略の度数分布を定義するわけではなく、乱数が特定の時間に流れ込んでくる可能性があるからだ。

私たちはこの研究が、個々の最小許容オファーのばらつきを説明しようとする際の混乱を明らかにするのに役立つと考えている。私たちは、異質性は適応的なものではなく、むしろ多くの異なる集団分布の個体が同一のペイオフを受けていると主張する。もし最小許容オファー分布の間に淘汰圧がないのであれば、ゲームにおけるばらつきのレベルに関数を対応させようとするのは間違いである。

結論として、最後通牒ゲームの文献の根底にある仮定、すなわち、母集団の平均MAOを減少させれば、回答者のペイオフが減少するはずだという仮定を分析する。母集団の平均最小許容提示額の媒介変数は、最後通牒ゲームにおいて広範囲に研究されている（Schmitt et al.）集団の平均MAOは、賭け金の額（Novakova and Flegr, 2013）、回答が遅延しているかどうか（Grimm and Mengel, 2011）、質問が出された時（Oxoby and McLeish, 2004）、文化的な違い（Henrich et al.）

私たちは、集団の平均MAOが集団のペイオフの代理であると仮定することの誤りを示す。平均MAOに違いがあっても、2つの集団が同じペイオフを受け取ることがある。私たちは、アルティメイタムゲームの実験データを用いて、母集団の平均MAOの分布に大きなばらつきがあっても、回答者の期待ペイオフには影響しないことを実証する。最近のいくつかの論文の結果は、母集団の平均最小許容提示額を変化させることに依存しているが、私たちはそれらの結果が参加者の期待ペイオフに影響を与えないことを実証する。もし2つの集団の個人が同じペイアウトを期待するのであれば、2つの集団の違いを説明しようとすると混乱する。私たちは、回答者の期待ペイオフが安定している状況では、個人の最小許容オファーのばらつきは説明する必要がないと主張する。

【本文参照】

表71：最後通牒ゲームでは、提案者はまず金銭的な大金bを手にする。そして、回答者はその申し出を受け入れるか拒否するかを選択できる。もし応答者が承諾すれば、その端数を受け取り、残りは提案者のものとなる。レスポンダが申し出を拒否した場合、両プレイヤーは何も受け取らない。

【本文参照】

表72: 信頼ゲームでは、投資家は1ユニットのフィットネスを持って開始する。その後、投資家は、受託者を信頼するか、あるいは受託者を脱落させるかを選択する。もし投資家が不信任をした場合、投資家はペイオフ1を保持し、受託者は0を受け取る。このバージョンのゲームでは、投資家は受託者のリターン・レートを知っているため、ゲームはアルティメイタム・ゲームのバージョンに変化する（Tarnita, 2015）。投資家（応答者）は、リターン・レート rを受け入れるか、それとも立ち去るかを決定する。

7.3 MAOの変動は罰せられない：玩具の例

このセクションでは、個々のMAOのばらつきが、回答者の期待ペイオフに影響を与えない可能性があることを実証する。その結果、市場圧力はMAOの特定の分布を選択することはできない。そのために、アルティメイタムゲームのおもちゃの例を示す。

この例では、個々のMAOは図7-1(a)に従って分布している。人口の半分はどんな申し出でも受け入れるが、d = 0であり、残りの半分は少なくとも公正な見返りd = 0.5を要求する。各ゲーム中、合理的で所得を最大化する提案者は、ランダムな応答者とマッチングされる。図7-1(a)の分布を考えると、P (0.0)とP (0.5) = 50%である.

プレイの過程で、提案者は母集団中の各レスポンダーとゲームをプレイする. 提案者のゲームごとの平均期待スコア(πp)は、返報率rの関数として書くことができる.

πp(r) = b(1 – r) ∗ P (d) (7.1) d≤r

レスポンダは提案者のオファー rがレスポンダの最小許容オファー d 以上のときにオファーを受諾する. レスポンダがオファーを受諾した場合，提案者は返されなかった報酬の割合 b(1 r)を受け取る. 提案者は各レスポンダーと対戦するので、これはオファーを受け入れるレスポンダーの割合Σ P (d)を乗じたものになる。

【本文参照】

提案者のオファーがレスポンダのMAO 以上であれば、レスポンダはオファーを受け入れ、brを受け取る。そうでない場合、提案者はオファーを拒否し、何の見返りも得られない。

提案者のゴールは、自分のスコアを最大化するリターンレートを選ぶことである. プロポーザは時間とともにレスポンダの最小許容オファーの頻度分布を学習するが、プロポーザはある時点におけるレスポンダのMAOを知らない. その結果、提案者はジレンマに直面する。低いリターンが提供された場合、提案者はそのオファーを受け入れたレスポンダーから高いリターンを受け取ることになる。しかし、そのような不公平なオファーを受け入れる人は少ないかもしれない。一方、提案者が高いリターン・レートを選択した場合、多くの人がオファーを受け入れるだろうが、各取引で得られる利益は少なくなる。

提案者が利潤を最大化している場合、彼らは式7.1を最大化するリターン・レートrimoを選択する：

rimo = arg max πp(r) (7.3) r

7.3.1 結果

図7-1(b)は、200人の回答者の集団と対戦したときの、さまざまなオファーrに対する提案者の期待ペイオフを描いている。提案者が最適なリターン・レート(rimo)を見つけようとする場合、2つの戦略が同じように機能する：r = 0.0とr = 0.5である。母集団の半分がどのような申し出も受け入れるという事実にもかかわらず（図7-1（a）を参照）、提案者にとって公正なリターンを提供することは、すべてを維持することと同じくらい有益である。すべてを維持する提案者(r = 0.0)は、どのような申し出でも受け入れる集団の半分から最大の配当を受け取る。公正な見返りを提供する受託者(r = 0.5)は、1ゲームあたりの最大配当の半分しか保持しないが、集団の全員と取引する。

【本文参照】

収益率 r (b) rに対する期待配当。

図7-1：半数の回答者が1/2のMAOを要求し、残りの半数はどのような申し出でも喜んで受け入れる母集団を考える。(a) 確率分布関数P (d). (b) サイズ200の母集団と対戦したときの、さまざまな還元率に対する提案者の期待収入.

重要なことは、提案者が2つのIMO戦略のどちらを選択しても、すべての回答者は同じペイオフを受け取るということである. 提案者が1/2のIMO戦略を提供した場合、MAOが半分以下の参加者は全員、半分のリターンを受け取ることになる。MAOが1/2の投資家はその提案を受け入れ、半分の利益を得る。しかし、どんな申し出でも受け入れる非合理的な投資家は、たとえゼロ（d = 0）であっても、受託者の1/2のIMO申し出も受け入れ、半分のウィンドフォールを獲得する。提案者が何も提供しないr = 0の場合、回答者の半数は何も受け取らずに受け入れ、残りの半数は何も受け取らずに申し出を拒否する。

7.3.2 不公平な申し出に十分な罰を与えれば、戦略は中立的に漂流する

もし集団のMAO分布が少し変化し、集団の49%がどのようなオファーも受け入れ、51%が公正さを要求するような場合、公正なオファーは提案者の最良の戦略であり、rimo = 0.5である。その結果、どのような申し出でも受け入れる集団の割合は、残りの集団の半分と同じ見返りを受け取ることになる。実際、ある集団の51%が公正な提案を要求する場合、残りの集団は半分より低い値を要求しても、全員が同じ公正なリターンを受け取ることが示される。

人口の51%が公正なMAO（d = 0.5）を持ち、人口の49%がxのMAO（x< 0.5）を持つと仮定する。b = 1と仮定すると、提案者がr = 0.5のリターンを提供する場合、式7.1による平均期待ペイオフは次のようになる：

πp(0.5) = b(1 – 0.5) ∗ P (d) d≤r

πp(0.5) = 1 ∗ 0.5 ∗である。

πp(0.5) = 0.5

(7.4)

すべての回答者は0.5の還元率を喜んで受け入れるので、提案者は各回答者から半分の利益を得る。ここで、どの還元率がr = 0.5を上回るかをチェックする。

πp(r) ≥ πp(0.5) (7.5)

7.1式と7.4式を代入すると、次のようになる：

b(1 – r) ∗ P (x) ≥ 0.5 (7.6) x≤r

r＜1/2であれば、人口の少なくとも51%が申し出を拒否することになる。しかし、r = 1/2より良いrが存在するかどうかを分析するために、rの値に関係なく、残りの49%の回答者が自動的に提案者の申し出を受け入れるという極限ケースを仮定する。そのため、不等式は次のように単純化される：

b(1 – r) ∗ .49 ≥ 0.5 (7.7)

b = 1と仮定すると、少し単純化すれば解が求まる：

r ≤ – 49 (7.8)

返報率が負になることはありえないので、提案者により高い期待配当を提供する返報率は存在しない。人口の残りの49%のMAO分布に関係なく、最良のオファーは常にr = 1/2になる。

7.3.3 考察

これは、IMO以下のMAOの不均一性を説明しようとすることの妥当性に疑問を投げかけるものである。過去20年間の研究は、不公正な提案者をコストをかけて罰することが有利である可能性が高いことを示してきた(Debove et al., 2015; Barclay and Stoller, 2014; Huck and Oechssler, 1999; Rand et al., 2013)。この仮定を真摯に受け止めれば、母集団の大部分は公正なオファーを要求するはずである（d = 1/2）。しかし、これはすべての回答者が同一の戦略を持たなければならないことを意味しない. いったん十分な数の回答者がrimo = 1/2のような公正なMAO (d = 1/2)を保持すれば、残りの集団はペナルティなしでMAO ≤ 1/2のいずれを保持してもよい。特定の分布は必ずしもどの関数にも対応しない。

これは、最小許容オファーにおける異質性が選択できない文脈があることを証明する。もし個々のMAOがIMO = 1/2のように分布するならば、d ≤ 1/2を持つどのレスポンダーも1/2のペイオフを受け取ると予想される. ペイオフは幅広い戦略で同じであるから、進化は特定の戦略に対して選択することはできない. 私たちのおもちゃの例では、集団の51%が半分のMAO（d = 0.5）を持っているとすると、集団の49%は半分より小さい還元率を持つことができ、他のすべての回答者と同じペイオフを受け取ることができる.

7.4 個々のMAOのばらつきは罰せられない：経験的な例

ここでは、最後通牒ゲーム（第5章参照）に類似した信頼ゲーム（Trust Game）の実証例を考える。信頼ゲームでは、投資家は1単位の資金を与えられ、それを受託者に投資するか、あるいは資金を持ったまま立ち去るか、どちらかを選ぶことができる（表72参照）。投資した場合、その資金にはある係数bが掛けられ、受託者は、その儲けのある割合rを投資家に返すことを決定できる。この正規版では、投資家は受託者の収益率を知らない。したがって、投資家は受託者に投資を託すかどうかを決定しなければならない。

最近、受託者の最終的な収益率に関する知識を投資家に提供することの効果が研究されている（Tarnita, 2015; McNamara et al., 2009a; Manapat et al.）投資家が信頼するかどうかを決定する前に受託者の収益率を知っている場合、ゲームはアルティメイタムゲームのバージョンに変化する（Tarnita, 2015）。投資家（すなわち、アルティメイタムゲームの応答者）は受託者（すなわち、提案者）の収益率を知っており、オファーを拒否または受け入れることができる。一貫性を保つため、ここでは投資家を回答者、受託者を提案者と呼ぶことにする。アルティメイタムゲームとこのバージョンの信頼ゲームの主な違いは、応答者が金銭的利益を得てスタートし、申し出を拒否することでそれを維持できることである。したがって、応答者が申し出を拒否した場合、両プレイヤーがゼロを受け取るのではなく、応答者が1ユニットの金銭を受け取ることになる。これは投資家のサブゲーム完全戦略に影響を与える。最後通牒ゲームでは、サブゲーム完全戦略は0より大きいオファーを受け入れることである。

Manapatら(2012)は、回答者にMAOを尋ねるトラスト・ゲームの実験を行った。彼らのゲームでは、回答者が投資した場合、その利益はb = 3倍になる。したがって、サブゲーム完全戦略は、1/3以上のオファーを受け入れることであった。図7-2（a）に結果を示す。サブゲーム完全戦略を選択した人は全体の25%未満であり、最も多く選択されたMAOは1/2で、公正なオファーであった。しかし、より重要なのは、回答の多様性である。最小許容オファーは、どんなオファーでも受け入れるもの（d = 0）から、0.9未満のオファーは拒否するものまで様々である。

ここでは、このようなバリエーションがいかに中立的に母集団に流れ込むかを示す。一定数の投資家が公正なオファーを要求すれば、他のプレイヤーはペナルティなしでより低い閾値を要求できる。合理的な提案者がいれば、市場は投資家の要求の大きなばらつきを止めることはできない。

【本文参照】

リターン率r (b) rに対する期待ペイアウト

図 7-2：Manapat ら(2012)のデータを用いた。(a) 最小許容オファーの確率密度関数. (b) 返品率の範囲に対する提案者の期待ペイアウト.

7.4.1 結果

前述と同様に、図 7-2(a)の回答者集団に対するベストオファーを計算することができる. 提案者がManapat et al. (2012)の各レスポンダーと対戦すると仮定すると、図7-2(b)はすべての可能なリターンレートに対する期待ペイアウトを示す. 提案者は、公正なリターン・レートである。rimo = 0.5を提供した場合、最も高いスコアを獲得する。母集団の55%が等分以下の提案を喜んで受け入れるという事実にもかかわらず、全母集団と対戦する者にとって等分が最良の提案である。

結果として、提案者が1/2のIMO戦略を採用した場合、MAOが半分以下の参加者全員が半分のリターンも受け取ることになる。損をするのは、MAOが半分より大きい投資家だけだ。Manapatら(2012)では、このようなMAOを行った人は全体の約10%に過ぎなかった。合理的な提案者がいると仮定すると、人口の90%は1/2の同一の利益を獲得し、残りの10%は何も受け取らない。

7.4.2 議論

Manapatら(2012)は、図7-2（a）に見られる異質性の進化論的説明を試みた。彼らの信頼ゲームのサブゲーム完全戦略は1/3であるため、彼らはなぜ1/3未満のオファーを受け入れる回答者がいる一方で、1/3以上のオファーを拒否する回答者がいるのかを説明しようとした。彼らは、「ファジー・マインド」な回答者（すなわち、時折、最適でない選択をする個人）が図7-2（a）の変動に最適な関数を提供することを示した。しかし、彼らはそのような「ファジーマインド」な投資家がどのように進化しうるかを示すことはできなかった。

ここでは、この難問を2つのステップで解決する。第一に、人類は1/2の最小許容オファーが適応的である環境で進化してきた可能性があることが研究で示されている（Rand et al.もし最良の進化戦略が1/3ではなくd = 1/2であると仮定すると、説明が必要な分散はかなり異なってくる。

d = 1/3が最適戦略だとすると、母集団の約50%が最適戦略以下と以上のMAOを持っていることになる。そのため、「ファジー・マインド」な回答者が分散を説明するのに合理的であるように思われる。しかし、（第5章で示したように）d=1/2が適応的戦略であると仮定すると、参加者の90%が最適戦略か、0.5未満のMAOを選んだことになる。

セクション7.3で示したように、合理的な提案者を仮定すると、収入最大化オファーより小さいMAOを持つ回答者は、IMO以下の他のMAOと比較して、同一のペイオフを受け取ることになる。投資家集団の90%が同じペイオフを受け取ると予想されるなら、進化の観点から、MAO≦1/2の戦略に対する選択圧は存在しない。公正なMAOが適応的であると仮定すると、市場は、より小さな最小許容オファーが集団に流れ込むのを止めることはできない。母集団の十分な割合がMAO=1/2を要求し、所得を最大化するオファーが1/2であるような場合、残りの母集団のMAOの分布は1/2より低くなる可能性がある。

要約すると、私たちは、個々のMAOの分散に関数をマッピングしようとすると、混乱する可能性があることを示した。ペイオフを最大化する提案者は、1人の個人を基準にオファーを考えるのではなく、回答者の集団全体を基準に考えるべきである。もし十分な数の個人が公正さを求めるなら、最適な戦略は公正なリターンを提供することである。もし様々な回答者が同一のペイオフを受け取るなら、その回答者は不利に選択されることはない。集団全体が同じIMOを生み出し続ける限り、個々のMAOは中立的にドリフトすることができる。

7.5 母集団の平均MAOは期待ペイオフの代用にはならない

最後通牒ゲームに話を戻すと、重要な研究は、個人の最低許容オファーを媒介する変数を発見しようと努めてきた。これらの研究のいくつかは、母集団の平均MAOを用いて結果を定義している。その根底にある仮定は、もし平均的に、回答者がより少ない要求を望むなら、彼らはより少ないものを受け取るというものである。

ここでは、この仮定の妥当性を分析し、母集団の平均MAOは期待ペイオフの代用としては不十分であることを発見する。著者らが母集団のMAO分布の変化を説明しようと試みたいくつかの実験結果を検討する。平均MAOは異なる実験設定でシフトするが、実験操作にもかかわらず、提案者（すなわちIMO）の最良の戦略は変わらないことを実証する。その結果、MAOがIMOより小さい回答者は罰せられないはずであり、そのような戦略が集団に流れ込むことを可能にする。最後に、MAOのシフトが進化的な選択圧を受けたことを示唆する近接メカニズムを推定することの誤りについて議論する。

【本文参照】

回収率、r (c) 直接反応： MAO PDF (d) 直接反応： IMO

図7-3: Oxoby and McLeish (2004)は、オファーの前（戦略法）と後（直接反応法）に自分のMAOを定義することが拒絶率に影響するかどうかをテストした。左図は、2つのプールの確率分布関数である。右図は、提案者の期待配当である. (a,b) 個人が戦略法によってMAOを選択する。(c,d) ダイレクト・レスポンス法でMAOを選択した場合。

7.5.1 ストラテジー法 vs ダイレクト・レスポンス法

回答者の最低受諾可能オファーは、2 つの方法で獲得できる。ストラテジー法では、提案者はオファーを受ける前にMAOを質問される。(Mitzkewitz and Nagel, 1993)。ダイレクト・レスポンス法では、レスポンダーのMAOはレスポンダーのプレイ時間によって計算される.もしレスポンダーがある値d以下のオファーを拒否し、d以上のオファーを受け入れた場合、dはレスポンダーのMAOを表す。Oxoby and McLeish (2004) は2つの方法が最小許容オファー(d)に与える影響を分析した.

図7-3(a)と図7-3(c)は、異なる方法がかなり異なるMAO分布を引き起こすことを示している。オファーの前にMAOを定義する場合、図7-3(a)は、大多数の参加者が少なくとも0.4の返品率を要求している。母集団の平均MAOはd¯ = 0.42である。対照的に、ダイレクト・レスポンス法では、図7-3(c)のように、個人ははるかに低いオファーを受け入れる。母集団の平均MAOはd¯ = 0.302である。

しかし、興味深いことに、MAOの分布は変わるが、提案者の最適オファー（IMO）は、どちらの集団と対戦しても同じだ。図7-3(b)と図7-3(d)は、公正さ、r = 0.5が両方の集団にとって最適な還元率であることを示している.

【本文参照】

収益率、r (d) ハイステークス： IMO

図7-4: Novakova and Flegr (2013) は、拒絶率に対するハイステークスとローステークスの効果を検証した。(a,b)

低い賭け金でプレーしている　(c,d)高い賭け金でプレーする

7.5.2 金銭的賭け

Novakova and Flegr (2013)は、金銭的賭け金が増加すれば、個人はより低いオファーを受け入れるという仮説を立てた。図7-4(a)と図7-4(c)は、この命題の信憑性を示している。小さな賭け金でプレーしているときの平均MAOはd¯ = 0.401であり、大きな賭け金でプレーしているときの平均MAOはd¯ = 0.279である。しかし、ここでも、分布の違いはIMOを変えるほどではない。図7-4(b)と図7-4(d)は、提案者の最適オファーがrimo = 0.5のままであることを示している。

【本文参照】

MAO, d (c) ローカル・コンペティション： MAO PDF

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

収益率, r (d) 地域競争： IMO

図 7-5: Barclay and Stoller (2014) は、拒絶率に対するグローバル競争とローカル競争の効果を検証した.

(a,b) 絶対的ペイオフが高く評価されている。(c,d)相対的ペイオフ（すなわちローカル競争）が報われる。

7.5.3 ローカル競争とグローバル競争

絶対的ペイオフよりも局所的競争を求める選択圧がある場合、高価な罰は適応的であると論じられてきた（Huck and Oechssler, 1999）。隣人の相対的なペイオフと競争することがゲームの絶対的なペイオフよりも有利である場合、他のプレイヤーがより大きなペイオフを受け取るのを防ぐために、有益なオファーを拒否することは有益であり得る。Barclay and Stoller (2014)は、集団の平均MAOが局所競争の値を操作することによって影響を受けるかどうかを実験的に検証した。

局所的競争が減少し、絶対的ペイオフ（すなわち、グローバル競争）の値が増加した場合、参加者の平均MAOはd¯ = 0.3030であった。ローカル競争が導入されると、平均MAOはd¯ = .3444に上昇した。BarclayとStoller(2014)は、個体がローカル競争とグローバル競争の環境を区別するように進化した可能性があるという証拠があると結論づけた。

図7-5(a)と図7-5(c)は、それぞれグローバル競争とローカル競争の頻度分布を表している。平均MAOが異なるにもかかわらず、図7-5(b)と図7-5(d)は、両方の集団に対して収入を最大化するオファーは0.4であることを示している。合理的な提案者を仮定すると、MAOが0.4以下であれば、どの回答者も同じペイオフを受け取る。グローバルなケースでは、85.7%の集団がMAO≦0.4であった。ローカル競争では、93.4%がMAO ≤ 0.4を要求した。

【本文参照】

復帰率、r (d) 即時： IMO

図 7-6：上は 10 分遅延の回答者、下は即時回答の回答者である。図(a,c)：Grimm and Mengel (2011)の実験データの最小許容オファーの度数分布。図(b,d): 母集団と対戦した場合のIMO。

7.5.4 遅延反応

重要なのは、MAOの分布がIMOに変化を生じさせるのに十分な格差がある例だ。Grimm and Mengel (2011)は、提案に対する回答を遅らせることの効果をテストした。回答者の1つのグループは、オファーを受け入れるか拒否する前に10分待ち、もう1つのグループは即座に回答した。図7-6はその結果を示している。図7-6(b)の遅延グループと図7-6(d)の即時グループの両方でIMOを計算すると、回答者の行動を遅延させることでIMOが変化することは明らかだ。回答者が遅延されると、より低い提案を受け入れる可能性が高くなる。0.2の提案は提案者の利益を最大化する。対照的に、回答者が提案に即座に反応する場合、IMOは0.5の公正なオファーとなる。

7.5.5 考察

集団のMAOの分布を説明するために、かなりの研究がなされてきた。暗黙の前提は、ある個人が低いオファーを受け入れると、その人はペイオフを減らされる、ということのようだ。私たちは、先験的にそうではないことを示す。

個人は集団の中に存在し、その集団の分布が個人のパフォーマンスを定義する。平均MAOが大きく変化しても、その集団（IMO）に対する最良の戦略は変わらないかもしれない。このことは、回答者がなぜ最適な戦略をとらないかについての洞察を与えてくれる。最良のオファーが公正である場合，rimo = 0.5であり、合理的な提案者を仮定すると、(d ≤ 0.5)より小さいオファーを受け入れるすべての回答者は、同じペイオフを受け取る.

最後通牒ゲームでは、個人のMAOを媒介する変数について多くの研究が検討されている（Oxoby and McLeish, 2004; Novakova and Flegr, 2013; Grimm and Mengel, 2011; Barclay and Stoller, 2014）。これらの多くは、実験的操作によって集団の平均MAOがどのように変化するかに焦点を当てている。私たちは、集団の平均MAOが大きく変動しているにもかかわらず、これらの研究のいくつかは、レスポンダーの期待ペイオフに影響を与えないことを示した。

このような研究は、個体がいつ、どのようにして許容できる最小限のオファーを選択するのか（すなわち近接メカニズム）を理解する上で貴重だが、この行動を進化的な観点（究極メカニズム）から研究するのは間違いであろう。MAOの個人差の背後にある選択的圧力を議論するためには、個人のペイオフについてより徹底的な調査が必要である。私たちは、MAOが期待ペイオフの代用品としては不十分であることを示した。もし、最低受入可能額の減少につながる近接メカニズムが発見されたとしても、それが個人のペイオフの減少につながることは先験的にはない。

7.6 総論

7.6.1 提案者はIMOをプレイしているだろうか？

この作業を通して、私たちは合理的で所得を最大化する提案者を仮定した。そしてそれに従って回答者の期待ペイオフを計算した。しかし、個人が合理的であることは稀である。もし提案者がIMOよりかなり低い金額を提示したらどうなるだろうか?

プロポーザーが最適戦略(rimo)をとることは稀だが、むしろケチケチと行動してIMOより少ないオファーを提案するよりも、むしろプロポーザーはIMOより多くオファーする傾向があることが異文化間の研究で実証されている(Lamba and Mace, 2012; Henrich et al., 2005)。さらに、(Achtziger et al., 2015)は、時間が経つにつれて、プロポーザーは拒絶を恐れてエゴが枯渇するため、オファーを(下げるよりも)上げることを示した。市場の観点からは、これは期待されるペイオフを損なうことなく、さらに多くの戦略が運用できることを意味する。

7.6.2 他人が公平さを求めるなら、なぜMAOを下げないのか？

ランダム提案者が、IMO よりも少ない金額を提示したらどうだろうか? IMOが0.5であるにもかかわらず、0.4を提示する提案者がいる場合、どのような提案でも受け入れるMAOを持つ方がよい。実際、サブゲーム完全戦略と同様に、最良のMAOは常にゼロ以上である。その結果，レスポンダは潜在的に利益のあるオファーを見逃すことはない. しかし、すべての人がこの論理に従った場合、結果はコモンズの悲劇となる。少数の人は最適でないオファーをいくつかキャッチするためにMAOを下げることができるが、全員がこの戦略を採用した場合、最適収益率（IMO）は下がり、全員が罰せられることになる。なぜコモンズの悲劇はこの作品には存在しないのだろうか？

私たちのモデルは、高いMAOが適応的であるという考えに真剣に取り組んでいるという点で、アルティメイタム戦略の異質性に関するこれまでの説明とは異なっている。過去20年間、多くの理論がこの理由を説明してきた（Debove et al., 2015; Barclay and Stoller, 2014; Huck and Oechssler, 1999; Rand et al., 2013）。ここでは、MAOの高値が適応的であるというだけで、どの理論が正しいかは仮定していない。この仮定がなければ、提案者側のプレーが最適でない、あるいはノイジーであれば、MAOが低い方がMAOが高い方より優れているのは事実である。これはまさに、人間がアルティメイタムゲームをどのようにプレイするかに関心を集めた社会的ジレンマである（Sasaki et al., 2015; Boyd and Richerson, 1992; Sigmund, 2007）。

しかし、MAOをゼロより増やすことに何らかのメリットがあると仮定することで、コモンズの悲劇という難問を回避することができる。ノイジーな提案者や最適でない提案者に直面して自分のMAOを下げる圧力が存在する一方で、自分のMAOを上げる圧力も存在すると仮定している。ここでは、そのダイナミクスのニュアンスについて直接論じることはしないが、例として第5章の結果を考えてみよう。相手選択と部分的情報の環境では、回答者は公正なオファーを要求することが有益である。もし回答者の一部がこのことに気づけば、回答率は強制的に高くすることができる。しかし、すべての回答者が、より高い還元率を強制するために、最良のMAO戦略を見つけなければならないわけではない（第6章参照）。残りの人々は、彼らの最小許容オファーが市場レートを下回る限り、より高い返戻率の利益を享受することができる。

この研究では、なぜMAOの実験的水準に異質性が残るのかを分析することに焦点を当てる。大きなMAOを維持するのに有利なメカニズムがあると仮定すると、IMOよりも低い戦略が中立的に母集団にドリフトする可能性があることを示す。これは、不公正な申し出に対する高価な罰が適応的であるという、次第に明らかになりつつあること以外の追加的な変数を必要としないので、UG戦略の変動に関する最も簡潔な説明である。

7.6.3 検証的知識の欠如

本論文を通じて、私は様々な文脈において、検証的知識を欠くことが適応的でありうることを示してきた。ここでは、誤った信念が単独で有利なのではなく、集団内の他の人たちの正確な信念があれば罰せられないという環境を示す。まず、不公正な申し出に対する高価な罰は適応的であると仮定する（第5章参照）。従って、MAOが0.5であることは有利であり、その結果、その戦略を持つことは真実の知識と考えることができる。この章では、集団の一部が最適戦略を知らない場合、集団全体に対する最良のプレーは依然としてIMO = 0.5であるため、その行動を集団から排除することはできないことを示した。確かな情報を持たないことは適応的ではないが、十分な数のプレーヤーが確かな情報を持っている限り、集団から排除することはできない。不正確な情報を持つ個人は、その最適でない行動の代償を支払わない。

7.7 結論

ここでは、個人の最小許容オファーにばらつきが残る理由について、簡潔な説明を提供した。まず、不公正なオファーにはコストのかかる処罰が有利であるという仮定から始める。十分な数のプレーヤーが不公平を罰することを望むと仮定すると、他の様々な戦略が集団に自由に流入することを示す。その結果、個人差を究極的に説明する変数を発見しようとする試みは、混乱に陥ることが示唆される。さらに、集団の平均MAOの変化を示すいくつかの経験的実験に照らして、この結果を考察した。母集団の平均MAOの変化は、先験的に市場がいつどのようにシフトすべきかについての洞察を提供するものではないことを示唆する。

8　フォーマルなレビューとそうでないレビューの混合が、非効率的な医療機関において最良の患者ケアをもたらす

いつかすべてがうまくいく、それが私たちの希望である。

今日すべてがうまくいっている、それが私たちの幻想である。

ヴォルテール『リスボンの悲劇をめぐるポーメ』より

8.1 まとめ

医療分野における内部告発のメリットは大きい。しかしながら、従業員の内部告発が常に有益であるという仮定は、ほとんど検討されていない。ここでは、従業員の懸念に対する社内の正式な問い合わせの有効性が、内部告発の有用性にどのような影響を与えるかを検討する。最近の研究では、医療機関の複雑な性質が内部告発の割合にどのような影響を与えるかが検討され始めているが、制度のプロセスが内部告発の有益性に影響を与えるかどうかを調査したものはほとんどない。私たちは、資源の制限やレビューの非効率性を考慮すると、内部告発の割合が制限されるか、情報の透明性が閉ざされるかのどちらかであれば、実際に患者ケアを改善できることを発見した。コンピューターシミュレーションを利用し、正式なレビューとそうでないレビューの混合が、最良の患者ケアにつながる可能性があることを示す。最後に、組織構造と内部告発が患者ケアにもたらす利益との相互作用について、より包括的な理解を深めるためのさらなる研究を呼びかける。

8.2 はじめに

医療セクターにおいて、情報の透明性と、従業員が悪い慣行を報告する自由（すなわち内部告発）の両方が、患者ケアの改善を促進したことに異論を唱える者は少ない。長期的には、内部告発は医療機関にとって費用対効果が高いとさえ証明されるかもしれない(Near and Miceli, 1985; Miceli et al., 2008)。このような状況にもかかわらず、また改善がなされたとはいえ(Freestone et al., 2006)、内部告発はまだ普遍的なものではない(DesRoches et al., 2010)。残念なことに、内部告発者はいじめ、感情的／生理的な悪影響、さらには職を失うなどの報復に直面するため、このような不適切な慣行を報告することへのためらいはしばしば正当化される（McDonald and Ahern, 2000; Jackson et al., 2014; Baucus and Dworkin, 1994; Matthiesen et al.）保健医療従事者は、このような悲惨な結末を認識しているようだが、報復を恐れたり、報告の有効性を危惧したりして、内部告発を拒否することが多い（Attree, 2007; Kingston et al., 4; Black, 2011）。その結果、このような報復を抑制し、内部告発者を保護するために、重要な研究や法律が模索されてきた（Ramirez, 2007; Eaton and Akers, 2007; Callahan and Dworkin, 1992; Bolsin et al., 2005; Faunce, 2004; Watson and OConnor, 2015）。内部告発が増えれば、悪しき慣行は排除され、患者ケアは恩恵を受けるという暗示である。

この研究では、内部告発（例えば職場の同僚、ラインマネジャー、管理者など）が常に患者ケアを向上させるという先験的な仮定に疑問を投げかける。リソースの制約やプロセスの非効率性を考慮すると、従業員が内部告発を多少躊躇しても、患者ケアは実際に改善される可能性があるという仮説を立てる。私たちの仮説を検証するために、内部告発が患者ケアに及ぼす影響を考慮したエージェントベースのモデルを開発する。政策改善を調査するための数学的・計算論的モデリングの採用は、長い間多くの分野で採用されてきたが、現在までのところ、ヘルスケア分野では十分に活用されていない（Pitt et al., 2015）。このようなツールを適用することで、多大なコストをかけずに仮説を検証することができ、政策の検討を促進することができる。

最近、医療機関の複雑な性質が内部告発率にどのような影響を与えるかという研究が注目され始めている（Mannion and Davies, 2015; Jones and Kelly, 2013）。医療機関の力学は従業員の行動に大きく影響することが示されている。内部告発率は、国家（Miceli and Near, 2013; Tavakoli et al., 2003; Trongmateerut and Sweeney, 2012）、職場文化（Mannion et al., 2005）、組織の地形（King, 1999; Barnett, 1992）によって異なる。医療機関のあらゆる可動部分を考慮すると、内部告発の欠如の責任を医療従事者だけに負わせることはできないと論じられてきた（Dekker and Hugh, 2014）。しかし、研究や政府による調査によって、医療機関の複雑な性質や内部告発を阻害する文化的要因についての洞察が得られている一方で、制度内部のプロセスが内部告発の利益を実際にどのように阻害しうるかを検討した実証的研究は驚くほど少ない。例えば、職員調査によれば、内部告発の割合は、通報の有効性の認識や通報に対する組織の対応と相関している（Skivenes and Trygstad, 2015, 2010）。内部通報の実効性を低下させる悪質な原因は悲しい現実であるが（例えば、上層部による苦情の無視（Jones and Kelly, 2014a）、ここでは、より悪質ではないが、より広範な原因である、組織のリソースの制限と処理の非効率性について分析する。資源が限られていたり、内部告発の処理が非効率的であれば、内部告発の頻度が低く、情報の透明性が欠如していても、患者ケアは実際に改善される可能性があることを示す。

加担と透明性低下の未来を黙認することは、明らかに好ましくない。そのため、この難問を回避するメカニズムについて議論することで、この研究を締めくくる。資源や効率の制約が、従業員が懸念を表明することの有用性を損なうのであれば、内部告発を減らし、医療慣行の内部調整のためのソフトなメカニズムを取り入れることを推奨する（Jones and Kelly, 2014b）。例えば、従業員が必ずしも正式に内部告発を行うとは限らないが、多くの従業員が、非公開のピアツーピアコミュニケーション(Asghari et al., 2010)のような、よりフォーマルでない方法で不適切な慣行の変更を要求していることを示唆する証拠がある(Jones and Kelly, 2014a; Moore and McAuliffe, 2010)。よりソフトな仕組みは、よりフォーマルな内部調査よりも本質的に堅牢性に欠けるが、(状況によっては)内部　告発とソフトな評価の混合が、頻繁なフォーマルな調査よりもより良い患者ケアを提供できることを私たちは実証している。

8.3 モデルの概要

ここでは、医療分野における情報の透明性と内部告発の有用性をモデル化する。医療機関は以下の変数で構成される：

患者

医療従事者

患者 ▪ 医療従事者 ▪ 患者ケアに影響を与える医療従事者が採用する良い慣行と悪い慣行。

このモデルは1万人の医療従事者で初期化され、50%がグッドプラクティス(GP)を、50%がバッドプラクティス(BP)を採用する。ゲームは10,000ラウンドに分割される。ラウンドのプレイ中、以下のイベントが順番に起こる：

8.3.1 ラウンド

1. ある可能性i (情報の透明性)で、医療従事者がランダムな同僚の診療に関する情報を受け取る。
2. その医療従事者がその診療行為が悪いと考えた場合、確率w（内部告発傾向）で内部告発し、内部調査を要求する。
3. 内部告発が報告されると、その照会は調査リストに追加される。
4. 内部告発の問い合わせは解決される(セクション8.3.2を参照)
5. 最後に、患者は治療を受ける。患者は、その施設における善良な慣行の割合に等しいケアを受ける。

8.3.2 内部告発の提起と解決

診療行為について内部告発がなされると、報告書が提出され、施設内の現在の調査リストに追加される。各調査は終了するまでにX=100ラウンドかかる。調査が100%正確であることを前提とし、もしその調査が悪しき慣習の結果であった場合、その慣習は直ちに施設から排除され、善き慣習に置き換えられる。

調査リストには、現在調査中のすべての事例が含まれている。各調査には、調査が完了するまでの残りラウンド数を表すカウンタがある。例えば、現在3つの事例が調査中である場合、リストは以下のように表示される：

– プラクティスID #1 45 – 残り45ラウンド

– 練習ID #2 395 – 残り3ラウンド

– 練習ID#8 9 – 残り100ラウンド（リストに追加されたばかりである）

各ラウンドのプレー後、リストの各練習から1ラウンドが減算される。カウンタがゼロになると、その診療は解決され、患者ケアを向上させる良い診療に設定される。

8.3.3 結果の分析

10,000ラウンドのゲーム終了後、その医療機関におけるグッドプラクティスの割合が全ラウンドにわたって計算される。これはその施設の平均的な患者ケアを表す。このゲームは異なるパラメータ値で実行することができ、患者ケアの最良のモデルが分析される。

8.4 モデル1：（ユートピック）ベースライン

ここでは、患者ケアが施設内の情報透明性(i = [0, 1])と内部告発傾向(w = [0, 1])の両方によってどのような影響を受けるかを検討する。i< 1の場合、施設内の情報の透明性が欠如しており、労働者は同僚の実践を常に知っているわけではない。w< 1の場合、労働者はある程度加担している。- 悪い慣行を目撃しても、必ずしも内部告発をしない。iとwのすべての可能な値について患者ケアを検討し、透明性の異なる値が内部告発のさまざまな割合とどのように組み合わさって患者ケアに影響を与えるかを分析する。

8.4.1 結果

図8-1は、iとwをパラメータとして変化させた場合の患者ケアを表している。情報が透明で（i = 1）、従業員が加担していない（w = 1）とき、患者が最良のケアを受けることは明らかだ。

図8-1：情報の透明性(i)と内部告発率(w)のパラメータ掃引における患者ケア。

8.4.2 考察

この結果は、資源の制約がない理想的な世界では、情報の透明性と内部告発はどちらも公共財であるという推定に反証を与えるものである。患者ケアは、情報の透明性と共犯関係の欠如があるところで最もよくなる。

8.5 モデル2：加担と情報の難読化によって患者ケアが改善される場合

先のモデルでは、照会事項の審査にかかる時間は、現在処理中の審査件数とは無関係であると仮定している。リソースは有限であるため、これは現実的な仮定ではない。もしリソースがA診療の調査に費やされれば、B診療の調査が遅れるかもしれない。

ここでは、有限の資源が患者ケアに及ぼす影響について考える。誰かが内部告発し、新たな診療行為が調査リストに追加されるたびに、各調査に3%の時間が追加される。問い合わせの解決には100ラウンドかかるので、3%の増加は、リストの各問い合わせに3ラウンド追加されることを意味する。

例えば、現在の問い合わせリストが以下の通りだとする：

練習ID #1 45 – 残り45ラウンド

練習ID #2 395 – 残り3ラウンド

診療ID #8 9 – 残り100ラウンド

もし医療従事者が他の診療所に対して内部告発を行った場合、その結果リストは次のように表示される：

図8-2: 照会時間が1回増えるごとに3%増加した場合の、10,000ラウンド後の平均患者ケア。

診療所ID #1 45 – 残り48ラウンド

診療ID #2 395 – 残り6ラウンド

診療ID #8 9 – 残り103ラウンド

練習ID #9 845 – 残り109ラウンド

既存の各問い合わせに3ラウンドが追加される。さらに、新しい問い合わせ（ID #9 845）は次のように始まる。

さらに、新しい問い合わせ(id #9 845)は、すでにリストにある既存の問い合わせごとに3ラウンドが追加されるため、+9ラウンドで始まる。

8.5.1 結果

3%の遅延を追加した結果、図8-2は、情報の透明性と頻繁な内部告発が、もはや最適な患者ケアにつながらないことを示している。情報が透明である場合(i = 1)、労働者が約35-45%の割合で内部告発するだけで、患者ケアは最良となる。さらに、政策によって、すべての労働者が悪い政策を目撃したときはいつでも内部告発しなければならないと決められている場合（w = 1）、情報が部分的に難読化され、労働者が35～45%の頻度でしか情報を受け取らないことが、患者ケアにとって最適である。

8.5.2 考察

モデル2は、内部告発が最終的には診療の改善につながる一方で、資源に限りがある場合には、他の診療の調査を遅らせることにもなることを示している。このことは、潜在的に有害な慣行が流通する時間を長くする。その結果、ある悪い慣行（透明性の欠如）を知らなかったり、内部告発をしなかったり（共謀）しても、既存の調査をよりタイムリーに解決することで、患者ケアの改善につながることがある。

注目すべきは、調査の解決を3%遅らせることは非常に小さいということである。もし施設の予算が一定であると仮定すれば、その割合は100%になる。さらに、3%という驚異的な効率を維持するために必要な資源が、直接患者ケアに使われる資源に悪影響を与えないと仮定している。どちらの仮定もかなり寛大だが、3%でもまだ、共犯や情報難読化の効用を克服するには十分な効率ではない。付録B.1では、レビュー時間に5%または10%を加えると、こじつけや情報難読の効用は著しく増大することを示している（これでもかなり寛大ではあるが）。

医療分野では、重要な研究、規制、政策的要請により、内部告発率と情報の透明性を高めようとしてきた。ここでは、内部告発率を高めることは、組織の学習と既存の悪しき慣行の是正を遅らせる可能性があるため、必ずしも有益であるとは限らないことを示す。内部告発者が制裁を恐れない世界であっても、常に内部告発を擁護することが、医療機関や患者の最善の利益になるとは限らない。資源が少しでも制約されるのであれば、ある程度の加担は患者ケアを向上させるかもしれない。

8.6 モデル3：より効率的なレビュー

このモデルでは、照会処理の効率化がいかに内部告発と情報の透明性を高めるかを示す。以前は、各問い合わせの処理に100ラウンドかかっていた。現在では、照会1件あたりのラウンド数を50に減らしている。内部告発があった場合、各照会には依然として3%が追加されるが、最初の照会が50件であるため、追加されるのは1.5ラウンドのみである。

8.6.1 結果

図8-3は、情報が透明化され、労働者が常に内部告発することが、患者ケアにとって最良であることを示している。処理時間を短縮することで、共謀の利点は解消される-10,000ラウンド後では、労働者が悪い実践を目撃したときに内部告発するのが最善である。

8.6.2 考察

実験的文献では、内部告発制度の有効性は内部告発の傾向と相関している（Skivenes and Trygstad, 2015, 2010）。非常に効果的な公式レビュー処理が行われている機関の実務者は、それほど効果的でない機関の実務者に比べて内部告発を行う可能性が高い。モデル2とモデル3は、どちらのタイプの施設でも、実務者が患者ケアの質を高めるような方法で業務を行っている可能性があることを示している。モデル2では、処理時間の増加は、内部告発制度が患者ケアにもたらす利益を減少させることを示した。しかし、処理時間が半分になれば、突然の頻繁な内部告発と情報の透明性が最高のパフォーマンスを発揮する。

図8-3：最初のレビュー時間が50ラウンドの場合の、10,000ラウンド後の平均患者ケア。

8.7 モデル4：時間の結果

調査の処理時間を半分にすると、なぜ内部告発の最適率が変わるのだろうか？この疑問を調べるために、患者のケアが時間とともにどのように変化するかを考える。ここまでは、10,000ラウンドにわたる患者ケアを考察してきた。次に、モデル2とモデル3を50,000ラウンドまで拡張し、異なる内部告発戦略が時間とともに患者ケアにどのような影響を与えるかを分析する。

8.7.1 結果

モデル2を10,000ラウンドではなく50,000ラウンドで実行すると、まったく異なる結果が得られる。突然、内部告発と透明性が最良の患者ケアを提供するようになった。50,000ラウンド後、患者ケアのグラフは図8-3（付録B.2参照）とよく似ている。

図8-4はその理由を示している。実線は、経時的な施設内のグッドプラクティスの割合を示している。情報を得る確率は100%(i=1)で固定し、患者ケアは異なる内部告発戦略に対して測定される。正方形の線は、誰も内部告発をしない（w = 0）施設を表し、その結果、グッドプラクティスの数は増加しない。他の線は異なる内部告発戦略を表し、その範囲は30%（w = 0.3）から常に内部告発する（w = 1）までである。

最初の10,000ラウンドは、常に内部告発が行われるため、患者ケアに支障をきたす。若干の加担（w＜1）は無条件の内部告発（w=1）を上回る。高い内部告発率は頻繁な問い合わせをもたらすので、既存の問い合わせの解決は遅れ、患者ケアは損なわれる。しかし、内部告発が頻発することで照会が遅れるものの、いったん照会が解決し始めると、より多くの診療行為が変更される。ある時点で、頻繁な内部告発が追いつき始め、最終的には頻度の低い内部告発を追い越す。図8-4では、最初の10,000ラウンドでは、30%の内部告発（丸線）が60%（菱形）や100%（三角形）の内部告発を上回っている。しかし、13,438ラウンドを過ぎると、w=60%がw=30%を上回る。18,199ラウンドでは、加担拒否（w=100%）がw=30%を上回り、24,800ラウンドでは、w=100%がw=60%を上回る。

【本文参照】

図8-4：内部告発率と効率率を変えた場合の50,000ラウンドにおける患者ケア。情報を受け取る確率は100%（i = 100）に固定されている。実線：当初、レビューには100ラウンドかかる（モデル2）。点線：レビューには50ラウンドかかる（モデル3）。正方形：丸、ひし形、三角：wはそれぞれ30%、60%、100%である。

照会処理が50ラウンドで済むモデル3では、10,000ラウンド後に内部告発が共犯を上回ることが示された。重要なことは、この行動の背後にあるメカニズムは、問い合わせに100ラウンドを要する場合と同じであるということである。その結果、モデル3では、加担が有利になる前の時間が存在すると予想される。

図8-4の点線は、モデル3を50,000回にわたって描いたものである。明らかに、無条件の内部告発（w = 1）は、10,000ラウンドよりかなり前に、他のすべての戦略を凌駕している。グラフでは見えにくいが、890ラウンドまでには、w=100%がw=30%を上回っている。これは、問い合わせが100ラウンドかかる場合の13,438ラウンドとは対照的である。さらに、5669ラウンドではw = 100%がw = 60%を上回る。これも、照会に100ラウンドかかる場合の24,800ラウンドとは対照的である。

8.7.2 考察

十分な時間があれば、加担することなく内部告発することは常に最終的に有益である（w = 1）ので、加担や透明性の欠如がより良い患者ケアを生み出すような、組織改善の初期段階を考慮することは重要であろうか？変化には代償がつきものであり、短期間は施設の業績が妨げられるかもしれないが、最終的には透明性と内部告発が最良の患者ケアにつながるということを、なぜ受け入れてはいけないのだろうか？

証拠によると、時間は余裕のない贅沢品かもしれない。懸念事項の処理と調査の過程で遅れを経験した労働者は、しばしば身体的・精神的不調による欠勤に陥りやすいことが知られている（Francis, 2015）。これはすべて追加コストがかかり、フィードバックループを生み出し、患者ケアと職員の士気に悪影響を及ぼす（Francis, 2015）。さらに、前述したように、レビュー時間の3%増はかなり寛大である。もしその割合を5%や10%に増やせば、無条件の内部告発w=1がかなりの量の加担w=0.3を上回るまでに、さらに長い時間を要することになる（付録B.3参照）。

しかし、状況によっては、後日良い事例を増やすために、スタートが遅くても十分価値がある。調査期間を半分（100ラウンドから50ラウンド）に短縮することで、内部告発が加担を凌駕するのに要する時間は半分以下となる。少なくともこの単純なモデルでは、照会処理にかかる時間を短縮することには指数関数的なメリットがある。

このモデルでは、公式レビューの有効性における施設の違いが、患者ケアを向上させるための戦略の相違につながる理由を説明した。しかし、処理時間を直線的に短縮すると、加担が内部告発を上回る時間は指数関数的に短縮される。その結果、効率的な機関であれば内部告発のスタートが遅いことを受け入れることは可能かもしれないが、照会が処理に時間を要する場合には、実現可能性が低くなるかもしれない。このことは、白紙委任による内部告発の戦略を推奨または実施する前に、機関の複雑な性質を調査すべきであるというさらなる証拠を示している。

確かな知識の欠如

最後に、このセクションでは、情報が自由に透明である（i = 1）と仮定して内部告発率の効果を分析した。しかし、個人が常に内部告発を行うと仮定し（w = 1）、情報の難読化（すなわち、i = 0; 0.3; 0.6）を透明性（i = 1）に対してテストしても、同じ結果が成り立つ。効率的な制度では、情報の透明性は情報を隠蔽した制度をすぐに凌駕する。しかし、制度の非効率性は、不透明な制度が透明な制度を上回る期間を劇的に長くする。

8.8 モデル5：ソフトで監視されない助言と内部告発の比較

加担と透明性の低下に甘んじることは、受け入れがたいほどリスクの高い戦略のように思われる。悪意ある慣行や、単に無能であることが大惨事につながりかねないのは、まさにこの種の環境である。このセクションでは、非効率がもたらす問題を回避する方法について論じる。そのために、内部告発と、監視の目は厳しくないが資源をあまり必要としない、慣行を変えるための解決策との混合戦略を分析する。

これまでは、労働者が悪い慣行を目の当たりにしたとき、内部告発するかどうかを決めることしかできなかった。ここでは、慣行を変えるためのソフトなメカニズムを紹介する。内部告発をするのではなく、従業員が職場の同僚に助言することで、正式な内部調査なしに行動を改めようとする。

【本文参照】

図8-5：ソフトアドバイスの有無による患者ケアの比較。情報を受け取る確率は100%(i=1)で固定されている。問い合わせには100ラウンドかかり、依存度は3%である。実線： s = 0 (モデル2)。点線：点線：ソフト・アドバイスあり、s = 1（モデル5）。

しかし、従業員が内部告発をしない場合、従業員は確率sで助言を提供する。エージェントが助言を提供した場合、同僚は非公式な助言に基づいて行動を更新するかもしれない。

よりソフトな行動変容を許容することの懸念の1つは、透明性の欠如である。内部調査には時間がかかるかもしれないが、労働者が節度なく情報を共有することを許可するよりは透明性が高い。悪質な実務担当者に与えたアドバイスが有益なものでなかった場合、あるいはさらに悪いことに、実務をさらに損なうものであった場合はどうなるのだろうか？

ソフトなアドバイスに内在するリスクを分析するために、誰かが悪い実践を他の人に知らせた場合、そのアドバイスは、1.改善されるか、2.悪化するか、3.影響しないかのいずれかになると仮定する。これまでのところ、良い実践はそれぞれ患者ケアを1増加させ、悪い実践はそれぞれ0として表してきた。次に、患者ケアにマイナスの影響を与える能力を-1で加える。もし診療が改善されれば、正式なレビューと同様に、悪い診療（0または-1）は良い診療=1に切り替わる。悪い実践が悪化した場合、その実践は0から-1に切り替わる（すでに-1の場合は-1のまま）。その結果、その診療は実際に患者ケアを妨げることになる。最後に、ソフトなアドバイスは無視することができ、診療は現在の値を維持する。各アウトプットの確率は等しいと仮定する（1/3で改善、悪化、影響なし）。これは内部告発とは対照的であり、私たちのモデルでは内部告発は常にプラスに転じる。

8.8.1 結果

図8-5は、ソフトな助言が許されないモデル2（実線）と、労働者が常にソフトに助言する機関s = 1（点線）を比較したものである。情報を受け取る機会はi=1（すなわち完全な透明性）に固定される。患者ケアは、異なる内部告発戦略について測定される。Y軸は以前のグラフと比較して若干変更されている。以前のモデルでは、良い診療行為=1、悪い診療行為=0であったため、良い診療行為の割合が患者ケアの尺度であった。現在では、診療行為は集合[-1, 0, 1]の中にある。その結果、医療はすべての診療の平均値で測定される。

図8-5は、たとえ助言が診療を悪化させる可能性があったとしても、スタッフが監視されずに助言を提供する環境を促進することが有益であることを示している。もし開業医が30%または60%の頻度で内部告発するならば、ソフトな助言は常にソフトな助言をしない開業医を凌駕する。このことは、w=0.3（丸印）でもw=0.6（菱形印）でも、点線が常に実線より高いという事実が示している。

労働者が常に内部告発をする場合（w = 1）、ソフト・アドバイスは何の利益ももたらさない。これは予想通りである。なぜなら、従業員は内部告発をしなければ、ソフトな助言しかしないが、常に内部告発をするので、ソフトな助言の潜在的な利点が目撃されることはないからだ。最後に、点線の四角い線は、内部告発をせずに（w = 0）ソフトな助言を活用した場合、内部告発とソフトな助言の混合ほどではないが、実務が改善することを示している。

8.8.2 考察

監視されない助言への不安にもかかわらず、この単純なモデルでは、ソフトな助言を許可することはほとんど常に有益である。しかし、図8-5では、助言が役に立つ可能性も、害を及ぼす可能性も、実務に影響を与えない可能性も、等しく存在することに注意することが重要である。もし有害な助言の可能性が高まれば、ソフトな助言の利点は減少するか、排除されるかもしれない（付録B.4参照）。このことは、内部告発方針を制定する前に、その機関の力学を考慮する必要性をさらに立証している。専門的な助言が役に立つよりも害になる可能性の方が高いと証明される可能性は低いように思われるが、そのようなメカニズムは最良の政策を選択する上で重要な力を発揮する。

重要なことは、図8-5において、内部告発とソフトな助言の混合が最も良い結果を出していることである。無条件の内部告発は、最終的にはソフトな助言を伴う戦略を上回るが、それにはより多くの時間が必要である。内部告発率が60%のとき（点線、菱形線）、無条件内部告発（w=1）がそれを上回るのは、ほとんどすべての実践が良好なときだけだ。したがって、ソフトな助言と内部告発が混在している場合、無条件の内部告発のメリットを待っても、医療への直接的な改善を遅らせる価値はないかもしれない。処理の非効率性を克服できない場合、ソフトな助言が内部告発を補強し、患者ケアの改善をもたらすかもしれない。

8.9 総論

この研究では、医療システムにおける微妙で小さな摂動が、患者ケアを最大化するための最良の方針を大きく変える可能性があることを論じた。審査処理時間の間に3%の相互依存性を加えることで、複雑さと透明性の欠如が、逆説的に患者ケアに利益をもたらすことがわかった（モデル2参照）。合併症の利点は長期的には維持されないが（モデル4参照）、ある医療機関にとっては、合併症は患者ケアの最良の戦略を変えるのに十分な長さである。しかし、もし調査時間が短縮されれば（モデル3および4を参照）、この効果は十分に小さくなり、内部告発に対する初期の罰則は克服され、透明性の高い医療機関がもたらす将来の利益を享受できるようになるかもしれない。このことは、内部告発の割合が、通報の有効性の認知度や制度的対応と相関している理由を説明する一助になるかもしれない（Skivenes and Trygstad, 2015, 2010）。

私たちはさらに、実務を更新するためのソフトなメカニズムが医療制度にとって有益かどうかを分析した。監視されていない助言はリスクが高いと思われるが、内部告発とソフトな助言の混合が患者ケアを最適化する可能性があることを示した。内部告発の忠実な調査には価値があるが、コストがかかる。安価だが正確性に欠ける診療の更新手段と、正確性は高いがコストのかかる内部告発を組み合わせることで、優れた患者ケアが実現する。

これは明らかに単純なモデルである。しかし、この研究は、機能している医療システムを模倣しようとしているのではない。その代わりに、システムの小さな摂動がいかに均衡の大きな変化につながるかを示したいのである。私たちは内部告発の問い合わせに3%の遅延を加えただけであり、その結果、共犯関係と情報の難読化は患者ケアにとって実際に有益であった。私たちは、照会解決への障害を他にもいくつか含めることができた。例えば、予算が一定であれば、内部告発の審査は患者が受けるケアを実際に妨げるかもしれない。もし医療機関が審査にお金を費やしているのであれば、さらなる患者のニーズにお金を費やすことはできない。さらに、ある医療機関でケアの失敗があったために方針やガイドラインが作成された場合、他のうまく運営されている医療機関もその新しい方針を盛り込まなければならないのだろうか？新しい方針を実施するために必要な器用さは、自明ではないかもしれず、解決するよりも多くの問題を引き起こす可能性がある。内部告発のコストが阻害要因となる可能性がある方法はいくつかあるが、今回はその一つを説明した。

内部告発と情報の透明性の有用性が、医療機関の複雑さとどのように関連しているかを完全に理解するためには、さらに多くの研究と理論が必要である。今回の研究は、内部告発と透明性が患者ケアを向上させるという先験的な信念に疑問を投げかけ、資源の制約がある場合には、ソフトな報告と正式な報告の混合が最良の患者ケアを提供する可能性があることを示唆している。組織の複雑性が内部告発の有用性にどのように影響し、患者ケアの改善につながるかを説明する上で、今後の研究が役立つことを期待している。さらに、モデリング技術という比較的未開拓の資源を、医療政策の会話の迅速化と検証のためにさらに活用することを求める最近の呼びかけ（Pitt et al.

9 結論

「自分を欺かないことほど難しいことはない。」

ルートヴィヒ・ウィトゲンシュタイン『文化と価値』

なぜ彼が私の精神的な不在をそれほどいらいらさせるのか、彼を困らせるために私が故意に鈍感になっていると思っているのか、それとも私がそれに気づかないことで不当に苦労をごまかしていると感じているのか、その理由はまったく定かではなかったが、私はしばらくの間、彼を苛立たせないように、注意深く、完全に意識を保っていようと心に誓った。”

ビル・ブライソン『森の散歩道』

9.1 テーゼ

世界を正確に理解することは、複雑な環境をナビゲートする上で非常に重要である。しかし、様々な文脈において、個人が行動を選択する際に確かな知識を用いることはない。これは、そのような情報が自由に利用できる場合でも同様である。この研究において、私はこの現象に対する説明を提示した。私の論文は、（少なくとも部分的には）偏った知識が適応的である文脈は驚くほど多様であるというものである。本論文を通じて私は、誤った情報を持つことの利点を示すことで、様々な放置された科学的疑問に対する説明を提供した。私は、協力関係の維持、予測不可能な環境における行動の選択、市場への投資、非効率的な制度内での活動などにおいて、正確な知識を欠くことが適応的でありうることを示した。第2章では、適応的無知が自己欺瞞の進化にとって最低限必要な条件であることを論じた。多くの進化論者が信じているように、適応的無知が自己欺瞞の十分条件であるとすれば、本論文は自己欺瞞が有利な環境の広さについて論じることになる。適応的無知が自己欺瞞の必要条件でしかないのであれば、本論文は、自己欺瞞のための環境構成要素の一つが（少なくとも理論的には）広範に存在することを証明することになる。この最終章では、私の発見を要約し、限界と潜在的な批判について議論し、今後の研究を提案する。

9.2 各章の要約

本論文は、確かな知識がない方が有利な文脈が数多く存在することを論じている。第3章では、集団の協力の価値は、正直に行動することのコストを上回る可能性があると論じている。たとえ情報が自由であっても、誤った社会的信念に味方した方が協力は維持される。このことは、個人が向社会的に行動するかどうかを決定する際に、自由で確かな情報の代わりに、誤りを犯しやすい社会的情報を利用する理由を説明できるかもしれない（Sommerfeld et al., 2008）。

第4章では、インパクト・バイアスの潜在的な利点について分析した。インパクト・バイアスとは、感情的な予測を誇張する人間の傾向のことである（Wilson and Gilbert, 2013; Wilson et al., 2000; Schkade and Kahneman, 1998; Wilson et al.）インパクトバイアスは有害である可能性があるが（Janz et al., 2007; Ruby et al., 2011; Dillard et al., 2010）、最近では、バイアスが何らかの利益をもたらすかどうかを発見することが求められている（Miloyan and Suddendorf, 2015; Marroqu´ın et al.）エラー管理理論（Johnson et al., 2013; Haselton and Nettle, 2006; McKay and Efferson, 2010参照）の研究を拡張し、将来の感情体験を誤って予測することは、ノイズの多い情報を補うことで有益になりうることを実証する。

第5章では、部分的な情報とパートナーの選択がある場合、他者への盲目的な信頼と不公正な申し出の拒絶（すなわち高価な罰）が収益を最大化することを示す。潜在的なパートナーが信頼に足る人物かどうかが分からない場合、個人は有害な取引のリスクがあるにもかかわらず、相手を盲目的に信頼する傾向がある（Berg et al., 1995）。興味深いことに、相手が有益な取引を提示してくることがわかると、それが公正なものでない限り、その申し出を拒否することが多い（Henrich et al., 2001; Marlowe et al., 2010）。このような行動は、パートナーに関する情報が不完全な市場において適応的であると私は主張する。過去数十年にわたり、進化論者はコストのかかる罰が適応的である文脈を分析してきた（Debove et al., 2015; Barclay and Stoller, 2014; Huck and Oechssler, 1999; Rand et al., 2013）。この研究は、なぜ個人が高価な罰を与えるのかについて、簡明な説明をしている。明確な知識を欠くことが有益であるとは明確に論じていないが、第7章「高価な罰は適応的でありうる」の前提条件を示している。

高価な刑罰の適応的性質の説明に焦点を当てた研究は数多くあるが、個人の戦略の異質性を説明した研究はほとんどない（Fischbacher et al.）第6章では、第5章のモデルを拡張し、費用的処罰の混合戦略は適応的であり得ると論じている。最適な戦略の知識を得るにはコストがかかりすぎるか、他の何らかの力（例えば、2次のフリーライダー問題、Sasaki et al.）

第7章では、アルティメイタムゲームをプレイする集団に多様な戦略が中立的に漂着する可能性があることを示している。人間の戦略の異質性を説明するこれまでの試みは、集団における戦略の正確な頻度分布を説明する何らかの変数を明らかにすることに焦点を当ててきた（Manapat et al.）第7章は、より簡潔な説明を提供する。不公正な申し出を拒否することが有利であれば（第5章を参照）、他の戦略は自由に集団に流れ込むことができる。母集団の十分な部分集合が、コストのかかる罰という最適な戦略を持っている限り、最適でない戦略は罰されない。中立的なドリフトが許される場合には、母集団の度数分布の関数を定義する必要はない。

最後に、第8章では、医療組織における小さな非効率性が、情報の部分的な難読化を生むことを示す。完全な世界では、情報の透明性は常に患者ケアにとってより良いものである。このため、内部告発の普及を提唱する政策が求められている（Ramirez, 2007; Eaton and Akers, 2007; Callahan and Dworkin, 1992; Bolsin et al., 2005; Faunce, 2004; Watson and OConnor, 2015）。しかし、医療機関の複雑さが、医療機関の政策遵守能力にどのような影響を与えるかについては、研究が始まったばかりである（Mannion and Davies, 2015; Jones and Kelly, 2013）。これまでのところ、政策の結果に関する理論的シミュレーションは、ヘルスケア分野では皆無に等しい（Pitt et al.）私たちは、情報の難読化が、施設内の小さな非効率性を考慮した上で、患者ケアの改善につながる可能性があることを示している。この問題を認識することで、実務と政策が統合され、患者ケアが改善されることが期待される。

9.3 限界と今後の課題

存在証明は存在を証明しない：経験的な検証が必要である

ここで紹介した研究は理論的なものである。検証可能な知識を欠くことは、様々な文脈で有利になり得るという考え方の存在証明として成り立っている。さらに、人間の行動バイアスに関するいくつかの未解決の疑問は、確かな情報が行動選択に不利に働くという考え方を真剣に検討することで解決できることを示している。もちろん、この研究はこれらの答えが人間の行動の原因であることを証明するものではない。この研究は理論構築であり、人間の認知に対する進化的・文化的制約を理解するための予備的なものである。人間の行動の根底にある原因を解明するためには、さらなる実証的検証が必要である。例えば、第4章で示したように、インパクト・バイアスはエラー・マネジメント効果により、ノイズの多い環境では有利である。重要なことは、これはインパクト・バイアスに選択的圧力があったことを証明するものではない。しかし、経験的証拠の現状を考えると、もっともらしい説明である。

将来的には、インパクト・バイアスに関する既存の説明を比較するために、経験的検証を行うべきである。現在、インパクト・バイアスを説明する理論は2つある。私の持論は、インパクト・バイアスは意思決定の動機付けに有利であるという最近の仮説に近い（Morewedge and Buechel, 2013; Greitemeyer, 2009）。もう1つの仮説は、測定された効果はほとんど平均値への回帰であり、時間が経てばすべての感情体験が無害なものへと移行することを個人が予測するのは苦手である、というものである（Levine et al.）私の知る限り、この2つの理論を明確かつ実証的に検証した者はいない。このような実証的な検証は、理論を発展させるだろう。

個人の一生に可塑性はあるのか？必要な実証的検証

この研究のほとんどは、進化論的な時間枠で論じられてきた。先に述べたように、これは私の議論が本質的に進化論的だからではない。進化的アルゴリズムは、頻度に依存する環境において有利な戦略を発見するのに特に有用である（Alexander, 2009）。シミュレーテッド・エボリューションは単なる学習メカニズムであり、生涯にわたって適用することも、生涯の中で適用することもできる。

将来的には、実証的な研究によって、個体が一生の間にこの研究で示されたダイナミクスに敏感に反応するかどうかを診断する必要がある。例えば、第4章では、予測不可能な環境ではインパクト・バイアスが有利であることを示した。このバイアスは進化的な時間枠の中で、あるいは生涯のうちに学習される可能性がある。将来の実証的研究では、環境の予測可能性に基づいて個人が感情予測を調整するかどうかを検討することができるだろう。

自己欺瞞は確かな知識の欠如とどのように関係しているのか？

もう一つの未解決の疑問は、自己欺瞞は、確かな知識を欠くことが適応的である文脈とどのように関係しているのかということである。第2章では、適応的無知は少なくとも、自己欺瞞の進化に必要な条件であると論じている。さらに、確かな知識を欠くことと自己欺瞞は同じ現象だと考える人もいる。

もしこの2つの考え方が同一であると考えるのであれば、この疑問は無意味であり、今回の研究は自己欺瞞が進化上どこでも実現可能であることを示している。しかし、もし真実の情報が欠けていることが自己欺瞞の必要条件だとしたら、自己欺瞞の選択的圧力を媒介する他の変数は何だろうか？繰り返しになるが、将来的には、理論と経験的データの整合性を高める必要がある。少なくとも、今回の研究は、自己欺瞞の必要条件の一つが（少なくとも理論的には）広く浸透していることを示している。

9.4 適応的無知に共通する環境の特徴

この仕事のために調査を始めた当初は、自己欺瞞を有利にし、真実の知識を欠くことにつながる共通の環境的特徴を明らかにすることに焦点を当てるつもりだった。しかし、この課題に取り組むにあたり、適応的無知に関する一般理論を検証するには、文献があまりにも未熟であることに気づいた。その結果、本研究では、真実の知識を欠くことのプレッシャーを生み出す環境のタイプを分類することは試みていない。むしろ、この研究はデータ収集の段階である。真実の知識を欠くことが有益である新たな文脈を発見することで、適応的無知に必要な共通の環境的特徴を説明する一般化された枠組みを形成しようとする際に、より多くのデータポイントが利用可能になる。

とはいえ、自己欺瞞、誤信念、認知バイアスの進化に必要な環境的特徴を分類しようとする文献の現状について、簡単な議論を含めることは重要だと思う。第2章で述べたように、必要な環境的特徴の分類を試みたものはいくつかある。Haseltonら(2015)は、認知バイアスはヒューリスティクス、エラー管理効果、実験的人工物のいずれかによって引き起こされることを示唆している。McKayら(2009)は、誤信念を必要とする唯一の有利な現象は、楽観主義から生じる健康上の利益であると主張している（例えば、Taylor and Brown, 1988; Creswell et al., 2007; Sharot, 2011）。ChanceとNorton(2015)は、自己欺瞞の適応的性質を要約し、自己欺瞞は他者を欺くため、社会的利益を得るため、あるいは心理的幸福を高めるために有益である可能性があると指摘している。対照的に、von Hippel and Trivers (2011a)は、自己欺瞞は他者を欺くためにのみ有益であると主張している（社会的利益を得ることもこの旗印に該当するが、von Hippel and Trivers, 2011aを参照）。

適応的無知は誤った意思決定ルールを必要とする

私は、Steven Pinkerがこの混迷を解き明かす手助けをしてくれると信じている。ピンカー(2011)は、可能な限り、意思決定を行う際には常に確かな知識を用いるべきだと主張している。ピンカーはその主張を明確にするために、意思決定プロセスを2つの部分に分けている。まず、意思決定に使われる情報がある。この情報は正確であるかもしれないし、そうでないかもしれない。第二に、その情報を利用した意思決定ルールである。もし、自分の知識と意思決定ルールのアマルガムが悪い行動をもたらすのであれば、情報と意思決定ルールのどちらかを変更することで、行動の選択を改善することができる。ピンカーは、もし選択肢があれば、真実の知識を保持したまま決定を変更する方が常に良いと主張する。

ピンカーは、意思決定ルールと情報を区別することで、真実の情報を無視することが適応的である多くの事例を説明している。意思決定ルールが変更できない、あるいは変更されない状況では、偏った情報が有利に働くことがある。例えば、情報が多ければ多いほど、より悪い意思決定が生じるといったless-is-more効果がある（Czerlinski et al., 1999; Todd and Gigerenzer, 2000）。この例として、認識ヒューリスティックがある（Goldstein and Gigerenzer, 1999）。アメリカ人とドイツ人の学生に、サンアントニオとサンディエゴのどちらが人口が多いかを尋ねると、ドイツ人の方がアメリカ人よりも良い結果を出す（Goldstein and Gigerenzer, 2002）。これは、学生が認識ヒューリスティックを判断ルールとして使っているためだ。興味深いことに、より多くの都市が認識されるため、情報が多いほどこのルールの成績は悪くなる（Gigerenzer and Goldstein, 1996）。ドイツの学生はより少ない情報しか持っておらず、彼らが認識する選択肢は最大の人口と高い相関があるため、彼らはアメリカの学生よりも優れている（Gigerenzer and Brighton, 2009, Gigerenzerの研究の素晴らしいレビューについてはBoudry et al.）

アメリカ人学生が得点を伸ばそうとする場合、1.情報を忘れ、認識判断ルールを採用するか、2.判断ルールを変更するかのどちらかである。明らかに、ピンカーは（そして他のほとんどの人も）オプション2の方が良いと主張するだろう。興味深いことに、誤りを犯しやすい意思決定ルールが適応的無知の余地を生み出すという考え方は、ここで紹介する研究の多くを説明しているのかもしれない。

現在の研究を分類する

第3章で得られた知見を考えてみよう。価値同族性の高い環境では、真実の情報を使わないことが適応的である。しかし、真実の知識を持つことは有害ではなく、他者と協力するかどうかを決定する際にそれを用いる場合にのみ有害である。検証的な情報を所有することも使用することも最適ではないので、エージェントは2つの方法で行動を改善することができる。次のいずれか： 1.)常に自分が持っている情報を使うが（決定ルール）、社会的な情報（偏った情報）のみを探し求めるか、2.)常に確かな情報を探し求めるが（偏った情報は使わない）、いつ使うべきかは知っている（決定ルールの変更）。

第8章では、ある特定の状況下では、内部告発における情報の難読化と躊躇の混合が患者ケアを改善する可能性がある。意思決定ルールが常に内部告発をすることであるならば、情報の透明性を下げる（情報を偏らせる）ことは有利である。しかし、内部告発すべきでないケースを考慮するように決定ルールを変更すれば、情報の透明性は再び最適となる。

第4章では、個人が過去の経験に基づいて行動の価値を定義すると仮定する。世界は予測不可能であるため、過去の経験値にバイアスをかけることが有利である。この場合も、2つの方法がある。意思決定ルールは保持したまま、過去の経験の記憶を変える。人間の被験者がそうであるように（Morewedge et al.）あるいは、騒がしい環境では、自分の感情体験にバイアスをかけることが重要であると認識することもできる。この場合、その人は自分の感情体験を正確に思い出すことができるが、その後、行動選択の前にそれを偏らせることができる。

最後に第6章では、意思決定ルールを変更することで、必要とされる情報の種類がどのように変わるかを示す。もし意思決定ルールが、最小許容オファー（MAO）を下回るオファーを常に高額で罰するというものであれば、シミュレーション進化は有利なMAOを見つける（第5章参照）。しかし、2次フリーライダー問題（Sasaki et al., 2015; Boyd and Richerson, 1992）のような他の要因によって、この決定ルールが制限される場合がある。このような状況において、第6章は、混合戦略が発生する可能性がある理由を示している（Krasnow et al.）混合戦略は、50%のゲームにおいて不利益なオファーを受け入れることを厭わないものであっても、適応的であることを証明することができる。エージェントが最適な決定ルールを使用するための最適なMAOを見つけることができない場合、個人は優位に立つためにそれほど多くの情報を必要としないので、混合戦略をとるかもしれない。

先行研究を分類する

確かな知識を欠くことの利点を分類するいくつかの過去の試みは、適応的無知は誤った決定ルールを必要とするという考えによって単純化することができる。Haseltonら(2015)は、認知バイアスはヒューリスティクス、エラー管理効果、または実験的人工物によって生成されると主張している。これらのカテゴリーは、誤った意思決定ルールという旗印の下にまとめられる。まず、ヒューリスティックは誤りやすい意思決定ルールと定義される。第2に、エラー管理効果によって引き起こされる認知バイアス（第4章で目撃されたものなど）は、自分の意思決定ルールを変えることによって取り除くことができる（McKay and Efferson, 2010）。エラー管理効果に気づいていれば、（上述したように）情報ではなく、意思決定ルールを変更することができる。最後に、Haseltonら(2015)は、実験が自然環境からかけ離れているため、認知バイアスにつながる実験があることを示唆している。しかし、これはヒューリスティクスと同様の議論であり、意思決定ルールを変更することで説明できる。個人は特定の実験デザインを目撃したことがないため、行動選択のために最適とは言えない決定規則を使用する。もし特定の実験で行動するための最適な意思決定ルールを知っていれば、最適な行動をとることができる。

von Hippel and Trivers (2011a)は、自己欺瞞が対人欺瞞を増大させると論じている。個人は自分自身を欺くことで、欺瞞発見の限界を利用することができる。別の例では、楽観的になりすぎると、病気から回復する割合が高くなる（Taylor and Brown, 1988; Creswell et al., 2007; Sharot, 2011, McKay et al.）この根底にある理由はまだ解明されていない。最後に、第7章では、集団の一部分の戦略が彼らを罰することから守っている限り、無知な戦略が集団に漂着する可能性があることを示した。

決定ルールの変更は必ずしも実現可能でも望ましいものでもない

Pinker (2011)は、意思決定ルールを変更することは、情報を偏らせることよりも常に優先されると主張し、強硬な立場をとっている。しかし、私はそうは思わない。適応的無知を生み出す文脈の多くにおいて、誤りを犯しやすい意思決定ルールが原因であるとしても、意思決定プロセスを変更することは実行可能でも望ましいことでもないかもしれない。

時間的制約が情報収集能力を制約するように（Simon, 1972, 1991）、最良の意思決定ルールを導き出すことは自明でない可能性が高い。複雑な自然環境におけるベイズ推論は実行不可能であることはよく知られている（Marshall et al.）このため、Fawcett et al. (2014)は、単純な、時には脆弱な決定ルールにつながる環境のタイプを分類した。彼らは、不確実性、自己相関、異質性、状態依存性がある環境では、人間の偏った様々なヒューリスティックが生態学的に合理的であると論じている（Fawcett et al.）

ベイズ推論が採用できるとしても、自然で複雑な環境では、単純なヒューリスティックが「合理的な」ベイズ更新（Lee et al., 2002）や重回帰（Czerlinski et al., 1999）を上回ることが多い。より複雑な学習メカニズムは、関数をデータにマッピングすることに長けているが、常に変化している世界では、予測をオーバーフィットさせることが多い(Gigerenzer and Brighton, 2009)。その結果、より統計的な手法に比べ、単純なヒューリスティックの方が未来を予測するのに適していることがわかる。そのため、これらのヒューリスティックは適応的無知を許してしまうという弱点があるかもしれないが、長い目で見れば、ヒューリスティックを保持する方が良いのかもしれない。

最後に、進化は盲目の番人である。もし意思決定が、意思決定ルールによって、あるいは偏った知覚によって変えられるとしたら、進化がどちらの道を選ぶかはまだ予測できない。意思決定ルールの可鍛性が適応的無知にどのような影響を与えるかを認識するためのさらなる研究が、認知の足場についての洞察を提供するかもしれない。

9.5 結論

人間は意思決定をする際、様々な文脈で真実の情報を偏らせたり無視したりする。本研究では、このようなバイアスが適応的でありうることを実証することで、いくつかの放置された科学的疑問に答えた。協同社会、予測不可能な環境、投資市場、非効率的な制度などをナビゲートする上で、確かな知識を欠くことは有益である。これらの研究の価値は多面的である。何よりもまず、これまで混乱していた人間の行動に究極的な説明を与えてくれる。第二に、どのような場合に個人が真実の情報を無視して自己欺瞞を行うのか、より一般的な説明のヒントを与えてくれる。意思決定の根底にある力を推論する上で重要な課題が残されている一方で、この研究は、個人が無知の価値につまずく可能性のある環境がどこにでも存在することを示している。

2024年4月
日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

要約

謝辞

目次

1 はじめに

1.1 テーゼ

1.2 動機

人は誤った情報で意思決定を行う

真実の情報が無料であっても、人は偽の情報で決断を下す

人々は自分が真実の情報を無視していることに気づいていない

1.3 そのような行動は機能的か？

確かな情報を無視することは犠牲を伴う

確かな情報を無視すると有利になる

偽情報の進化的利点

自己欺瞞の進化

障害より多くのデータが必要

1.4 テーゼ確かな知識の欠如は偏在的に適応的である

1.5 手法の概要適応的戦略

定義確かな情報

周波数依存環境と独立環境

進化的アルゴリズム頻度依存の環境をテストする

進化的アルゴリズムの例を以下に示す：

表現

1.6 各章の要約

文献レビュー

2. インパクト・バイアスの進化：ノイズの多い環境における選択のための感情予測の最適化

高価な処罰戦略の異質性は適応的である

考察と結論

2 文献レビュー

2.1 定義

2.1.1 誤信、誤った信念、戦略的に間違っていること

2.1.2 欺瞞

意図的な定義

機能的定義

2.1.3 自己欺瞞： 哲学的ソワレ

意図論者

動機づけ論者

2.1.4 機能的説明はどこにあるのか？

遠隔機能的アプローチ

進化論はダイナミック・パラドックスに役立つか？

進化論はねじれた自己欺瞞に役立つか？

2.1.5 まとめ

2.2 自己欺瞞の進化に関する既存の理論

2.2.1 誤信の進化と戦略的に間違っていることの定義

2.2.2 心理的利益

支持 ポジティブ・イリュージョンの個人内利益

支持 心理的防衛機制

支持 恐怖管理理論

支持 自己シグナリング

反対 自尊心は（せいぜい）社会的向上への中間ステップである

反対 神経学的傷害は病理以外のことを解明しないかもしれない

2.2.3 トリバース 自己欺瞞は対人欺瞞を強化する

情報処理バイアスとしての自己欺瞞

裏付けとなる証拠

反対 長期的な関係において欺瞞は通用しない

反対 人はひどい嘘発見器である

反対 哲学的問題

反対 なぜ誤信念の進化論的利点を考慮しないのか？

2.2.4 誤信の進化

ヒューリスティクス／生態学的合理性／適応的合理性

ノイズの多い自己相関環境

エラー管理の効果

戦略的に間違っていることの進化：対人欺瞞

ほとんどの偏った行動は誤った信念を必要としない

反対 情報ではなく意思決定ルールを変える

2.3 まとめ

2.3.1 私たちは何について話しているのか？

2.3.2 大きな意見の相違が残る

2.3.3 その場限りのカテゴリー化

2.4 自己欺瞞の進化に必要な条件

2.4.1 必要条件1：自己欺瞞の行動は利点を提供しなければならない（あるいは、少なくとも不利点を提供しなければならない）

2.4.2 必要条件2：自己欺瞞が誤った信念を持っている

2.4.3 必要条件3：誤信念は適応行動を促進しなければならない

2.4.4 動機づけ主義は脱落する

2.4.5 意図主義者の条件

2.4.6 理論家の要求

2.4.7 誤信と戦略的に間違っていることの条件

2.4.8 まとめ

2.5 信念の進化可能性を分析することの難しさ

2.6 前進する。偽情報を使うことの進化

2.7 結論

1　はじめに

2　文献レビュー

2.1.3 自己欺瞞：哲学的ソワレ

支持　ポジティブ・イリュージョンの個人内利益

支持　心理的防衛機制

支持　恐怖管理理論

支持　自己シグナリング

反対　自尊心は（せいぜい）社会的向上への中間ステップである

反対　神経学的傷害は病理以外のことを解明しないかもしれない

2.2.3 トリバース　自己欺瞞は対人欺瞞を強化する

反対　長期的な関係において欺瞞は通用しない

反対　人はひどい嘘発見器である

反対　哲学的問題

反対　なぜ誤信念の進化論的利点を考慮しないのか？

反対　情報ではなく意思決定ルールを変える

3　価値観の同類性は協力に利益をもたらすが、誤った社会情報を用いる動機となる

表31：一次規範エージェントは、受け手の評判に関係なく、協力するアクションを実行することで良い評判を受ける。エージェントは協力しなかった場合、悪い評判を受ける。

3.6.2 VDISCの安定性：単純化された分析モデル

4　インパクトバイアスの進化：ノイズの多い環境における意思決定のための感情予測の最適化

4.4.1 モデル1a：予測可能な環境

4.4.2 モデル1b：予測不可能な環境

5　信頼は、部分的な情報とパートナーの選択が与えられた場合に、高価な罰を媒介する