議論の正当化という錯覚

The Illusion of Argument Justification

www.ncbi.nlm.nih.gov/pmc/articles/PMC3735824/

Published online 2013 Mar 18

マシュー・フィッシャー、フランク・キール

概要

議論は、新しい理解に到達するための重要な手段である。議論のある問題を扱うときによく見られる、ある問題に対する強い関心が、議論のバイアスにつながることが示されている。我々は、人は議論を通して自分の立場を正当化する能力を評価する際に、十分な調整ができないことを示唆している。この効果を我々は「議論正当化の幻想」と呼んでいる。さらに、問題を気にしていると、この内省的な判断がさらに鈍ることもわかった。

我々はまず、自分の立場を正当化するための議論を行う前と行った後の評価の違いを測定することで、この錯覚を示した。この錯覚の強さは、ある問題に対する関心の強さによって予測される（研究1）。フレーミングやプライミングによる暗黙の影響は、トピックへの感情的な投資の効果を上書きしない（研究2）。

しかし、反論を明示的に考慮することで、自分の立場を正当化する能力を最初に評価する際に、ケアの効果を取り除くことができた（研究3）。最後に、最近の他の研究に照らし合わせて、今回の結果を考察し、集団推論の潜在的な利点について述べている。

はじめに

意見の相違は、我々の日常生活において避けられないものである。我々は意見を形成し、どちらかの立場に立ち、自分の見解を主張する。幼い子供が「どのおもちゃが一番いいか」と話していても、一流の知識人が複雑な技術的立場を正当化していても、議論は人間関係の重要な部分を占めている。重要な問題に対する意見の裏付けとなる議論が健全であるかどうかを知るためには、作り出せる議論の質が一つの重要な要素となる。本研究では、人は議論のあるテーマについて自分の立場を正当化するための質を過大評価するという「議論正当化の幻想」を提案する。また、感情的な投資は、議論の強さの初期評価と実際の説得力の間に大きな差をもたらすという証拠を示した。我々は、暗黙の介入によってこの錯覚を打ち消すことを試み、さらに代替的な視点を明示的に検討することが、議論の弱体化につながることを示した。

我々は、個人的な立場に対する議論の質の正確な判断が容易にできるかどうかに興味がある。このようなメタ認知能力は、議論がどのように理解され、どのように関与されるかについての洞察を与える可能性がある。もし人々が自分の意見を正当化する能力を予測するのが苦手であれば、議論に参加する際に準備ができていないのではないかという懸念を示すことになる。我々は、議論に関わるすべての要因を網羅することを目的としていないが、本研究では、議論を通して聴衆に正当化する能力の内省的な正確さに焦点を当てている。自己評価やメタ認知に関する他の研究によると、このような自己評価は深刻な問題を引き起こす可能性がある。人は、将来の出来事の感情的な影響を過大評価し(Wilson er al 2000)、自分は平均以上であると認識し(Alicke er al)。 1995; Dunning er al 2003; Heady & Wearing, 1987)、タスクを完了するのにかかる時間を不正確に予測する(Kahneman & Tversky, 1979; Buehler, Griffin, & Ross, 1994)。より一般的には、人には「バイアスの盲点」と呼ばれるメタバイアスがあり、他人には認知的・動機的バイアスの影響が見られても、自分には見られないという特徴がある(Pronin, Lin & Ross, 2002)。この盲点は、内省を重視すること(Pronin & Kugler, 2007)や、自分の主観的な解釈を現実の真実と見なす傾向であるナイーブリアリズム(Griffin & Ross, 1991)によって支えられている。現象を説明する民間理論は驚くほど不完全で(Wilson & Keil, 1998)、人々は自分の理解が深まっていないことに気づいていないことが多いのである。論証に関する推論の文脈では、感情的な投資が、論証によって自分の立場を正当化する能力に関する自己評価に影響を与える可能性があると考えている。

感情的な投資は、客観的な自己検証を妨げるため、論証の自己評価は特に難しいかもしれない。論証とは、特に議論の余地のある問題を扱うもので、説明とは質的に異なる。議論は感情や価値観と深く結びついていることが多い。そのため、どちらも説明的な要素を持っているにもかかわらず、感情や価値観が、説明に対する自己評価よりも変調をきたすことが予想される。

議論の強さの認識は、様々な要因によって変化する。関与度が高いほど態度は強くなる。例えば、参加者が公に意見を表明することを約束すると、意見はより極端になる(Jellison & Mills, 1969)。態度のコミットメントは、確実性、変化の可能性、極端性によって測定され、その態度に基づいて行動する意図、態度の偏り、反対意見への抵抗、偏った精緻化の増加と関連している(Pomerantz er al)。 1995)。同様に、態度の重要性、態度の価値観の代表性、自己概念との関連性などの尺度を含む態度の包摂性は、客観的な精緻化と有意に関連するが、特に自分の態度に反対する議論に対する偏った記憶とも関連する。また、このような強い態度は安定している傾向がある。態度の重要性が高いほど、時間の経過とともに変化する可能性は低くなる(Krosnick, 1988)。また、態度へのコミットメントは、価値観と直接結びつくことで強化されることもある(Kristiansen & Zanna, 1988)。さらに、規範的に重要な価値観を考慮すると、個人的にはあまり関係のない問題であっても、より多くの処理が行われ、態度が強化され、反対の議論に対する抵抗が生じる(Blackenship &Wegener, 2008)。このように、ある問題に強い関心を持つことは、いくつかの方法で態度を偏らせる可能性がある。

感情的な投資は、人々が議論をどのように見るかにも影響する。ある研究では、参加者は、7つの問題について賛成派と反対派の議論の強さを評価した後、無作為に選んだ議論の一部に短い文章で答えるという思考リスト作成タスクに参加した(Edwards & Smith, 1996)。参加者は、問題に対する感情の評価に基づいて、感情的確信度が低い群と高い群のいずれかに分類された。ある問題に対する感情的確信が高い参加者は、感情的確信が低い参加者に比べて、対立する議論を著しく弱く評価し、より多くの全体的な議論を行い、対立する意見を弱めるためにより多くの冗長な議論を行った。このような感情的な投資によるバイアスは、実際に首尾一貫した議論を展開する能力に対する人々の評価を高めてしまう可能性がある。特に、自分の議論に冗長性があることを完全には認識しておらず、詳細やサポートがないところを誤って見てしまうような場合には、そのような可能性がある。そこで我々は、ある問題に関心を持てば持つほど、議論が正当化されるという錯覚が強くなるという仮説を立てた。皮肉なことに、気遣いや投資は、より大きな知的投資や理解につながると考えられるが、より顕著な効果は、単にそのような能力を持っていると錯覚しているだけかもしれない。

現在の研究の概要

議論を通して正当化する能力を自己テストするには十分な時間が必要である。議論の正当化の錯覚の可能性を測定する一つの方法は、参加者の自分の能力に対する評価が時間の経過とともにどのように変化するかを観察することである。そのために、我々は、説明的深さの錯覚（IOED）に関する先行研究で使用された、時間を考慮した測定法を採用した（Rozenblit & Keil, 2002）。IOEDの研究手順では、被験者は、一連の装置や現象に対する理解度を、どの項目でも間を空けずに最初に評価する。そして、その中の一部の項目について説明を書き出したところ、参加者の理解度は有意に低くなった。このような経時的な効果は、他の知識ではなく、説明に対して見られた。このことは、錯覚が一般的な自信過剰によるものではないことを示唆している。さらに、IOEDは幼児ではさらに強く、したがって、基礎的な認知バイアスであると思われる(Mills & Keil, 2004)。他にも、IOED研究の方法論を用いて、政治的意見の相違のような一般的な論争のテーマを調査している人もいるが(Alter, Oppenheimer, & Zemla, 2010; Fernbach et al, in press)、我々はこの方法を、この種の問題に対する自分の立場を議論によって正当化する能力についての人々の判断に適用した。

我々は、議論の正当化の錯覚や感情的な投資の影響を減らすことができるような介入に興味があり、より暗黙的と考えられる影響と、他の首尾一貫した視点を取ることに焦点を当てたより明示的な影響の両方を探った。暗黙的な影響は、偶発性の評価や神への信仰の報告など、さまざまなタスクに大きな影響を与える。(Tversky, & Kahneman, 1981; Shenhav, Rand, & Greene, 2012)。研究2では、タスクを再構成し、内省的な思考を促すような暗黙的な影響を利用する。研究3では，代替的な視点を考慮することが，客観的な自己評価に与える影響を調べた。一般的な説明とは異なり、議論には同じ問題に対する対立する立場が含まれており、しばしば対立しない複数の視点が存在する。そのため、1つの仮説しか検討しないと、自信過剰になってしまう。参加者に「客観的で偏りのない」ことを明示しても、このバイアスをなくすことはできない(Lord, Lepper & Preston, 1984)。しかし、他の可能性のある仮説を考慮に入れ、明確にすることで、一つの説明に頼りすぎることを防ぐことができる。(Gettys, Mehle & Fisher, 1986; Brem & Rips, 2000)。このように、客観性を高めるためには、「反対のことを考える」ことが重要であり（Lord, Lepper, Preston, 1984)したがって、議論が正当化されているという錯覚は、人々が積極的に別の視点を取り入れることを怠った場合にのみ生じると予測される。

人は議論を生成し、不確かな証拠を無視することに長けているかもしれないが、人が議論を通じて正当化する能力をどの程度過大評価しているかは調査されていない。このような誤りはコストがかかる可能性がある。重要な問題を考えているとき、自分を省みると、実際には表面的な理解しかしていないにもかかわらず、根底にある議論を十分に理解していると思い込んでしまうことがある。政治のように、議論が最終的に重要な公共政策につながるような分野では、議論がどの程度理解されているかを知ることは特に重要だと思われる。

我々が、これから行う議論の質を正確に評価しているかどうかは、未解決の問題である。しかし、他のメタ認知の不正確さに基づいて、我々は、正当化の錯覚があると予測する。つまり、人々は、実際に議論を明確にする前に、議論を通して他人に正当化する能力を過大評価するのである。さらに、ある問題に深く感情移入すると、議論の正当化の錯覚が大きくなると予測している。

研究1a

まず、一般的な論争のテーマについて、議論の正当化の錯覚を検証した。また、話題への関心度の高さが、予測と議論の質の自己評価の違いに対応するかどうかを調べた。

研究方法

参加者

社会科学分野の研究で有効な参加者プールであるAmazonのMechanical Turkを利用して，成人の参加者118名（女性62名，男性56名，Mage=35.58，SD=12.70）にアンケート調査を実施した（Rand, 2012）。参加者は全員，米国在住であった。

調査方法

参加者は、議論を評価する能力に長けていることが知られているが（Mercier & Sperber, 2011)さらに、議論の根拠を理解した上で、問題に対する自分の立場をどれだけ正当化しているかに基づいて議論の質を7段階で評価する簡単なトレーニングを受けた。参加者は、米国における原子力発電の利用について、ランダムに並べられた3つの議論を読み、評価した。これらの議論の相対的な強さは、過去に行われた規範化によって決定されていた。参加者は、いずれかの論点を誤って判断した場合にはフィードバックを受け、各論点を正しく評価するまで続けることはできなかった。次に参加者は，第二次世界大戦において米国が日本に原子爆弾を投下したことに反対する，無作為に並べられた3つの議論を読み，評価した。最終的な分析には、2番目の議論の評価が十分に正確であった参加者のみが参加した。参加者は、3つの評価が議論の平均評価から 1標準偏差以内に収まる場合に参加資格を得ました。このスクリーニング手順により，尺度の適切な使い方を十分に理解している参加者だけが分析に参加することができた。この基準により、議論の強さを正しく認識できる参加者だけが残ったと考えられる。今回の実験では、議論の強さを正しく評価できないことを検出することを目的としているため、すでにそのような傾向が見られる参加者を除外することは、我々の仮説に反することになる。分析の条件を厳しくしないで実施しても、3つの研究で同じような結果が得られた。

トレーニング終了後、参加者は20の議論のあるテーマについて考え、議論の根拠を理解して自分の立場をどれだけ正当化できるかを評価した（時間1評価）。評価は、1（非常に悪い）から7（非常に良い）までの7段階で行った。問題を提示する順番はランダムにした。参加者は、どの項目でも過度に間を空けないように指示を受けた。間を空けてはいけない」という指示は、最初の印象だけを聞き出し、その時点で議論を起こそうとすることを阻止するためのものである。

次に、これまでに評価した4つの問題について、自分の立場をできるだけ質の高い議論として書き出すように指示された。さらに、質問に答えるために外部の情報源を使わないように言われ、ウェブサイトやその他の情報源から情報をコピーすると、実験に参加できなくなることを知らされた。参加者がネット上の資料をコピーしていないと確信したのは、彼らの回答が、インターネットの検索エンジンを使ってトップサイトで見つけられる議論と一致しなかったからである。また，Mechanical Turkの参加者は，可能な限り時間効率のよい方法でタスクを進めるよう強く動機づけられているため（Rand, 2012），回答を調べたり，回答から要約を作成したりするために，より長い時間を費やすことはないという強い動機づけがある．各参加者は、「地球温暖化の重大な原因としての人間の活動」、「アメリカの国民皆保険制度」、「神の存在」、「がんのリスクにつながる携帯電話の使用」、「マリファナの合法化」、「石油やガスを採掘するための水圧破砕の使用」、「幹細胞研究」、「死刑」の4つのテーマからランダムにサブセットを受け取った。参加者は、自分の立場を示す4つの論点をそれぞれ書き出した後、論点の根拠を理解することで、自分の立場をどれだけ正当化できるかを評価した（時間2の評価）。トピックの順番はランダムにした。なお、時間1の質問と時間2の質問は、まったく同じ言葉を使った。

次に、感情的な投資の指標として、参加者は、20の論点のそれぞれについて、どれだけ強く関心を持っているかを、1（まったく関心がない）から7（非常に関心がある）までの7段階で評価した。最後に、参加者は年齢、性別、教育レベル、大学での専攻（該当する場合）を報告した。

結果と考察

トレーニング項目への回答から 23名の参加者を除外し、残り95名の参加者の回答のみを分析した。

予測通り、参加者は自分の立場を主張する際、質の高い議論を提示する能力を不正確に評価した。各参加者のすべてのトピックを平均すると、ペアサンプルt検定では、最初の評価（M=4.40 SD=1.20）から議論を書き出した後の評価（M=3.72 SD=1.36）への有意な低下が見られた、t(94)=5.95, p<.001。このように、論争のテーマに対する立場を正当化する能力を予測する際には、議論の正当化が錯覚されることになる。次に、感情的な投資が錯覚の強さに影響するかどうかを調べるために、気遣いの強さの評価を分析した。

気遣いの報告は、参加者の最初の評価と一貫して相関していた。平均的な気遣いと平均的な予測評価の間には、有意な関係が見られた（時間1）。これは、トピックを気にかけている参加者は、トピックをあまり気にかけていない参加者よりも、議論を正当化する能力を最初に評価していることを示している。参加者は全20回のタイム1判定を平均114.77秒で完了したため、自分の主張を明示的にシミュレーションすることはできなかった。

また、「気遣いの強さ」は、評価点（Time 2）と一貫して正の相関があり、r(93)=.38 p<.001となった。この結果は、参加者がより個人的にその問題に関心を持っているときには、自分の議論に対する批判が少なくなることを示唆している。つまり、自分の主張を書き出した後でも、その問題に関心のある人は、関心のない人よりも自分の主張を好意的に判断していたのである。

研究1b

気遣いの少ない参加者が低い評価を報告したのは、実際に自分の立場を主張するために弱い議論をしたからだと言えるかもしれない。研究1bでは、独立した評価者に議論の質を評価してもらうことで、研究1aでの評価の正確さを検証する。もし、独立した評価者が、参加者の気遣いが低いほど議論の質が下がることを示すならば、参加者は自分の議論の質を正確に報告したことになる。しかし、もし評価者が議論の質を気遣いのレベルに関係なく一貫して判断するならば、研究1aの気遣いと評価の相関は、トピックへの気遣いが強い人が議論の正当性を最も大きく錯覚し、自分の議論の弱さを認めないことで、自己評価の精度が最も低いことを示していると解釈できる。

方法

参加者

27名の成人被験者（女性16名、男性11名、Mage=35.81,SD=13.42）が、AmazonのMechanical Turkを利用してオンラインで調査を行った。参加者は全員、米国に住んでった。評価者は原著者と同じ人選であり、評価の違いは特別な資格や専門知識によるものではない。

評価方法

参加者はまず，研究1aの参加者と同じように尺度の使い方を理解してもらうために，以前の研究で使用した尺度トレーニングのバージョンを受けた。参加者は、独立したサンプルによって作成された36の議論のセットを無作為に見て、議論の根拠を理解することで、問題に対する立場をどれだけ正当化しているかに応じて、議論を評価するように求められた。これは、研究1aの参加者が時間1と時間2の両方で回答した質問とまったく同じものであった。参加者が書いた各論は、少なくとも7人の独立した審査員から評価を受けた。

結果と考察

研究1で作成された議論をペアサンプルt-testで分析した結果、独立した審査員は参加者（M=4.03, SD=1.52）よりも議論を低く評価した（M=3.31, SD=1.06)t(35)=3.89, p<.05。研究1aでは、時間1と時間2の評価の間に有意な低下が見られたが、参加者は依然として自分の議論を不正確に評価していた。参加者は、自分の議論に対する評価の限界を認識した後でも、独立評価者の評価よりも有意に高い評価をしていた。

次に、独立評価者のスコアと参加者のケア評価の関係を分析し、トピックへの関心が高い参加者ほど質の高い議論をしているかどうかを調べた。有意な相関は見られず、r(34)=.12 p=.49となり、論点への関心の高さがより良い議論につながるわけではないことが示唆された。つまり、自己評価と他者評価の差が最も大きかったのは、トピックを最も気にかけていたライターだったということになる。この証拠から、感情的になっている参加者は、不正確に高い自己評価をし、その結果、議論の正当性をより強く錯覚していることが確認された。

研究1c

研究1aでは、参加者の議論の対象者を正確に指定していなかった。そのため、参加者が単に自分の議論の正当性を判断すべきだと考えているのか、それとも異種集団に対する自分の議論の説得力を評価すべきだと考えているのか、曖昧になる可能性があった（自分が考えている議論の正当性とは全く異なる可能性が考えられる）。そこで我々は、この潜在的な問題を解決するために、被験者が独立した評価者が使用したのと同じ基準で議論を評価していることを確認するよう、明確な言葉で指示した追加の研究を行った。

試験方法

参加者

1,9人の参加者（女性60人，男性49人，Mage=36.79，SD=13.51）が，AmazonのMechanical Turkを使ってオンラインで調査を行った。参加者は全員、米国在住であった。

実験方法

実験は、指示内容を変更した以外は、研究1aと同じ手順で行った。時間1の評価を行う際、参加者は次のように尋ねられた。

もし、あなたが自分の立場を他のAmazon Turk労働者のグループに向かって書くとしたら、あなたの議論は、議論の根拠を理解した上で問題に対する自分の立場をどれだけ正当化しているかによって、どのような評価が与えられるであろうか？

参加者は、4つの論証を書く前に、「論証の根拠を理解した上で、Xに対するあなたの立場を正当化してほしい」という指示を読みた。そして、第2時間目には、第1時間目に出された質問とまったく同じ質問に答えてもらった。説明書の変更以外の手順は、研究1aと同じであった。

結果と考察

24名の参加者がトレーニングに失敗したため、残り85名の参加者の回答のみを分析した。

研究1aと同様に、参加者の評価は、時間1（M=4.08, SD=1.25）から時間2（M=3.35, SD=1.42）へと低下した（t(84)=4.80, p<.001）。時間1と時間2の評価は、研究1aから研究1cまで有意な差はなかった。感情的な投資は、時間1の評価とr(83)=.42,p<.001,時間2の評価とr(83)=.25,p<.05と、再び有意な相関が見られた。この研究は、視聴者に関する曖昧さを取り除いても、結果に影響を与えないという強い証拠を示している。

以上のことから、研究1では2つの異なる効果が示された。第一に、感情的な投資のレベルに関わらず、人々は、聴衆が完全に特定されている場合でも、自分が生み出すことのできる議論の質に対して、十分な調整ができない。第二に、感情的な投資は、議論の正当性の予測と自己評価の高さに対応しており、独立した審査員の評価を通じて、最も気にしている人は最も大きな錯覚もしていることが分かった。

研究2a

研究2では、暗黙的な影響、すなわち、タスクフレーミングやプライミングから生じる操作で、参加者が他の可能性のある視点に明示的に関与することがないような操作を導入することで、錯覚や気遣いの効果を鈍らせることを試みた。我々は、研究1aで用いられた感情的な印象を和らげるために、言い回しを少し変えて課題を設定した。参加者には、議論をする代わりに、各トピックの長所と短所のリストを作成するように指示した。この変更により、非常に似た内容が生成されたが、論争の的になっている問題について個人的な立場を守るというプレッシャーはなくなった。もし、当初の効果が単に課題の敵対的な文脈に起因するものであれば、この変更されたフレーミングでは、その効果はなくなるはずである。

方法

参加者

成人73名（女性42名、男性31名、Mage=35.27,SD=11.55）が、AmazonのMechanical Turkを利用したオンライン調査に参加した。参加者は全員、アメリカに住んでった。

調査方法

研究2の手順は、参加者が議論の代わりに「長所と短所のリスト」を評価・作成することを除いて、研究1と同じであった。参加者は、研究1と同様のトレーニングを受けたが、トレーニングの内容は長所と短所のリストに再構成された。トレーニング後、参加者は20の論争のある問題を考え、それぞれのトピックについてどれだけ徹底的に長所と短所を挙げられるかを評価した。その際、「どの項目でも間延びしないように」との指示があった。次に参加者は、研究1で使用した4つの課題のサブセットの1つについて、賛否両論のリストを書き出した。次に、研究1で使用した4つの課題のサブセットの1つについて、賛否両論のリストを書き出した後、それらのトピックについてどれだけ徹底的に賛否両論のリストを作成できたかを評価した。最後に、参加者は、20の論点のそれぞれについて、どの程度関心があるかを評価し、人口統計学的情報を報告した。

結果と考察

19人の参加者が研修に参加できなかったため、残りの54人の参加者の回答のみを分析した。研究1aと同様に、時間1から時間2への落ち込みが見られた。

ペアサンプルt検定の結果、タイム1の評価はタイム2の評価（M=2.86, SD=1.38）よりも高かった（M=3.78, SD=1.36)t(53)=4.73, p<.001。さらに、賛否両論のリストの枠を設けても、ケアの系統的な効果を排除することはできなかった。ケアは、T1,r(52)=.42,p=.001およびT2評価のr(52)=.49,p<.001の両方と強く相関していた。研究2の項目と、研究1で議論として書かれた同じ項目を比較すると、全体的なケアのレベルは研究間で差がないことがわかった t(146)=.04, p=.97。

これらの相関関係から、ケア度の低い参加者は長所・短所を書き出す能力を低く評価し、ケア度の高い参加者は長所・短所を書き出す能力を高く評価していることがわかった。

研究2b

次に、時間1で不正確に高い初期判断を与えることの直感的な魅力を、暗黙のプライムを用いて中和することを試みた。改良された手順では、直観的な考え方と反省的な考え方のどちらかを促進する書き方の練習を採用した（Shenhav, Rand, & Greene, 2012）。もし、反省的な考え方をしたときに効果がなくなるのであれば、正当化の錯覚や感情的な投資の偏りは暗黙のプライムによって克服でき、首尾一貫した代替ポジションを直接比較する必要はないことを示唆している。

実験方法

参加者

本調査では、133名の成人被験者（女性61名、男性72名、平均年齢32.45歳、平均身長10.92歳）がオンラインで回答した。参加者は全員、米国に住んでった。

調査手順

研究2の手順は、研究1aと同じであるが、参加者は2つの条件のいずれかに割り当てられ、4つのプロンプトのいずれかに回答することから始めた。直感的に良い」条件では、直感的な思考を促進するために、「直感や第一感が正しい方向に導かれ、良い結果になった時」または「慎重に状況を検討した結果、間違った方向に導かれ、悪い結果になった時」を説明するように指示された。直感が悪い」条件では、指示の価値観を逆にして、参加者は反省的な思考を促す2つのプロンプトのうちの1つを見ました。どちらの条件でも、参加者は約8〜10の文章を書くことが求められた。介入の後、参加者は研究1aで報告されたのと同じ手順を完了した。

結果と考察

40人の参加者がトレーニングに失敗したため、残りの93人の参加者の回答のみを分析した。

直感が悪い」条件では、時間1（M=4.36, SD=1.08）と時間2（M=3.76, SD=1.34）の間で有意な低下が見られた t(46)=3.22, p=.002 ケア」は、T1の評価とr(45)=.63, p<.001,T2の評価とr(45)=.52, p<.001の強い相関があった。これらの相関関係は、ケアの低い被験者は自分の立場を正当化する能力を低く評価し、ケアの高い被験者は自分の立場を正当化する能力を高く評価していることを示唆している。

また、「直感良好」条件では、タイム1からタイム2にかけて低下が見られた。paired samples t-testでは、時間1の評価（M=4.12, SD=1.33）が時間2の評価（M=3.64, SD=1.30）よりも高く、t(45)=3.15, p=.003であった。また、「気遣い」は、T1の評価（r(44)=.48, p=.001）とT2の評価（r(44)=.49, p=.001）の両方と強く相関しており、条件間で有意な差は見られなかった。

これらの結果は、暗黙のプライムを用いても、議論の正当化の錯覚を克服できないことを示唆している。また、より反省的な考え方をするだけでは、錯覚や感情的な投資の影響を十分に打ち消すことはできなかった。次に、より明確な介入を行うことで、より強い効果が得られるかどうかを検討した。

研究3a

研究3aでは、代替的な視点を考慮することが、議論で正当化する能力の評価に与える影響を検証した。研究2a、2bとは異なり、参加者は他の視点を積極的に検討し、明確に表現する。百聞は一見にしかず」という言葉があるが、これは、あるメッセージを繰り返すことが、その後の評価に影響を与えることを示している（Higgins & Rholes, 1978）。議論に関する研究によると、被験者を無作為にどちらかの立場に割り当てた場合、実際の立場を主張するように割り当てられた被験者は、自分の立場を支持する議論を反対の議論よりも受け入れやすいと評価する(Greenwald, 1969)。興味深いことに、自分の立場の反対側に割り当てられた人は、後になって、問題の両側からの議論を同じ数だけ受け入れる。このように、反対の立場を「ロールプレイ」することで、議論の評価に偏りがなくなるという証拠がある。自分の立場ではなく、反対側の立場を理解しているかどうかを評価することで、ケアが議論正当化の錯覚に与える影響をなくすことができるのではないか？これが、研究3aで取り上げた主な疑問である。

研究3aでは、研究1と同様に、感情的な投資をケアの強さとして評価した。議論に対する感情的な投資が高くても、個人的な投資もあるとは限らない。これは、ある問題について反対の立場を考えるときのケースである。問題への関心は高いが、主張されている特定の立場への個人的な投資はされていない。気遣いが正確な評価を妨げているのであれば、対立する意見を述べる能力を考えるとき、参加者は自分のパフォーマンスを正確に予測することができないのと同じはずである。しかし、錯覚を起こすために個人的な投資も必要であれば、参加者は対立する意見をどれだけ正当化できるかを正確に評価するであろう。

方法

参加者

成人の参加者90名（女性52名、男性38名、Mage=34.64,SD=11.92）が、AmazonのMechanical Turkを用いてオンラインで調査を行った。参加者は全員、米国に在住していた。

調査方法

参加者は、研究1と同様のトレーニングを受けた。参加者は、20の論点について、自分の立場に対する反対意見を考え、その論拠を理解して反対意見を正当化できるかどうかを評価した。その際、「どの項目でも一時停止しないように」との指示があった。次に、研究1で使用した4つの課題のうちの1つについて、反対意見の主張を書き出した。次に、研究1で使用した4つの課題のうちの1つについて、反対意見の論拠を書き出し、論拠を理解した上で、どれだけ反対意見を正当化できたかを評価した。最後に、参加者は、20の論点のそれぞれについて、どれだけ関心があるかを評価し、人口統計学的情報を報告した。

結果と考察

22名の参加者がトレーニングに参加できなかったため、残りの68名の参加者の回答のみを分析した。

反対意見を主張する際、参加者は最初の評価と議論を書き出した後の評価の間に再び有意な差を示した。全項目を平均して、ペアサンプルt検定を行ったところ、時間1の評価（M=3.78 SD=1.20）と時間2の評価（M=3.06 SD=1.12）に有意な差が見られた。これらの結果は、参加者が相手の立場を明確に表現する能力を正確に評価できなかったことを示している。

時間1から時間2への有意な低下は依然として見られたが、これまでの研究とは異なり、ケアのレベルはもはや初期評価に影響しなかった。反対の立場を考慮することで、気遣いとTime 1の評価の関係が有意に低下することがわかった。ケアとタイム1の評価の間には相関関係がなく、相関の大きさは研究1のr(93)=.45, Zdiff=-2.05, p<.05(Preacher, 2002)1から有意に減少した。また、ケアと時間2の評価には相関がなく、r(66)=.22, p=.07であったが、相関の大きさは研究1のケアと時間2の相関r(93)=.38, Zdiff=-1.08, p=.14から有意に減少しなかった。この結果から、研究1aのようにケアとタイム1の評価に有意な関連性を持たせるためには、ケアと個人的な投資の両方が必要であることが確認された。実際にその立場を信じずに主張しても、気遣いの強さとポジティブな自己評価の間に系統的な関係は生まれない。

重要なことは、反対の立場を表明したときにケアと評価の関係が変化するのは、トピックに対するケアのレベルが低下したためではないということである。研究間で比較すると、研究1と研究2の間で、トピックに対するケアの総量には有意な変化はなかった（t(161)=.39 p=.70）。参加者は、自分の立場を考える場合に比べて、反対の立場を考える場合にも自信を失っていなかった。時間1の評価の平均値は、研究1から研究3まで低下せず、t(161)=1.60, p=.11,時間2の評価も研究1から研究3まで低下せず、t(161)=1.59, p=.113であった。

先行研究では、「ロールプレイ」によって議論の説得力が増すことがわかっているが、このように議論への個人的な投資がない場合でも、議論の正当性の錯覚が持続することがわかった。しかし、Greenwald (1969)と同様に、反対の立場を考慮することで、少なくとも部分的には感情的な投資のバイアスがなくなることがわかった。この介入は効果的であったが、参加者は反対意見を検討するだけで、自分の立場については質問されないという、かなり強引なものであった。そこで、我々は次に、ある問題に対する複数の視点を考慮する介入をテストした。

研究3b

自分と反対の意見を受け入れることで、感情的投資の偏りが軽減されたことから、次に、複数の視点を考慮する介入が同様の影響を与えるかどうかを検証する。自分の立場を支持する論証を作成する能力を予測する前に、まず他の視点を検討することで、ケアの効果を低減できるかもしれない。このような介入は、まず反対意見を紹介し、その後、参加者に自分の意見を正当化する能力を評価させる。説明を評価する分野では、代替仮説を考慮することで、単一の説明に過度に依存することが緩和されることが示されている（Gettys, Mehle & Fisher, 1986; Brem & Rips, 2000）。さらに、後知恵のような認知バイアスに関するこれまでの研究では、反論を自己生成することで、より客観的な視点を得ることができ、社会的バイアスを是正する効果があることが示されている(Lord er al)。 1984, Koriat er al)。 1980, Arkes er al)。 1988, Davies, 1992, Hirt & Markman 1995)。

研究3bでは、当初の課題に新たな要素を導入することで、デビアスの発生を防ぐことを目的としている。重要なのは、この操作が、研究2aのプロコンフレームとは異なるということである。この操作では、参加者は2つの十分に練られた一貫した立場を考えなければならない。この操作により、研究3aと同様にケアの効果が減少し、自分の立場を正当化するための高い自信を維持することができると予測した。

方法

参加者

69名の成人被験者（女性41名、男性28名、Mage=35.49,SD=13.39）が、AmazonのMechanical Turkを利用したオンライン調査に参加した。参加者は全員、米国に住んでった。

調査手順

手順は、1つの追加を除いて、研究1aと同じであった。トレーニングの後、参加者は4つの問題について反対意見を書き出した。参加者は、これまでの研究で用いられた2つのサブセットのうち、どちらか一方の論点を書いた。時間目に20項目の評価を行った後、参加者は前回検討したのと同じ4つの論点について自分の立場を主張して書き出した。その後、各論の後に自分の立場を正当化する能力を再評価し、20項目すべてについてケアの強さを評価し、人口統計情報を報告した。

結果と考察

16人の参加者が研修に参加できなかったため、残りの53人の参加者の回答のみを分析した。

反対意見への反論を書いた後、参加者は最初の評価と反論を書いた後の評価との間に再び有意な差を示した。すべての項目を平均して、ペアサンプルt検定を行ったところ、初期評価（M=4.20 SD=1.09）と自分の立場の主張を書き出した後の評価（M=3.47 SD=1.35）との間に、有意な差が見られた。

次に、ケアが評価に与える影響を分析した。予測通り、介入によってケアと評価の間の系統的な関係はなくなった。ケアと時間1の評価の間には相関関係がなく、相関の大きさは研究1のものより有意に減少し、r(93)=.45, Zdiff=-1.84, p<.05となった（Preacher, 2002）。また、ケアと時間2の評価の間には相関がなく、r(51)=.20, p=.24であったが、相関の大きさは研究1のケアと時間2の相関r(93)=.38, Zdiff=-1.12, p=.13から有意に減少しなかった。

この介入により、ケアの偏りを部分的に解消しつつ、タスク前の介入を行わなかった場合の評価（研究1）と同程度の信頼度を維持することができた。T1評価の平均値、p=.53,T2評価の平均値、p=.33の低下は見られなかった。また、介入によって、参加者が単に問題に対する関心が低くなったわけではないことも重要だ。独立したサンプルによるt検定の結果、介入を行った参加者）と介入を行わなかった参加者の総ケア量には、p=.70の差がなかった。この介入は、個人的な立場を考慮する前に視点を変えることで、議論の正当性の質に関する偏った予測を克服するのに役立つという証拠を示している。

総論

これらの実験は、論証による正当化の能力を正確に評価しないという一貫した失敗を示している。特に、自分の意見だけを述べているとき、参加者は自分の立場を正当化する能力を過大に予測し、独立した審査員が評価したときよりも自分の議論が良いと評価した。さらに、この錯覚の強さは、そのテーマに感情的になっている人ほど大きくなった。研究1では、自分の立場を主張する際に、その問題に関心があると、主張の弱さを認めたくなくなることを示した。研究2では、暗黙の影響は有効な修正手段ではないことが示唆された。研究3では、反対意見を明示的に考慮することで、正当性を示す能力の初期評価に対する感情的投資の影響がなくなることを示した。

表面的には、議論の正当化の錯覚は、公共政策の機械的な説明には説明の深さの錯覚があるが、問題に対する立場の理由を生み出すときには錯覚がないという最近の研究と矛盾しているように見えるかもしれない（Fernbach et al, in press）。しかし、これらの研究の重要な違いは、参加者が考えたトピックの種類にあるかもしれない。Fernbachらの研究では、「炭素排出量のキャップ＆トレード制度」のようなより技術的な問題が取り上げられているのに対し、今回の研究では、「妊娠中絶」のようなより身近なテーマが取り上げられているが、これらは単純な機械的説明ができるものではない。馴染みの薄い機械論的なトピックでは因果関係の理解が錯覚され、馴染みのある機械論的でないトピックでは錯覚や議論の正当化が行われるということなのかもしれない。このような細かな違いについては、今後の研究でさらに詳しく調べることができるであろう。

いくつかの操作は、ケアと評価の関係に影響を与えたが、どの操作も最初の評価とその後の評価の差をなくすことに成功しなかったことは注目に値する。どの研究でも、参加者は実際に議論を展開した後に自分の能力に対する評価を下げてた。これらのテーマが非常に議論の多い問題であることを考えると、課題がどのように組み立てられていても、人々はより多くの情報を入手できると信じているのかもしれない。我々の研究で用いた方法に対する批判は、人々がどのような能力を評価したとしても、タスクを完了する前の方がタスクを完了した後よりも自分の能力に自信を持っているというものである。これは、論争の的になっているテーマで立場を明確にするという特定の領域では当てはまるかもしれないが、すべてのタスクで当てはまるわけではないので、この結果は単に一般的な自信過剰によるものではない。Rozenblit and Keil (2002)は、参加者が事実上の知識、手順の知識、物語の知識を考慮した場合、時間1の評価から時間2の評価への低下が見られないことを示し、rate, write, re-rateタスクに対する一般的な自信過剰の説明を特に排除した。

最も効果的な介入は、参加者に代替的な立場を考慮するように求めたものであった。反対の立場を考えることは、より高い客観性を得るために有効な戦略であるが、それにも限界がある。人は、理解できる範囲でしか反対の立場を表現することができない。また、反対の立場に個人的な投資をしていないので、明らかなギャップや誤解が生じることが多いのである。この問題を解決する一つの方法として、「グループ推論」がある。他者と協力して推論することは、個人の盲点を修正する役割を果たし、グループが正しい答えに到達するのは、多くの場合、議論を通してである(Moshman & Geil 1998; Trognon 1993)。

実際、社会的な装置である議論は、推論の主要な機能的役割であるかもしれない（Mercier & Sperber, 2011; Mercier, 2011）。この主張は、推論の論証理論として知られており、推論の役割は、他者を説得したり、説得されたりするために論証を作成し、評価することであると考えられている。例えば、この考え方では、推論のパズルの1つである確証バイアス(Nickerson, 1998)は、欠陥ではなく推論の特徴と見なされる。なぜなら、不確かな証拠を無視して裏付けとなる論証を特定する傾向は、論証が推論の目的であるならば有用だからである。したがって、人間の推論は、深い欠陥があって非合理的なものではなく、むしろ議論に適したものなのかもしれない。実際、特に社会的な文脈の中で迅速に論証を行う能力(Kuhn er al)。 1997; Resnick er al)。 1993)は、推論の論証理論を裏付けるものである。

我々の発見は、この見解とよく一致している。もし推論が社会的相互作用を通じて最適化されるのであれば、孤立した内省は、論証の正当化の錯覚のような不正確なものになりやすいであろう。しかし、もし推論の目的が論証であるならば、人はどうして論証を生み出す能力とは無縁でいられるのか、という疑問があるかもしれない。もしかしたら、議論正当化の幻想は、迷いや疑いを取り除き、むしろ議論への参加を促進するのかもしれない。もし、人々が自分の議論の把握状況を正確に理解していたら、自分のギャップや矛盾に気づき、他人と議論することが少なくなり、強引な姿勢で他人の意見に変化を与えることができなくなるであろう。このように、この錯覚は、他の方法では起こらないような効果的な社会的相互作用を可能にしたり、少なくとも社会的目標を達成するのに役立つ可能性がある。このような相互作用が行われた場合、理想的には、集団推論の利点である、より謙虚さと真実をもたらす。

集団推論の効果の可能性にかかわらず、我々は、議論を通して正当化する能力について内省することには、少なくとも2つの組み込みバイアスがあることを実証した。1つは、人々が議論を明確にする実際の能力に気づいていない場合に起こるバイアスで、もう1つは、問題を気にすることで正確な評価がさらに曇る場合に起こるバイアスである。これらの結果は、人が議論下手であることを意味するものではない。認知メカニズムへの内省的なアクセスが悪いからといって、そのメカニズムが正しく機能していないということではない。しかし、我々は、議論の質に関するメタ認知的判断の不正確さと、このプロセスにおける感情的投資の役割を実証した。このことは、議論の質そのものが、議論者が想定しているよりも悪いということをより確かなものにしている。

2024年7月
日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

The Illusion of Argument Justification

概要

はじめに

現在の研究の概要

研究1a

研究方法

参加者

調査方法

結果と考察

研究1b

方法

参加者

評価方法

結果と考察

研究1c

試験方法

参加者

実験方法

結果と考察

研究2a

方法

参加者

調査方法

結果と考察

研究2b

実験方法

参加者

調査手順

結果と考察

研究3a

方法

参加者

調査方法

結果と考察

研究3b

方法

参加者

調査手順

結果と考察

総論

図1 研究1における感情投資の偏り

図2 研究2aにおける情動状態の偏り

図3 直観の感情投資の偏り 研究2bの悪条件

図4 直観への感情移入の偏り 研究2bの良好な状態

図5 研究3aの感情的投資のバイアスの除去

図6 研究3bにおける感情的投資のバイアスの除去

図1　研究1における感情投資の偏り

図2　研究2aにおける情動状態の偏り

図3　直観の感情投資の偏り研究2bの悪条件

図4　直観への感情移入の偏り研究2bの良好な状態

図5　研究3aの感情的投資のバイアスの除去

図6　研究3bにおける感情的投資のバイアスの除去