ダニング・クルーガー効果の脳内相関関係

強調オフ

心理学

サイトのご利用には利用規約への同意が必要です

Neural correlates of the Dunning-Kruger effect

www.ncbi.nlm.nih.gov/labs/pmc/articles/PMC7920517/

2020 Aug 28.

Alana Muller,1,2 Lindsey A. Sirianni,2,3 and Richard J. Addante2,4

概要

ダニング・クルーガー効果(DKE)とは、ある課題での成績が悪かった人が、他の人よりも成績が良かったと思い込み、逆に成績が良かった人が、他の人よりも成績が悪かったと思い込む、錯覚的優越感を伴うメタ認知現象である。この現象は、エピソード記憶ではまだ直接検討されておらず、生理学的な相関や反応時間についても検討されていない。我々は、脳波を記録しながら項目認識テストを行うことで、DKEを誘発する新しい方法を考案した。脳波を記録しながら項目の認識テストを行うことで,DKEを引き出すことができた。その結果、下位25パーセンタイルの参加者は自分のパーセンタイルを過大評価し、上位75パーセンタイルの参加者は自分のパーセンタイルを過小評価し、古典的なDKEを示した。反応時間を測定したところ、条件とグループの間に相互作用があり、上位パーセンタイルにいると推定した場合には、過大推定者は過小推定者よりも速く反応し、下位パーセンタイルにいると推定した場合には、遅く反応した。過大評価者と過小評価者の間には、Dunning-Kruger反応時に脳波のグループ間差が見られ、過大評価者にはFN400のような慣れによる差を支持する効果が見られた。一方、「古い-新しい」記憶事象関連電位効果では、過大評価者には見られなかったが、過小評価者には記憶に基づく処理に関連する後期頭頂部の成分が見られた。この結果から、過大評価者と過小評価者では、自分のパフォーマンスを評価する際に異なる認知プロセスを用いていることが示唆された。過小評価者は記憶の際に回想に頼り、過大評価者は自分のパフォーマンスを過大に評価する際に過剰な慣れを利用している可能性がある。このように、エピソード記憶は錯覚的優越性のメタ認知的判断に寄与するようである。

キーワード 脳波、ERP、慣れ、メタ認知、回想

グラフィカル・アブストラクト

1 |. イントロダクション

愚か者は自分が賢いと思っているが、賢い者は自分が愚か者であることを知っている

Shakespeare, 1601

ダニング・クルーガー効果(DKE)とは、タスクのパフォーマンスが低い人は自分のパフォーマンスを過大評価し、タスクのパフォーマンスが高い人は自分のパフォーマンスを過小評価する傾向があるという現象のことである。過大評価は、記録された歴史の中でずっと注目されてきた。早くもソクラテスの時代には、プラトンが次のように指摘している。 後にチャールズ・ダーウィンは、「無知は知識よりも頻繁に自信を生む」(Darwin, 2009/1871)と、よりシンプルに指摘している。また、これらの時代を超えた観察結果には、これらのメタ認知的錯覚は双方向であり、最高のパフォーマンスを発揮する最も有能な人も、自分の能力を過小評価する傾向があることが示唆されている(レビューについてはZell er al 2019を参照)。

自分の能力を不正確に信じる誤認は、誰にでも(著者や読者も含めて)起こりうる一般的な認知現象であり、しばしば予防可能な深刻な問題を引き起こす可能性がある。例えば、タイタニック号が不沈艦であると誤信したことで、1,500人以上の命が失われた(Bartlett, 2012; Lord, 1955)。現代では、COVID-19パンデミックの際に、多くの世界保健機関、政府、メディアなどが、パンデミックを管理する能力を過大評価し、その世界的な影響を過小評価したことが指摘されている(一部の顕著な例外を除く)。逆に、最も有能な人が、他の人の方が適していると考えて、チームや社会への貢献を控えてしまうと、社会に悪影響を及ぼす深刻な問題に発展することもある。例えば、最も有能な人をリーダーの座から失い、代わりに単に自分が一番だと思っている人を受け入れることになるかもしれない(間違っている)。したがって、このような他者に対する自分の能力の不正確な判断がどのようにして、またなぜ起こるのかを理解することは、それを防ぐためにも重要だ。

1999年、社会心理学者のDavid DunningとJustin Krugerは、他者と比較して認識された能力についての研究をさらに特徴づけた。ダニングとクルーガーはブレイクスルー論文を発表し、ユーモア判断、論理的推論、文法能力のテストにおいて、成績下位者は自分の成績パーセンタイルを過大評価し、逆に成績上位者は自分の成績パーセンタイルを過小評価していることを示すいくつかの研究を行った。このように、DKEは、仲間と比較した自分の能力の認識と、与えられた課題における自分の実際のパフォーマンスパーセンタイルの現実との間にミスマッチが生じる心理現象である。低成績者(客観的尺度のテストで高得点を得られない人)は、ある課題における自分の成績パーセンタイルを過大評価する傾向があり、高成績者(客観的尺度で測定された高得点を得た人)は、同じ課題における自分の成績パーセンタイルを過小評価する傾向があり、この知覚的ミスマッチの方向は両方向に伸びている(Sieber, 1979)。実証的には,このパラダイムは,ミクロ経済学の大学受験(Ryvkin, Krajč, & Ortmann, 2012),論理的推論(Schlösser, Dunning … Johnson & Kruger, 2013)など,さまざまな課題でDKEを引き出すことに成功している。Johnson, & Kruger, 2013)認知的考察(Pennycook, Ross, Koehler, & Fugelsang, 2017)大きさの判断(Sanchez, 2016)金融(Atir, Rosenzweig, & Dunning, 2015)コンピュータプログラミング(Critcher & Dunning, 2009)などの課題で、DKEが用いられている。もっと広く言えば、この効果は、車の運転(Svenson, 1981)や、教授が自分の教え方を評価すること(Cross, 1977)などの文脈で言及されてきた。しかし、これらの既存の研究では、これらの幻想的な体験をもたらす認知的プロセスについては、まだ十分に検討されていない。

1.1 |. ダニング・クルーガー効果

DKEの研究に用いられるパラダイムの多くは、参加者に一連の論理的推論問題や数学問題などの課題を与え、課題を一通り終えた後に、その課題における全体的なパーセンタイル推定値(他者との比較など)と客観的なスコアを推定させる、という類似した形式をとっている。つまり、彼らのメタ認知的判断力は、研究の終了時に評価された1つのデータポイントとして測定され、多くの試行を経たパフォーマンスの評価を集約したものとなる。しかし、この方法では、一人当たりの複数の認知現象を測定することができず、反応時間(RT)のような単純な中心傾向の統計的尺度を収集することができなかった。また、脳波やfMRIなど、一人当たりの複数回の試行に依存する神経科学的な測定方法も、既存のアプローチでは収集することができなかった。

社会心理学では、「平均より優れた効果」(BTAE)として知られる関連現象があり、これにより、人々は仲間と比較して自分自身を50パーセンタイル以上に評価することが判明します(レビューについては、Alicke & Govorun, 2005; Brown, 1986, 2010; Chambers & Windschitl, 2004; Hartwig & Dunlosky, 2014; Moore & Healy, 2008; Sedikides, Gaertner, & Cai, 2015; Zell et al 2019を参照)。BTAEは一般的な自己評価バイアスを反映しているが(Kwan, John, Kenny, Bond, & Robins, 2004)Zellらが指摘するように、DKEは過大評価と過小評価の双方向の錯覚を強調する。

この所見のパターンは、記憶に関する研究でも間接的に持続しており(Hirst et al 2015; Kvavilashvili, Mirani, Schlagman, Foley, & Kornbrot, 2009)DKEが記憶に現れる可能性を示唆している。人はしばしば、自分の記憶に対して幻想的な過信を示すことがある(Chua, et al, 2012; Koriat & Ma’ayan, 2005; Nelson & Narens, 1990; DeSoto & Roediger, 2014; Wells, et al, 2002)。例えば、いわゆる「閃光の記憶」は、最も顕著な記憶の一つであるにもかかわらず、それほど顕著ではない記憶と比べて正確さが変わらないことがわかっている(Brown & Kulik, 1977; )。また、「偽の名声」現象を研究した実験では、名前を覚えたときの文脈を覚えていないと、後でその名前を有名だと誤認してしまうことがわかっている(Dywan & Jacoby, 1990; Jacoby, Kelley, Brown, & Jasechko, 1989; Jacoby Woloshyn, & Kelley, 1989, 2004)。記憶の推定に関する関連研究は、記憶に関する目視証言の信頼性が低いことが判明している刑事司法制度の研究から来ており、実験室での研究では、参加者が自分の記憶の正確さを過大に推定していることがわかっている(Heaton-Armstrong, Shepherd, Gudjonsson, & Wolchover, 2006; Loftus, 1975; Loftus & Zanni, 1975; Nadel & Sinnott-Armstrong, 2012; Pena, Klemfuss, Loftus, & Mindthoff, 2017; Schacter & Loftus, 2013)。これらの収束する結果は、記憶とメタ認知の2つの領域の間に本質的に存在する可能性がありながら、直接的な研究ではほとんど調査されていないリンクを示している。

1.2 |. DKEの理論的説明

DunningとKrugerが提案した効果の説明の1つは、低成績者がパーセンタイル推定を誤る理由は、メタ無知または二重無知によるものであるというものであった(Kruger & Dunning, 1999)。低成績者は、タスクを正しく完了するために必要な詳細について無知であることに気づかず、二重無知が偽の優越感を高めるというものである(Schacter, 2012)。もっと簡単に言えば、成績の悪い人はタスクを正しく完了するための知識を持っておらず、自分の答えが間違っていることを知らないため、自分は良いパフォーマンスをしていると思い込んでいるのである(つまり、「知らぬが仏」)(Schlösser er al 2013)。これは非常に便利な行動の説明であるが、広まった錯覚に関わる認知的プロセスの理解を進めるにはほとんど役立ちません。

また、ダニングとクルーガーは、ローパフォーマーが自分の能力を誇大に信じることを説明するために、彼らが「リーチ・アラウンド・ナレッジ」と呼んだものを使用した。これは、提示された課題と同様の課題に以前参加し、過去の経験を現在の経験に一般化することで得られる人固有の知識を指す(ダニング 2011)(DKEの代替的な見解については、Gignac & Zajenkowski, 2020; Karjc & Ortmann, 2008; Kreuger & Mueller, 2002; Mahmood, 2016; Sullivan, Ragogna, & Dithurbide, 2018)。Reach-around-knowledge」という概念は、操作的に定義されておらず、認知心理学に基づいた実質的な構成要素を欠いているが、それにもかかわらず、記憶の理論的構成要素に展開するための有用なプラットフォームを提供している。”Reach-around-knowledge “とは、過去の経験に基づいて現在の行動を変化させることを指し、これは基本的に記憶の定義された特徴であり(Rudy, 2013)そのため、このメタ認知的な錯覚に貢献する上で記憶プロセスが果たすかもしれない重要な役割を認識している。

1.3 |. 慣れと回想

記憶プロセスが理論的にも操作的にも定義され、研究されてきた豊かな経験的歴史がある。DKEの原因となるエピソード記憶の認知プロセスには、「慣れ」と「回想」がある(Eichenbaum er al 2008; Yonelinas, 1999, 2002; Yonelinas, Aly, Wang, & Koen, 2010)。これらのプロセスは、「知識の回り込み」という説明の一般的な概念と密接に関連しており、重要なことに、DKEに体系的にアプローチする際に、この記憶プロセスのプラットフォームを利用することができるが、以下のセクションで詳しく説明する。

慣れと記憶の認知プロセスは、数十年にわたってエピソード記憶の理論モデルで重要な役割を果たしてきた(Diana, Yonelinas, & Ranganath, 2008; Eichenbaum, Yonelinas, & Ranganath, 2007; Rugg & Curran, 2007; Squire, Wixted, & Clark, 2007; Yonelinas, 1999, 2002; ただし、別の見解については、Wixted, 2007 および Wixted & Mickes, 2010 を参照してほしい)記憶における親しみと回想のプロセスを理解することで、DKE の変動の一部を説明できる可能性がある。回想とは、項目と文脈の両方が結びついたエピソード情報を宣言的に取り出すことであり(レビューはDiana er al 2008を参照)実証研究では通常、源記憶のように、イベントの項目と結びついた文脈情報を取り出すことと関連している(Addante, Ranganath, & Yonelinas, 2012; レビューはEichenbaum er al)。) これは一般的に、過去のエピソードからアイテムを取り出すが、それが発生したときの関連する文脈情報を持たないと概念化される。慣れとは、例えば、過去に見たことのある人を思い出すことはできても、その人が誰なのか、どこで知ったのかといった具体的な情報を思い出すことができない状態を指す。一方、「回想」とは、過去の体験の中で、その人が誰なのか、どうやって知ったのかを正確に思い出すことである。

これらの2つの記憶現象は、それぞれ解離可能な認知プロセスであること(Yonelinas, 2002)解離可能な神経基質を持つこと(Ranganath et al,, )記憶喪失患者間で解離可能であること(Addante, Ranganath, Olichney, & Yonelinas, 2012; Bowles et al, 2007)頭皮の電気生理学的パターンが異なる(Addante, Ranganath, & Yonelinas, 2012; Mecklinger & Bader, 2020; Rugg & Curran, 2007; Rugg et al 1998)。生理学的には、慣れは、新旧の記憶試行における事象関連電位(ERP)の違いと関連しており、刺激後約400〜600msに前頭葉中部の頭皮部位にネガティブゴーイングのピークが生じることから、前頭葉中部新旧効果(mid-frontal old-new effect)またはFN400(for frontal-N400 effect)と呼ばれている。一方,記憶条件の違いに伴う回想は,頭皮の頭頂部にある約600~900msのERPのピークで生じるとされており,これを後期頭頂部成分(LPC)と呼ぶ(Addante, Ranganath, Olichney, er al)。

1.4 |. DKEの記憶に基づくフレームワークの提案

DKEの説明の多くは、主にメタ認知とコンピテンシーに基づく解釈に焦点を当ててきた(Adams & Adams, 1960; Ehrlinger & Dunning, 2003; Kruger & Dunning, 1999; Oskamp, 1965; Pennycook et al 2017; Ryvkin et al 2012; Sanchez & Dunning, 2017)。しかし、DKEは、過去の記憶体験が、現在の情報のリアルタイム処理に、明示的または暗黙的な手段を介して影響を与えている可能性もあると考えられる。記憶とメタ認知の文献に基づいて、DKEを説明するために我々が提唱する有力な代替理論は、幻想的な優越感は、少なくとも部分的には、テスト対象物に関する過去の経験から得られる慣れの増加によっても駆動される可能性があるというものである(Chua et al 2012年など)。

人は、その教材の能力を示すのに必要な関連情報を具体的に思い出せないにもかかわらず、うまくできたという感覚をもたらす判断ヒューリスティックを使用することがある。この見解では、はっきりとした記憶がないにもかかわらず、一般的によく知っている内容を経験することで、人は自分がそのタスクにおいて有能で成功していると思い込んでしまうのである。このシナリオは、不正確な過大評価をした人のERPにおけるFN400振幅の増加と関連していると考えられる。その場合、特定のトピックや刺激、情報に対して、記憶が不十分であるが、過度に精通しているというのは、比較的「危険」な組み合わせとなります (Chua et al 2012)。なぜなら、それは、自分の能力やコンピテンシーを不正確に過大評価することにつながる可能性があるからである。したがって、過小評価の人は、学習した内容(例えば能力)を十分に想起していたことが特徴であり、このような例はLPCと関連しているが、一方で、自分の認知がまだ相対的に間違っている可能性を認識している非基準的な情報の範囲を想起してしまい(Parks, 2007; Parks & Yonelinas, 2007; Yonelinas & Jacoby, 1996)、その結果、他の人と比較して推定得点を下げてしまう可能性がある。この場合、過剰な回想信号が慣れ信号のノイズを上回ることになる。

1.5 |. 現在の研究

現在のパラダイムは、項目認識記憶テスト中に参加者から提供されるDKEパーセンタイル推定値の中で、リアルタイムに起こるメタ認知的意思決定プロセスを研究するために設計された。この研究は、DKE研究の既存の研究と最も直接的に比較できるため、他人と比較して自分のパフォーマンスを判断する(例えばパーセンタイルランキング)際に適用されるDKEを調査することに焦点を当てており、自分自身の生のパフォーマンスを推定することそのものではない。上述のメタ認知的決定を行うための記憶の枠組みに基づいて、我々は、パーセンタイルランキングを過大評価する傾向のある低成績者は、類似した状況での過去の経験に慣れているために、記憶への依存度が著しく低いためにそうするのではないか、また、パーセンタイルランキングを過小評価する傾向のある高成績者は、同僚を正確に上回るために、より多くの記憶を使用するのではないか、という仮説を立てた。したがって,グループレベルのERPでは,低成績者の方が高成績者よりもFN400が大きく,高成績者の方が低成績者よりもLPCが大きいという仮説を立てた。

2 |. 研究方法

2.1 |. 実験参加者

本実験は、California State University-San Bernardino Institutional Review Boardの人間を対象とした研究に関する規約に基づいて行われた。参加者の募集は,CSUSB周辺に設置された広告や,学校全体のリサーチプールであるSONAなどの方法を組み合わせて行われた。広告で募集した参加者には、約2時間のセッションで1時間10ドルの報酬が支払われた。調査対象となったのは、カリフォルニア州立大学サンバーナーディーノ校の学生で、神経学的な問題や記憶の問題を抱えていないと回答した右利きの参加者61名(女性48名)である。4人の参加者のデータは、コンプライアンス上の問題(タスク中に1つのボタンしか押さなかった、または実験者の指示を無視した)により使用されず、1人の参加者は実験者のミスによりデータが失われたため、使用可能なデータがなかった。2人の参加者は、過剰なモーションアーチファクト/ノイズのために使用可能なEEGデータを持たず、その結果、大部分の試行がEEGから除外されたが、行動分析には含まれていた。これにより、行動データセットはN=56,脳波データセットはN=54となった。参加者の56.5%がヒスパニック系、22.6%が白人系、11.3%がアジア系、9.7%が2つ以上の民族であると自己申告していた。平均年齢は23.52歳(SD = 4.82)であった。参加者の中には、実験に支障をきたすような視覚的、医学的、身体的問題を報告した人はいなかった。ほとんどの参加者は英語を第一言語としており(N = 47)他の言語を第一言語としていると答えた15人は、平均16.73年(SD = 4.74)英語を話していた。

2.2 |. 手順

参加者は、実験室に到着し、インフォームド・コンセントと人口統計学的情報を任意の自己申告で記入した。使用したパラダイムは、当研究室の先行研究で成功した同様のパラダイムから構築された修正項目認識信頼度テストであり(Addante, 2015; Addante, Ranganath, Olichney, et al 2012; Addante, Ranganath, & Yonelinas, 2012; Addante, Watrous, Yonelinas, Ekstrom, & Ranganath, 2011; Roberts, Clarke, Addante, & Ranganath, 2018)以下にさらに詳しく説明する(図1)。このパラダイムは、参加者が各セッションで54の単語を学習する4つの学習セッションを含むエンコーディングフェーズと、各セッションで54の単語について参加者の記憶をテストする6つのテストセッションを含むリトリーバルフェーズで構成されている。符号化段階で提示された216個の単語と、未学習の項目(新規項目)116個の合計324個の単語を閲覧した。

図1 記憶の検索とダニング=クルーガー試験パラダイム

左:参加者は、アイテム記憶とソース記憶の信頼度を示した。また、10個の刺激が提示されるごとに、参加者はDunning-Kruger推定値を表示した。これは、他の学生と比較して、自分がその時点までに課題を遂行できていると思うパーセンタイルを推定するよう参加者に求めるものである。

 

符号化の際、被験者には画面に表示された単語について簡単な判断をするよう指示が与えられた。被験者には,アイテムが人工物であるかどうか,あるいはアイテムが生きているかどうかを判断するように指示し,条件を相殺した。刺激は,黒いコンピュータ画面に白い文字で提示された。試行を開始するために、中央に小さな白い十字架が表示された画面が、無作為に選ばれた3つの刺激間間隔のうちの1つで提示された。続いて,画面中央に刺激語が表示され,その左下に「YES」,右下に「NO」と表示された。参加者は,「YES」と「NO」に対応するボタンをそれぞれ人差し指と中指で押すことで回答を示し,この回答は参加者の自己ペースで行われた。回答後,被験者は1秒,2.5秒,3秒のランダムな時間で黒い空の画面を見た。空の画面の後,画面の中央に小さな白い十字架が現れ,次の試行が始まる。このサイクルは,4つのリストの54個の単語がすべて提示されるまで続けられた。それぞれのリストの間に、参加者は次の課題の説明を読み、直前の符号化課題のキャリーオーバー効果を防ぎ、アニメーションと人工物の判断課題を正しく切り替えられるようにした。

符号化段階が終了した後、脳波キャップのサイズを調整し、眼球電極を装着した。脳波は、標準的なInternational 10-20 Systemの電極位置に準拠した32チャンネルの電極キャップを備えたactiCHamp EEG Recording Systemを用いて記録した。各被験者は,消音室の中で個別にテストを受けた。刺激の提示と行動反応のモニタリングは,Windows PC上のPresentationソフトウェアを用いて制御した。EEGは1,024Hzで取得した。被験者は,顎や筋肉の緊張,眼球運動,まばたきを最小限に抑えるように指示された。EOGは水平方向と垂直方向をモニターし,これらのデータを用いて,瞬きや眼球運動などのアーティファクトに汚染されたトライアルを排除した。EOGを記録するために,5つの眼球電極を顔面に装着した。垂直方向の眼球運動による電気的活動を記録するために左目の上下に2つずつ,水平方向の眼球運動による電気的活動を記録するために両こめかみに2つずつ,そして基準電極として眉毛のすぐ上の額の中央に1つである。EEGキャップを被験者の頭部に装着し,電気記録の準備をした。キャップの各部位にゲルを塗布し,電極が明瞭な電気信号を得られるように優しく擦り,インピーダンスを15 KOhms以下に下げた。

脳波キャップが装着された後,被験者はリトリーブフェーズを開始した。参加者は,提示された刺激語が古いもの(符号化段階で学習したもの)か新しいもの(符号化段階で学習していないもの)かを判断するように指示を受けた(図1)。符号化段階と同様,すべての刺激語は黒いスクリーンに白いフォントで提示された。各試行の最初に,参加者には,画面の中央に単語が提示され,その下に数字「1」「2」「3」「4」「5」が等間隔で配置され,数字「1」の左側には「新しい」という単語が,数字「5」の右側には「古い」という単語が表示された。参加者は「1」から「5」の間の任意の数字を押して,その単語が古いと確信しているか(「5」),古いと確信しているが自信がないか(「4」),古いか新しいかわからないか(「3」),新しいと確信しているが自信がないか(「2」),新しいと確信しているか(「1」)を示した(Addante, Ranganath, Olichney, er al 2012; Addante, Ranganath, & Yonelinas, 2012; Addante er al 2011)。このプロンプトは主観的なものであった。参加者は,自分の記憶を最も正確に反映した回答を選び,できるだけ早く正確に回答するように言われた。項目認識判定の直後に、参加者は、エンコード時にその単語がアニマシィ判定タスクとマンメイド判定タスクのどちらから来たものかを1~5のスケールで示すソースメモリ確信度テストに回答するよう求められ、これも主観的なペースで行われた(Addante, Ranganath, Olichney, er al)。) 応答後、参加者は1秒、2.5秒、3秒のランダムな持続時間で黒のブランク画面を見た。参加者はこのブランク画面の間だけ瞬きをし、小さな十字架や刺激のある画面の間は瞬きをしないように指示された。

2.3 |. ダニング・クルーガーのテスト内質問

記憶テスト中に提示された10番目の単語について、原典記憶テストの後、Dunning-Kruger推定値を提示した。被験者は、研究に参加する他の学生と比較して、テストのその時点までに自分が行っていると思われるパーセンタイルを推定するように指示を受けた(被験者は、一般的な記憶パフォーマンスに焦点を当て、アイテム記憶を主要な文脈として使用するように指示された)。テスト段階では、彼らの推定値を示すプロンプトとして「パーセンタイル?」という単語が提示され、その下に「60%未満」「60%台」「70%台」「80%台」「90%以上」という数字が等間隔で表示された。Dunning-Kruger推定値は主観的なペースであった。

2.4 |. ダニング=クルーガーのテスト後の質問

記憶想起テストの終了時に、参加者は4つのテスト後質問に答えた。まず,”テスト全体でのあなたのスコアを推定してほしい “と尋ねられた。1」は60%未満、「2」は60%以上69%未満、「3」は70%以上79%未満、「4」は80%以上89%未満、「5」は90%以上を意味する5段階評価で回答するように促された。2つ目の質問は次のようなものだったという。”In what percentile did you perform on the whole test?” 1」は60パーセンタイル以下、「2」は60パーセンタイルから69パーセンタイルの間、「3」は70パーセンタイルから79パーセンタイルの間、「4」は80パーセンタイルから89パーセンタイルの間、「5」は90パーセンタイル以上を意味し、5段階で回答するよう求められた。最初の質問は、記憶力テスト全体での客観的なスコアの認識を測定し、2番目の質問は、記憶力テストを受けている他の学生との相対的なスコアの認識を測定した。これらのテスト後の質問により、DKEの効果がエピソード記憶課題を用いて誘発されることを確認するために、被験者間のレベルでテストを行うことができた。分析の際、被験者はテストのパーセンタイルスコアに基づいて四分位にグループ分けされ、各グループの回答を平均化し、他のグループの平均回答と比較して有意差を判定することができた。また、パーセンタイル推定値の誤差によってもグループ分けを行い、過大推定者、正しい推定者、過小推定者のグループ(後に推定者グループとも呼ばれる)を作り、認知戦略の違いの可能性を調べた(以下参照)。

テスト後の追加質問は以下の2つであった。(a)”日常生活での記憶力を評価してほしい”、(b)”このテスト全体の難易度はどうであったか?”。最初の質問では、参加者は「1」が非常に悪い、「2」が悪い、「3」が中程度、「4」が良い、「5」が非常に良いという5段階評価で回答した。2つ目の質問では、参加者は「1」が非常に難しい、「2」が難しい、「3」が中程度、「4」が簡単、「5」が非常に簡単という意味の5段階評価で回答した。

2.5 |. ダニング・クルーガー・グループ化

Kruger and Dunning (1999)の報告を再現するために一貫性を保つため、原著論文と同じ方法で被験者をグループ化し、テストの正確さに応じて4つの四分位に分け、それらの四分位間のグループ差を調査した。被験者のグループ化は、項目認識テストの成績に基づいて4つの四分位に分けて行った。被験者の記憶課題の精度(ヒットの確率から誤認識の確率を引いた値,pHit-pFA)を小さいものから大きいものへとランク付けし,成績の四分位(25%未満,25%以上〜50%未満,50%以上〜75%未満,75%以上)に分け,これらの四分位に当てはまる被験者を低位,2位,3位,高位の四分位にした。

次に,参加者を「推定者グループ」と呼ぶグループ,すなわち,自分のパーセンタイルランキングを過大に推定した参加者,正しく推定した参加者,過小に推定した参加者に再グループ化した。これらの推定者グループを作るために、まず、上述のパーセンタイルランキングに、被験者が自分のパフォーマンスのパーセンタイルグループを推定するために使用した尺度に直接対応する1〜5のスコアを与えた。例えば,21パーセンタイルの参加者には1を,82パーセンタイルの参加者には4を与えた。これにより、テスト後の測定で、参加者の推定パーセンタイルスコアから実際のパーセンタイルスコアを引くことができ、参加者が自分のパーセンタイル順位をどれだけ正確に推定しているかの値を得ることができた(Kruger and Dunning (1999)で使用されたオリジナルのアプローチと一致するように、テスト後の相対的なDunning-Kruger推定値を使用したが、テスト内のDunning-Kruger回答の平均値とのペアt検定も実施した(M = 3. 14, SD = 0.81)とテスト後の相対的なDunning-Kruger反応(M = 3.16, SD = 0.78)との間でペアのt検定を行ったが、2つのスコアには差がないことがわかった。正の値は過大評価,0の値は正しい評価、負の値は過小評価を示す。例えば,自分のスコアを80〜89パーセンタイル(回答尺度の4に相当)と見積もっていたのに,実際の成績は74パーセンタイル(回答尺度の3に相当)だった参加者は,過大評価者に分類される。このようにして,過大評価者(N = 38),正しい評価者(N = 8),過小評価者(N = 10)という新しいグループができあがった。これらのグループのメンバーから,この分野の標準的な慣行である,信号対雑音比(SNR;詳細は後述の「方法」の項を参照)のために,ERP比較の各条件で十分な試行回数を満たした被験者のみを含むERP分析を行った(過大評価者(N=36),正しい推定者(N=8),過小評価者(N=10))。

2.6 |. 電気生理学的解析

脳活動の生理的測定は,Brain Vision, LLCのEEG機器を用いて記録した。すべてのEEGデータは、MATLAB(Delorme & Makeig, 2004; Lopez-Calderon & Luck, 2014)を用いて、ERPLABツールBOXを使用して処理した。EEGデータは,まず乳様体電極の平均値に再参照され,0.1Hzのハイパスフィルタを通過させた後,256Hzにダウンサンプリングされた。脳波データは,刺激開始前の200msから刺激提示後の1,200msまでをエポックし,パフォーマンスと反応の正確さに基づいて分類した。

EEGLAB (Bell & Sejnowski, 1995) の InfoMax 技術を用いて独立成分分析 (ICA) を行い,アーティファクトの補正を行った後,得られたデータを個別に検査し,瞬きなどの異常な電極活動がある試行を除外した。ERPの平均化の際には,ERPの振幅が±250mVを超えるトライアルは除外した。ERPLAB toolbox (Lopez-Calderon & Luck, 2014) を用いて,エポックトデータの自動アーチファクト検出を行い,以下に示す一連の連続したステップで,指定された電圧を超えるトライアルを特定した。単純電圧しきい値機能では、-100ms以下の電圧を特定して除去した。Step-Like Artifact 機能では、瞬きやサッカードに特徴的な、指定されたウィンドウ(200ms)内の指定された電圧(ここでは100uV)を超える電圧の変化を特定して除去した。Moving Window Peak-to-Peak機能では,定義されたウィンドウ(200 ms)内の最もネガティブなポイントと最もポジティブなポイントの振幅の差を求め,その差を指定された基準値(100 uV)と比較することで,瞬きを識別するのによく使われる。ブロッキングおよびフラットライン機能では,時間窓内で電圧の振幅が変化しない期間を特定した。自動瞬き分析であるBlink Rejection(α版)では,正規化した交差共分散の閾値を0.7,瞬きの幅を400msとし,瞬きの識別と除去を行った(Luck, 2014)。

十分なSNRを維持するために,すべての比較は,対比する条件ごとに最低12回のアーチファクトのないERPトライアルを持つという基準を満たす被験者のみを含むことに依存した(Addante, Ranganath, & Yonelinas, 2012; Gruber & Otten, 2010; Kim er al)。) 個々の被験者のERPを組み合わせてグランドアベレージを作成し,平均振幅を抽出して統計解析を行った。効果の空間分布を評価するために,頭皮活動の地形図を作成した。標準的な統計解析(Addante, 2015)では,2つのレイテンシー間の平均電圧を取ることで生じる同様の「平滑化」機能と並行するように,ERPの数値に30Hzのローパスフィルタを適用した。ERPの結果は、代表的な電極部位について報告されているが、特に断りのない限り、周囲の3部位の電極クラスターでも信頼性があることがわかった。

2.7 |. 行動学的な結果

新旧アイテムの認識に関する認識記憶応答分布を表1に示す。項目認識精度は、ヒットの割合(M = 0.81, SD = 0.11)から誤警報の割合(M = 0.24, SD = 0.14)を差し引いたもの(すなわちpHit-pFA)として計算した(Addante et al 2011; Addante, Ranganath, Olichney, er al)。) 参加者は,比較的高いレベルで項目認識を行い(最大値=0.87,最小値=0.18,M=0.57,SD=0.15),偶然の確率よりも高かった。また,信頼度の高い項目認識試行(「5’s」)の精度は,信頼度の低い項目認識試行(「4’s」)よりも有意に高かった(t(55)=9.04, p < 0.001).新旧のアイテムを認識した際のソースメモリ応答分布を表2に示す。ソースメモリの精度の値は、ソース信頼度の高い回答と低い回答を含むように折り畳まれ、それを正解のソース回答と不正解のソース回答を受け取ったアイテムの合計で割って割合を算出した(Addante, Ranganath, Olichney, er al 2012; Addante, Ranganath, & Yonelinas, 2012; Roberts er al 2018)。ソースメモリの平均精度は0.30(SD = 0.19)で、信頼性高くチャンスよりも大きかった、t(55) = 11.78,p < 0.001。アイテム記憶確信度とソース記憶確信度のスコアとERPの結果は、Addante、Ranganath、Yonelinas(2012)の以前の知見を再現しており、Muller(2019)がさらに詳細に報告している。

表1 全記憶回答に占める各項目回答の割合の分布
アイテム認識の信頼性 1 2 3 4 5
すべての古いアイテム 0.09 0.07 0.04 0.21 0.60
すべての新しいアイテム 0.43 0.23 0.10 0.15 0.08
有生性タスク 0.13 0.06 0.04 0.16 0.60
人工タスク 0.08 0.04 0.03 0.14 0.71

 

表2 すべてのメモリ応答の割合としての各ソース応答の応答の分布
ソース認識の信頼性 1 2 3 4 5
すべての古いアイテム 0.14 0.14 0.22 0.17 0.33
すべての新しいアイテム 0.05 0.08 0.70 0.09 0.08
有生性タスク 0.24 0.17 0.27 0.16 0.16
人工的なタスク 0.11 0.11 0.17 0.2 0.41

2.7.1 |. ダニング・クルーガーのパフォーマンス判定 テスト後およびテスト中のダニング・ク

ルーガーの各回答カテゴリーに対する回答の分布を表3に示す。実際のパフォーマンスに対してプロットすると,被験者が報告したパフォーマンス推定値の結果から,正準的なDKEが明らかになり,それによってDKEを再現し,我々の新しいエピソード記憶パラダイムに拡張することができた(図2)。この効果を定量化して分析するために,まず被験者を記憶精度に基づいて四分位に分けた(推定性能と実際の性能に基づいて被験者をグループ分けする手順については,「方法」の項で詳述した)。記憶テストの平均精度を四分位ごとに整理し,各四分位のテスト後の平均Dunning-Kruger反応を表4に示した。グループ(過大推定値、過小推定値、正解推定値)と反応(1,2,3,4,5のDK判定)の因子を用いてDK反応を分析した3×5のANOVAでは、被験者がメタ認知的判定を尺度にどのように配分するかに違いはなく(F(8,265) = 0.58, p = 0.79)被験者のグループがタスクにどのように反応するかに全体的に明らかな違いはないことがわかった。

図2 パフォーマンスの実際のパーセンタイルと推定パーセンタイル

 

参加者は、実際のパーセンタイル順位によって分けられた。低位グループは第1四分位(25%以下)第2グループは第2四分位(25%以上50%未満)第3グループは第3四分位(50%以上75%未満)高位グループは第4四分位(75%以上)の者で構成されている。第1四分位の成績を収めた参加者は最も過大評価され、第4四分位の成績を収めた参加者は実際のパーセンタイルを過小評価していた。

表3 各Dunning-Kruger反応に対する回答の分布(全Dunning-Kruger反応に対する割合として
DKEタイプ <60% 60%〜69% 70%〜79% 80%〜89% > 90%
テスト中のDK応答 0.05 0.20 0.39 0.29 0.07
テスト後のDK応答 0.02 0.11 0.54 0.30 0.04
表4 四分位数による平均認識記憶テスト精度と平均事後およびテスト中のダニング・クルーガー相対応答
四分位数 正確さ テスト後の平均DK相対応答 テスト中のDKの平均相対応答
上(N = 14) 0.74(0.06) 3.50(0.65) 3.26(0.73)
3番目(N = 14) 0.62(0.02) 3.29(0.99) 3.33(1.01)
2番目(N = 14) 0.55(0.04) 2.79(0.80) 2.79(0.81)
下(N = 14) 0.38(0.08) 3.43(0.51) 3.17(0.62)

標準偏差は括弧内にある。

下位四分位(N=14,M=2.43,SD=0.51,t(26)=17.69,p<0.001)第2四分位(N=14,M=1.79,SD=0.80,t(26)=8.33,p<0.001)第3四分位(N=14,M=1.43,SD=1.28,t(26)=4. 16, p < 0.001)がパーセンタイルランキングを大幅に過大評価したのに対し、上位4分の1はパーセンタイルランキングを大幅に過小評価した(N = 14, M = -0.79, SD = 0.89, t(26) = -3.29, p = 0.003)。さらに,各グループの誤りの大きさは,パーセンタイルグループが大きくなるにつれて系統的に減少した。最下位の4分の1のグループは,自分のパーセンタイルを62.56%過大評価し,第2の4分の1のグループは37.95%過大評価し,第3の4分の1のグループは14.56%過大評価し,最上位の4分の1のグループは8.30%過小評価していた。これらの基本的な発見は、DKEが我々の記憶パラダイムでうまく誘発されたことを証明するものであり、我々の知る限り、これまでに示されたことはなく、DKE現象をエピソード記憶に直接拡張するものである。

図3は、項目認識における各被験者の生のパフォーマンスを、自分がパフォーマンスを発揮していると思うパーセンタイルグループの推定値(過大推定者、過小推定者、正しい推定者)に対するダニング=クルーガーグループ化の関数として示したものである。項目認識記憶課題における過大推定者の成績(N = 38, M = 0.501 SD = 0.11, SE = 0.02)は、正解推定者(N = 8, M = 0.65, SE = 0. 02) (t(44) = 3.71, p < .001) および過小評価者 (N = 10, M = 0.75, SE = 0.02) (t(46) = 6.66, p < .001) に比べて有意に低かったが,偶然レベルの成績よりは確実に大きかった (t(37) = 27.341, p < .001).最も成績の悪い被験者(過大評価者)の成績は、同じパラダイムを用いた先行研究で報告した海馬健忘症患者の障害レベル(M = 0.30)を上回り、その他の点では、同じパラダイムを用いた先行研究で発表された健常成人の規範的な成績と一致していた(Addante, Ranganath, & Yonelinas, 2012; Addante et al 2011; Roberts et al 2018)。

図3 推定グループごとの認識記憶パフォーマンス

左:過大推定者、過小推定者、正解推定者の項目認識記憶テストの精度。各被験者の生のスコアを、グループに対するパフォーマンスパーセンタイルの推定値でグループ化してプロットして示した。記憶の正確さは、ヒットの確率から誤認の確率を引いたものをY軸にプロットし、黒棒はグループごとの平均値を示す。右図 3群それぞれの項目認識記憶パフォーマンスの受信者動作特性曲線。Y軸はヒットの割合、X軸は誤警報の割合を信頼度ごとにプロットしている。

 2.7.2|記憶検索時の意思決定プロセスのパラメータ推定

DKEの結果を説明するために考えられることは、被験者のタスクへの取り組み方が異なっているか、または結果が異なる意思決定戦略を反映している可能性があるということである。この可能性を評価するために、被験者が記憶タスクへの差次的な関与を反映した識別可能な異なる意思決定プロセスを使用していたかどうかを定量化する分析を行った。ROC Toolbox(Koen, Barrett, Harlow, & Yonelinas, 2017)を使用して、記憶タスクの実行に対する意思決定基準(C)応答バイアス(B)記憶(Ro)慣れ(F)のプロセス寄与のパラメータ推定値を算出した(Koen, Barrett, et al, 2017; Parks & Yonelinas, 2009; Yonelinas, 2002, 2004; Yonelinas et al 2010)。一元配置のANOVAを実施して、各パラメータに関するグループ(過小推定者、正しい推定者、過大推定者)間の潜在的な差異を確認した。その結果,記憶の推定値(F(2,52) = 0.75, p = 0.48),判断基準(F(2,52) = 1, p = 0.38),応答バイアス(F(2,52) = 0.32, p = 0.73)については,グループ間で信頼できる差は見られなかった(表5).

表5 記憶パフォーマンスのパラメータ推定値
DKグループ 想起見積もり(Ro) 習熟度の見積もり(F 基準(C バイアス(B
 過大評価者(N = 36) 0.37(0.23) 0.73(1.08) −0.08(0.42) 1.14(1.01)
 正しい推定量(N = 8) 0.42(0.26) 1.30(0.28) 0.06(0.30) 1.33(0.77)
 過小評価者(N = 10) 0.48(0.32) 1.70(0.45) −0.20(0.39) 0.96(1.01)

注:。デュアルプロセス・シグナル検出モデルから得られたパラメータ推定値。括弧内はSD。

グループ別に分析したところ、慣れのパラメータ推定値に有意な効果が見られた(F(50,2) = 14.35, p < 0.001)(平均値から3標準偏差を超えていたため、過大評価グループの被験者1名を異常値として削除した)。これは、前述のグループ間の記憶の違いと一致している(図3)。この効果をさらに検討するために、グループ間のt検定を行ったところ、各グループは項目認識時に使用する慣れの推定値に信頼性のある違いがあることがわかった。すなわち、「過小評価者」(N = 8, M = 1.70, SD = 0.45, SE = 0.14)は「正しい評価者」(N = 10, M = 1.30, SD = 0.28, SE = 0.10)よりも多く(t(16) = 2.22, p = 0.041)「正しい評価者」は「過大評価者」(N = 35, M = 0. 89, SD = 0.46, SE = 0.08) (t(41) = 2.389, p = 0.022), 過小評価者は過剰評価者よりも大きく (t(43) = 4.96, p < 0.001; 図3), 記憶テストにおけるグループ間の基本的なパフォーマンスの違いに対応していた。このように、タスクの中核的なパフォーマンス以外では、被験者は、戦略、タスクへの関与、グループの意思決定の違いに起因しない同様の方法で、タスクに有意義に関与していたようである。

2.7.3 |. これまでのDKE研究では、課題終了時のパフォーマンスの自己評価という、RT分析には不適切な単一の尺度しか含まれていなかったため、RTを測定することができなかった。しかし,本研究では,被験者1人あたり30回のDKE判定を収集した(n = 30)ため,これらの現象が起きている間の応答時間を分析することができ,異なるグループがどのようにタスクを異なって実行したかについての洞察を得ることができた(表6)。一元配置分散分析(ANOVA)により,DKEのすべての反応(「1」から「5」)をまとめた一般的な反応時間を,過大評価者(N = 38),過小評価者(N = 10),正しい評価者(N = 8)の3つのグループ間で比較したところ,グループ間で全体的な反応時間に有意な差は見られなかった(F(2, 52) = 0.41, p = 0.67)。

表6 テスト中のDunning-Kruger判定の反応分布、反応時間の平均値、SD、サンプルサイズを推定量グループ別にまとめたもの
グループ ダニング・クルーガーの判断 1 2 3 4 5
過大評価者(n = 36) 応答分布 0.05 0.19 0.39 0.28 0.09
反応時間 2,204 2064 1948年 2044 1656年
SD 628 641 644 860 544
応答あたりのN 10 23 33 27 13
正しい推定量(n = 8) 応答分布 0.09 0.28 0.33 0.25 0.05
反応時間 1,447 2,323 2,018 1,920 2,275
SD 263 987 890 733 360
応答あたりのN 2 6 7 5 2
過小評価者(n = 10) 応答分布 0.01 0.21 0.35 0.38 0.05
反応時間 1,918 2,074 2,166 1,996 2,579
SD 1,249 543 770 478
応答あたりのN 1 5 9 9 3
正しい推定量と過小推定量の組み合わせ(n = 18) 応答分布 0.04 0.24 0.34 0.32 0.05
反応時間 1,604 2,209 2,101 1,969 2,457
SD 330 1,062 693 729 635
応答あたりのN 3 11 16 14 5

注:平均とSDはミリ秒単位

しかし,我々の仮説は,他の人に比べて自分が最高または最低のパフォーマンスをしているという錯覚的なメタ認知的判断をどのように行うかに特に関心があったので,これらの錯覚的な自己推定を行うために使用される認知戦略の違いの可能性を探るために,被験者が最高のパフォーマンス(「5」)または最低のパフォーマンス(「1」)のいずれかを報告したときのRTを推定者グループの関数として分析した。この分析では、過小評価グループ(N = 10)は、本質的に、自分が最高のパーセンタイルであると信じていると回答した試行回数が限られていると定義されているため、これらの繊細な行動分析に十分な試行回数を持つ利用可能な被験者のサンプルが自然に減少した(N = 3)。現在のパラダイムは、同じサイズの小さなサンプルに敏感であることが以前に確立されているが(Addante, 2015; Addante, Ranganath, Olichney, et al 2012)、それにもかかわらず、我々は錯覚的優越感のエラーを示さない人々のサンプルサイズを増やすことを求めた。そこで,過小評価者のグループ(N = 3)と,これらの稀なカテゴリーの回答が得られた正解者の被験者(N = 5)を折り畳んで,分析用の大きなグループ(N = 8)を作った。2因子の被験者間ANOVAを用いて,Dunning-Kruger群(過大評価者対正解者,過小評価者)のRTの間に平均値の差があるかどうかを調べたところ,過大評価者は自分が最高(「5」の回答)と最低(「1」の回答)のパフォーマンスグループにいると判断していた。ANOVAでは、Dunning-Krugerグループと回答の間に、条件とグループの間の有意な交互作用があることがわかった。

グループ内では、過大評価者が自分を最悪(60%未満)と評価したときのRTは、過大評価者が自分を最高の90%と評価したときのRT(DK応答「5」、M=1,656ms、SD=544ms、N=13)よりも有意に遅く、t(21)=2.24,p=0.04となった。一方,正解者と過小評価者を合わせたグループでは,逆のパターンのRTを示し,自分を90%以上と評価した場合には遅い反応時間を示し(M = 2,457 ms, SD = 634 ms, N = 5),自分を60%以下と評価した場合にはわずかに速い反応時間を示した(M = 1,604 ms, SD = 329 ms, N = 3; t(6) = -2.12, p = 0.08)(図4)。

図4 反応時間

 

左:Dunning-Kruger群による高パーセンタイル推定と低パーセンタイル推定の平均反応時間。参加者が59パーセンタイル以下の成績だと思っていることが、課題の「1」の回答に、90パーセンタイル以上の成績だと「5」の回答に対応している。これらの反応時間は、個々のサンプルサイズが比較的小さかったため、過大評価者と、正解者と過小評価者を合わせたグループで分けられている。平均反応時間はミリ秒で表示されている。各黒点は,各条件における被験者の生のスコアを表す。エラーバーは平均値の標準誤差を示す。右:各グループごとの記憶エンコーディング課題の反応時間。黒い棒は各グループの平均値を表す。なお、エンコーディング反応時間については、平均値からの標準偏差が3を超えていたため(本文参照)1名のデータを解析から除外している。

グループ間では,自分が一番うまくできていると思うと答えた場合(つまり90パーセンタイル以上),過大評価者は正確評価者と過小評価者を統合したグループ(M = 1,656 ms, SD = 544 ms, N = 13)よりも有意に速かった(t(16) = -2.68, p = 0.02).逆のパターンは,59パーセンタイル以下と評価した場合に見られた(図4,表6)。過大評価者は,正解者と過小評価者を合わせたグループ(M = 1,604 ms, SD = 330 ms, N = 3)よりも比較的ゆっくりと回答した(M = 2,204 ms, SD = 628 ms, N = 10)が,この一般的なパターンは,今回のサンプル数では有意ではないことがわかった(t(11) = 1.56, p = 0.15)。他のDK評価(2’sおよび4’s)のRTについても、2×2の2因子反復測定ANOVAを用いて同様の分析を行ったところ、低い評価の回答では、条件、グループ、相互作用のいずれにも有意な効果は見られず(すべてF’s<1)先に見られたRTの相互作用効果は、最高および最低のパフォーマンス推定値に限定されることが示された。

全体的に見て、RTの有意な発見は、少数のサンプルを用いた探索的な分析であり、他の科学的知見と同様に、独立した研究機関による裏付けが必要である。しかし、これらの結果は、サンプル数が少ないグループにもかかわらず持続しており、今後、より大きなグループを用いた研究でも同様のパターンが見つかる可能性がある。回答のパターンから、自分の能力を過大評価する誤りを犯した人は、自分が最高の出来だと信じたときの回答も早く、最悪だと言ったときの回答も遅いという証拠が得られた。一方、より正確な過小評価をした人は、自分が最高だと言ったときの回答が遅く、最悪だと言ったときの回答は比較的早いという結果が得られた。

2.7.4 |. エンコーディング時の応答時間

DKEを説明する1つの可能性として、グループレベルの違いは、人々が情報を記憶にエンコードする方法に起因する可能性がある(Addante et al 2015; Craik & Lockhart, 1972)。実際、DKEの初期の説明では、結果は、情報獲得を改善することで修正可能な被験者の能力に起因する可能性があると仮定されている(Kruger & Dunning, 1999)。同様に、被験者が検索時に自信過剰になったのは、エンコーディング時の過剰な流暢性が情報を「簡単に覚えられた」という感情をもたらし、検索時に流暢性の直感的な認識や慣れに頼ってしまい、その結果、パフォーマンスが向上したと誤って判断したのかもしれない(Leynes & Addante, 2016; Leynes & Zish, 2012; Whittlesea & Leboe, 2000, 2003)。
これらの可能性を知るために、参加者が各項目をエンコードしている間の情報処理の一般的な指標として平均エンコード時間を、両側グループ間t検定を用いて分析し、平均からの標準偏差が3を超えていたため、過大評価者のグループの中の1つの外れ値を除外した(図4)。符号化の際,過大評価者(N = 37, M = 1,289 ms, SD = 319, SE = 52)は過小評価者(N = 10, M = 1,651 ms, SD = 655, SE = 207)よりも速く反応した(t(45) = -2. 正解の推定者(N = 8, M = 1,159 ms, SD = 331, SE = 117)も、過小推定者よりもわずかに速く反応した(t(16) = 1.92, p = 0.071)。過剰推定者と正しい推定者のRTには,信頼できる差は見られなかった(t(43) = 1.04, p = 0.303) (図4)。これらの結果から,過小評価者は,後にテストされる情報に触れる時間が(わずかに)長かったために,より良い結果が得られたのではないかと考えられる。

2.8 |. 電気生理学的結果

脳波データは、メタ認知判断と認知戦略の違いを調べるために、いくつかの系統的なステップで分析された。「方法」の項で述べたように、ERP分析では、比較するERP条件の両方で最低数の有効なERPトライアルを維持している被験者のみを対象としたが、その結果、当初のN = 61よりもサンプルサイズがやや小さくなり、報告された各結果の自由度にその旨が記載されている。まず,記憶とメタ認知のタスク間で識別できる一般的なERPの違いについてデータを評価した。そのために,Dunning-Kruger判断のすべての判断をまとめたときのERPと,項目記憶判断のすべての判断をまとめたときのERPを比較して評価した(図5)。その結果,メタ認知的なDKE判断に対するERP活動は,記憶判断に対するERP活動よりも有意に大きく,ほぼすべての電極部位において,約300msから始まり,1,000msまで継続した。これらの効果は,中央頭頂部のPzで800msまで最大となり(300〜500ms:t(53)=10.69,p<0.001,400〜600ms:t(54)=15.19,p<0.001,600〜900ms:t(53)=9.79,p<0.001),周辺のいくつかの部位でも同じように信頼性があったが,その後,900〜1,200msの間は,中央前頭葉のFzで最大となり(t(53)=6. これは,新奇性処理パラダイムやオッドボールパラダイムにおける頭頂部および前頭葉のP300a/b効果に関する先行研究の結果と一致している(Curran, 2004; Kishiyama, Yonelinas, & Lazzara, 2004; Knight, 1996; Knight & Scabini, 1998; Woodruff, Hayama, & Rugg, 2006)。この基本的な知見により,DKEのメタ認知判断時のERPは,記憶に関連する活動とは確実に区別されるという基盤が確立されたので,さらに調査を続けた。

図5 記憶判定とDunning-Kruger判定のERPの比較

a) すべてのアイテムの記憶判断とすべてのDunning-Kruger判断(DK判断から記憶判断を除いたもの)のERPを比較したトポグラフィー・ディファレンス・マップ。各トポグラフィマップは、レイテンシーごとの最大値と最小値に応じて範囲正規化されている。また、各マップの下には、それぞれのスケールが記載されている。b)中央頭頂部サイズPzにおける記憶およびDKタスクのERP、x軸は時間(ミリ秒)y軸はμV。

DKEグループの記憶判断の仕方には違いがあるのか?次に、DKEグループの種類(過大評価者と過小評価者)の違いによる、記憶の生理的な違い(ヒットの「古い-新しい」効果-正しい拒絶)を調べた。慣れに基づく処理に特徴的な待ち時間(FN400;Addante, Ranganath, Olichney, et al, 2012; Addante, Ranganath, & Yonelinas, 2012; Rugg & Curran, 2007)の間の早い時間(400-600ms)に見ると,前頭葉中部の部位Fzでは,条件(ヒット,正解拒否のERP振幅)とグループ(過大評価者[N = 36],過小評価者[N = 10])を因子とする2×2反復測定ANOVAでは,いずれの因子や交互作用も有意な効果を示さなかった。しかし,頭頂部Pzでは,条件の主効果(F(1,46) = 5.63, p = 0.022)と条件×グループの交互作用(F(1,44) = 5.0, p = 0.030)が有意に認められた。その結果,過小評価者は過大評価者に比べて有意に高い新旧効果の振幅(M = 1.39, SD = 1.59)を示した(M = 0.25, SD = 1.38)。この違いは、FN400に特徴的な左前頭部ではなく、頭頂部で明らかになったことから、回想活動の早期活性化を示している可能性があるが、慣れや暗黙的な処理に関連する機能的意義についての他の解釈の可能性を排除するものではない(Addante, 2015; Voss et al, 2010, 2012; Voss & Paller, 2007, 2017)。

その後、左頭頂部位P3の600msから900msにかけて、条件(ヒット、正解拒否のERP振幅)とグループ(過大評価者、過小評価者)を因子とする2×2反復測定ANOVAを行ったところ、条件の主効果(F(1,46)=7.36,p=0.009)と条件×グループの交互作用(F(1,44)=9.91,p=0.007)が見られた。この結果を受けて,グループ間のt検定を行ったところ,過小評価グループ(M = 1.96, SD = 1.35)は,過大評価グループ(M = 0.30, SD = 1.72)よりもLPC効果(ヒットコレクト拒否振幅)が有意に大きく,t(44)=2.81; p = 0.01となった(図6)。この結果は、隣接する電極間でも同様であり、最高のパフォーマンスを発揮する人たちで構成される過小評価グループが、過大評価グループよりも多くの記憶を使って記憶の判断をしていることを示唆している。したがって、過大評価者は最も成績が低いため、記憶への依存度が相対的に低下したことが成績低下の一因である可能性がある。

図6 ダニング・クルーガーグループの認識記憶ERP効果の差波

左上。左頭頂部電極P3において、Dunning-KrugerグループのOver-EstimatorとUnder-Estimatorの記憶効果(ヒット数から正解拒否数を引いたもの)のグループ差波を示したトポグラフィーマップで、マップは最大と最小のマイクロボルトで範囲が正規化されている。右上。P3における各グループ(過大推定者と過小推定者)の記憶効果の差波(ヒット数から修正拒否数を引いたもの)のERP(600〜900ms)。Y軸が0の場合は記憶条件のERPに差がないことを表し、斜線部分は各グループの平均の標準誤差を表す。暖色はより正の方向に向かう電圧差を表す。左下:600〜900msの差分波の生の振幅をグループごとに分類したもの。右下:各被験者のP3における600-900msのヒットと正解の拒否の振幅をグループ別に分類したもの。

推定量が多い人と少ない人では、メタ認知的な判断はどのように異なるのであろうか?このコア・クエスチョンを調べるために,DKE判定(すべての回答を折り畳んだもの)による過大推定者と過小推定者のERPのグループレベルの違いを分析した。その結果,前頭葉中央部の電極Fzでは,400msから600msの間,過小評価者と過大評価者の間でERPの振幅に有意な差があり(MOver-Estimators = 4.16, SD = 5.09; MUnder-Estimators = 0.55, SD = 4.40; t(44) = -2.04, p = 0.048),過大評価者のERPは過小評価者のERPよりもはるかに正の値を示した(図7)。これらの結果から,400〜600msにおける前頭葉効果は,慣れに基づく処理に関連するFN400 ERP効果の特徴であることが示唆される。つまり,過大評価者は,より明確な記憶関連処理(Yonelinas er al)。

図7 Dunning-KrugerグループによるDunning-Kruger推定値のERP

トポグラフィーマップは、400-600msの間、Over-EstimatorとUnder-Estimatorを比較したDunning-Kruger反応(Dunning-Kruger判断1,2,3,4,5を合わせたもの)を折り畳んだERPを示している。トポグラフィーマップは、最大値と最小値でレンジノーマライズされており、暖色はよりポジティブな電圧差を表す。右図28.1|の中前頭部位でのダニング・クルーガー法による過大評価者と過小評価者の判定のERP。

2.8.1|記憶とメタ認知の脳-行動関係

前述の結果から、記憶効果とメタ認知効果の間には、被験者個人レベルでの系統的な関係が明らかになっているのではないかという疑問が生じた。過大評価者と過小評価者のグループでは、P3の600msから900msの間に生じるLPC効果の大きさ(hits-CR)は、被験者がヒットした割合と有意な相関があり(r = .318, p = .031, N = 46)また、確信度の高いヒットがソースメモリの正解に至った時の応答速度と負の相関があることがわかった(r = -.305, p = .039, N = 46; 図8)。推定不足のグループでは,LPC効果の大きさは,各被験者がテスト中に与えたDunning-Kruger反応の平均値と負の方向に相関していたが(r = -.798, p = .006, N = 10),推定過剰のグループでは関係が見られなかった(r = -0.014, p > . 図8)。このことから,パフォーマンスの高い過小評価者の場合,LPC効果は,その被験者のタスクパフォーマンスの推定値に対する続く平均的なダニング・クルーガー推定値を確実に予測し,LPCの大きさが大きいほど,相対的に低いパフォーマンスの推定値を予測することになる。

図8 記憶とメタ認知に関する行動と脳の測定値の関係

 

X軸は、過小評価群と過大評価群を合わせたLPC効果の大きさを表す(LPCは、項目認識記憶テスト中の左頭頂部位P3の600〜900msにおけるヒットから正解拒否を差し引いたERPとして測定(左上、右上、左下パネル)。右下のパネルのX軸は,試験中のDunning-Krugerのパフォーマンス推定課題中の400〜600msにおけるメタ認知判断のための中前頭部のERPの振幅をグループ別に表している。Y軸は、項目記憶ヒット(記憶検索課題で「古い」状態の項目に対して4または5の判定)が成功した割合(左上)項目信頼度の高いヒットとソース記憶判定の両方が正しかった回想関連試行の反応時間(ミリ秒)(右上)メタ認知的DK判定の際に被験者が与えたテスト内パフォーマンス推定値の平均値を表す。

これらの知見を総合すると、LPCの大きさが大きいほど、記憶テストでのヒットの割合が高く、ソースメモリが正しい高確信度ヒットの回想関連項目の応答時間が速いことと関連していることが明らかになった(Addante, Ranganath, & Yonelinas, 2012; Addante et al 2011; Roberts et al 2018)。したがって、LPCは回想と関連しており、被験者が予測した回想シグナル(LPC)が多いほど、メタ認知判断における平均的なDK反応を介して、自分の記憶パフォーマンスを過小評価する傾向が強かった(図8)。このように、回想することで、人はより謙虚なメタ認知的自己認識を示すようになるようである。では、「過小評価」をしている人たちは、「優越感」を回避するために何をしているのであろうか?その一つの証拠として,過小評価者のグループでは,前頭葉中部の400msから600msにかけてのメタ認知判断のERPの大きさが,被験者がテスト中に行ったダニング・クルーガー反応の平均値と有意な正の相関を示したことが挙げられる(r = . 774, p = 0.009, N = 10)と有意な正の相関を示したが,この関係は,より大きなFN400様効果を示した過大評価者(r = 0.025, p = 0.886, N = 36)では明らかではなかった(図7および8)8)。このことから、過小評価者は、慣れに基づく処理が相対的に不足しているために、課題における自分のパフォーマンスの評価を低く報告するように支配されていると考えられる。

3 |. 考察

本研究では、脳波を記録しながら進行中のエピソード記憶テストに散りばめられたDKE推定値の複数の測定値を評価した。行動計測の結果から、まず記憶パラダイムがDKEの誘発に成功したことが明らかになった。参加者をパフォーマンスの四分位に分け、グループ内の実際のパーセンタイル順位を推定パーセンタイル順位と並べてプロットした(図2)。その結果、パフォーマンスが最も低い四分位の参加者は、グループ内での自分の順位を大幅に過大評価しており、パフォーマンスが最も高い参加者は、実際の順位を適度に過小評価していることがわかった。この基本的な発見は、エピソード記憶におけるDKEを研究するための新しいパラダイムの出発点として重要であり、この発見により、行動および電気生理学的領域の両方について、より具体的な方法でデータの探索を続けることができた。

3.1 |. 行動学的所見

本研究のパラダイムは、グループレベルで分析可能な複数のダニング・クルーガー判断のRTを有意に収集することを可能にした。これは、DKEの先行研究では、研究終了時にメタ認知パフォーマンスの推定値を一度だけ測定していたために調査できなかったものである。その結果、過大評価者は過小評価者に比べて、自分が上位パーセンタイルにいると判断するのが明らかに早かったが、下位パーセンタイルにいると判断するのは遅かった。従って、過小評価者は、自分が最高のパフォーマンスをしていると報告するのがわずかに遅く、自分が悪いパフォーマンスをしていると主張するのが早かった。この結果を説明する1つの方法として、Kruger and Dunning (1999) の低成績者による二重の無知のモデルがある。このモデルでは、低成績者は(a)答えを知らず、(b)自分の答えが間違っていることを知らないと仮定している。したがって、成績の良い低評価者は、(自分の能力のために)自分も失敗したかもしれないことを知っているので、自分はうまくいっていると主張する回答には慎重になるだけの自意識があり、同様に、(自分が知っていることだけでなく、自分が知らないかもしれないことも知っている)より謙虚な能力に導かれて、自分は成績が悪いと考えるのが早いと考えられる。生理的信号とRTの相関分析(図8)は、これらの判断が、処理時間の長さを犠牲にしてより正確な記憶処理に基づいている可能性を示唆している。このような速度と精度のトレードオフの証拠から、”Don’t rush “や “Speed kills “といった一般的なメッセージが浮かび上がってくる。

3.2 |. 神経生理学的知見

我々は、DKEの神経生理学的な研究を、記憶タスクとメタ認知タスクの間の処理の一般的な違いに関する脳活動を調べることから始めた。記憶の試行とパーセンタイルの推定の試行の間のERPは,ほぼすべての電極部位で,エポック開始約300ミリ秒から1,200ミリ秒までの間,信頼性の高い差があることがわかったが,最初に後部頭頂部で最大となり,その後,中部前頭葉でも最大となった。このパターンは,P300 ERP効果の確立された特性(P3a効果とP3b効果)と一致している。P300 ERP効果は,それぞれ早期/後期,後部/前部の領域間でトポグラフィーとレイテンシーの分布が同じであることが知られており,目新しさの処理やオッドボール課題と関連することがよく知られている(Dien, Spencer, & Donchin, 2003; Otten & Donchin, 2000; Simons, Graham, Miles, & Chen, 2001)。これは、今回のパラダイムと一致しており、DKE判定は、テスト中の共通記憶試行の中に現れた珍しい試行であり、目新しさのある項目として注意の方向付け効果を引き出すための顕著な刺激であったと考えられる(Kishiyama, Yonelinas, & Lazzara, 2004; Knight, 1996; Knight & Scabini, 1998)。

次に,メタ認知判断の違いが,ERPパターンの違いと関連しているかどうかを調べた。すべてのDunning-Kruger反応の脳活動を一緒に調べたところ,過大評価者は過小評価者よりも前頭電極部位で400〜600msの間に高いERP振幅を持つことがわかった。これは,慣れに基づく処理のFN400効果の既知の特性と一致します(Addante, Ranganath, & Yonelinas, 2012; Review for Rugg & Curran, 2007参照)。これらの初期のERP効果は、錯覚的優越感のエラーが、偽名声効果の研究で見られたような一般的な慣れに過度に依存することによって引き起こされる可能性を示唆している(Jacoby, Kelley, et al 1989; Jacoby, Woloshyn, et al 1989; Jacoby, Woloshyn, & Kelley, 2004)。一方、過小評価者(最も成績が良かった人)は、記憶判断時の600msから900msの間、過大評価者よりも大きなLPCを示した。これは、過小評価者が、正確さに欠ける慣れとは対照的に、記憶された情報の明確な詳細を頼りに判断している可能性を示している(Yonelinas er al)。)

DKE判定時のERPの分析では、前頭葉中部のFN400に類似した効果が見られ、過大評価者と過小評価者がパーセンタイル判定を行う際に異なる処理が行われていることを示唆する、新たな知見が得られた。これは、多くの先行研究で慣れの神経相関とされてきたFN400の特徴的な位置と待ち時間である(Addante, Ranganath, Olichney, et al 2012; ReviewsはCurran, 2000; Friedman, 2013; Rugg & Curran, 2007; Mecklinger & Bader, 2020)。このように、各グループは、親しみやすさや流暢さなどの記憶の異なるプロセスに頼っている、または影響を受けているため、根本的に異なるメタ認知的な結論に到達しているようであった。このことは、RTの行動データにも反映されており、クロスオーバーの相互作用パターンの反応が見られた。

3.3 |. メタ認知的判断のための記憶に基づくフレームワーク

冒頭で我々は、記憶に基づくフレームワークによって、DKEで見られるイリュージョン・エラーを説明できるのではないかと仮定した。それによって、これらのエラー(および成功)は、少なくとも部分的には、慣れと記憶の認知プロセスの違いに基づいて導かれることになる。このようなモデルでは、慣れは、課題に対する過去のパフォーマンスの詳細がわからない人が使用するヒューリスティックに関連する基礎的な認知処理を提供し、その結果、自分がどれだけうまくできたと思っているかを誤って過大評価するように誘導すると考えられる(慣れはあるが詳細がないことに基づく過大評価。Voss & Paller, 2010; Whittlesea, 1993, 2002; Whittlesea, Jacoby, & Girard, 1990; Whittlesea & Leboe, 2000, 2003; Whittlesea & Williams, 2000)。一方、「回想」とは、過去の経験の記憶を、そのエピソードの項目と結びついた豊かさ、詳細さ、文脈情報を伴って正しく取り出すことを制約する認知プロセスと考えられる(Diana et al 2008; Eichenbaum et al 2007)。このように、回想という認知プロセスが利用可能であれば、人々はその過去の経験の事実の詳細によって、より保守的に制約されたパフォーマンスの自己評価を行うように導かれ、それによって、単に文脈的に馴染みがあるように見えることに基づいて、過剰なパフォーマンスを誤って想定してしまうリスクを回避することができる。

RTの行動的所見と合わせて考えると、過大評価者は「すぐに自慢したがる」のに対し、ハイパフォーマーは自分が最高であると判断するのに時間がかかり、その慎重さがより良いスコアと関連していたようである。さらに、ERPのデータは、過去の記憶を明確な文脈と詳細で思い出すことが、我々を謙虚にさせるのに重要な役割を果たしていることを示唆している。一方、単なる親しみの感情に頼ることが、我々を過大評価させているのかもしれない。このように、より良い評価判断を導くのは、文脈に縛られた項目の組み合わせを思い出すというゆっくりとしたプロセスなのかもしれない(Addante, Ranganath, & Yonelinas, 2012; Diana et al 2008; Eichenbaum et al 2007)。

これに関連して、慣れに関する研究では、決定ヒューリスティックに含まれる慣れの判断に、推測や流暢性が寄与していることが確認されている(Voss, Lucas, & Paller, 2010; Whittlesea, 1993, 2002; Whittlesea et al 1990; Whittlesea & Leboe, 2000, 2003; Whittlesea & Williams, 2000)。このような流暢さは、偽名効果(Jacoby, Kelley, et al 1989; Jacoby Woloshyn & Kelley, 2004)で発見されたのと同様に、他者と比較して自分自身について誤った結論に飛びつくことにつながっていると考えられる。この解釈は、人々が最初のニーモニック情報をどのようにエンコードしたかに起因すると理解されるならば、違いは人々のタスクコンピテンシーに起因するという先行説明(Adams & Adams, 1960; Ehrlinger & Dunning, 2003; Kruger & Dunning, 1999; Oskamp, 1965; Pennycook et al 2017; Ryvkin et al 2012; Sanchez & Dunning, 2017; Schlösser et al 2013)と一致する。情報をうまくエンコードできなかった人は、後でその情報を思い出す可能性が低いと考えられる(すなわち、注意力、モチベーション、注意散漫のいずれかが悪い;Addante et al, 2015; Craik, Eftekhari, & Binns, 2018; Craik, Luo, & Sakuta, 2010; Craik, Naveh-Benjamin, Ishaik, & Anderson, 2000; Fernandes, Moscovitch, Ziegler, & Grady, 2005; Galli, Gebert, & Otten, 2013; Middlebrooks, Kerr, & Castel, 2017; Weeks & Hasher, 2017)また、後になって、親しみやすさや流暢さのヒューリスティクスを用いながら、実際にどれだけのパフォーマンスをしているかを正確にキャリブレーションできるようになるだろう(Mecklinger & Bader, 2020; Whittlesea, 1993, 2002; Whittlesea er al)。 , 1990; Whittlesea & Leboe, 2000, 2003; Whittlesea & Williams, 2000)。

したがって、エンコーディング時のRTを分析したところ、過大評価者は過小評価者よりも早く反応しており、これは流暢性に関する先行研究の多くの知見と一致している(Alter & Oppenheimer, 2009; Bader & Mecklinger, 2017; Bruett & Leynes, 2015; Castel, McCabe, & Roediger, 2007; Cermak, Verfaellie, Sweeney, & Jacoby, 1992; Doss, Bluestone, & Gallo, 2016; Hertzog, Dunlosky, Robinson, & Kidder, 2003; Kurilla & Westerman, 2008; Leynes & Addante, 2016; Leynes & Zish, 2012; Li, Gao, Wang, & Guo, 2015; Nie, Xiao, Liu, Zhu, & Zhang, 2019; Serra & Dunlosky, 2005; Thapar & Westerman, 2009; Volz, Schooler, & von Cramon, 2010; Westerman, 2008; Whittlesea & Leboe, 2000, 2003)。このように、被験者は、アイテムがより流暢に見えることによって、アイテムに対してより早く反応した可能性がある。符号化RTから得られたこれらの知見は、幻想的な過大評価者が、情報がより簡単に習得できると信じるために、流暢性の向上に依存している可能性を示しているように見えますが、正しい評価者と同じ応答時間を得たという知見にも反している。一方、過小評価者は、情報をよりよく学習するために(わずかに)多くの時間を費やしたためにパフォーマンスが向上したと考えられ、これも後の課題遂行能力の裏付けとなる。今後の研究では、このような可能性をよりよく解決するために、フルエンシーの経験的な操作とエンコーディング中の生理学的な測定の両方が役立つだろう(例えば、Bader & Mecklinger, 2017; Bruett & Leynes, 2015; Leynes & Addante, 2016; Leynes & Zish, 2012)。

3.4 |. 代替的な解釈

意思決定に関する研究では,P300効果のタイミングと傾きがそれぞれ意思決定課題における証拠の蓄積と関連するというERPの証拠が得られている(Boldt, Schiffer, Waszak, & Yeung, 2019; O’Connell, Dockree, & Kelly, 2012; Twomey, Murphy, Kelly, & O’Connell, 2015)。パフォーマンス推定時のERPにグループ差があるという今回の結果については,被験者間の意思決定やエビデンス獲得の差を反映している可能性がある(同様のモデルについては,Urai & Pfeffer, 2014を参照)。この説明では,過大評価者は不十分な証拠の蓄積に頼って不正確な決定をしている可能性がある(馴れ合いに基づく信号検出プロセスの特徴と一致する;Yonelinas et al, 一方、過小評価者は、成長の遅い統合シグナル(Summerfield & Tickle, 2015; Twomey et al, 2015)に対して、証拠の蓄積がよりゆっくりと行われたために、自分が最善を尽くしていると信じるのが遅かったのかもしれない(これは、記憶の閾値モデルと一致する;Parks & Yonelinas, 2009; Yonelinas er al)。) 我々が見つけた相関結果はこれと一致しており、ダニング・クルーガー判断のP3信号の大きさが大きいと、過小評価者のパフォーマンス推定値が高くなることが予測された。なぜなら、彼らはそれらのより良い判断を裏付けるより多くの証拠を獲得していたと推定されるからである(Boldt, 2019; O’Connell et al 2012; Twomey et al 2015)。

しかし、この結果は、意思決定プロセス、タスクへの注意、タスク中の異なる戦略の使用におけるグループ間の中核的な違いを反映していない可能性を示唆する、いくつかの証拠もある。第一に、Dunning-Krugerの反応分布や、Dunning-Kruger判断タスクの全体的なRTには、グループ間で差がなかったが、これはこのような説明から予測される。第二に、判断基準のシフト(C)や応答バイアス(B)の使用の定量化においても、グループ間で差がなかった。したがって、他の意思決定要因や違いが観察された効果をもたらしている可能性は常にあるが、そのような兆候を直接測定した4つの方法のいずれにも、その証拠はなかった。

3.5 |. 限界と今後の研究のための検討事項

今回の実験は、DKEの理解を深めるためにいくつかの新しい貢献をしているが、一方で、今後の探求のための余地も残している。例えば、今回の研究では、ダニング・クルーガー比較を計算する際の標準的な慣習に従い、他者に対する自分のパーセンタイルの推定値に基づいて人々を分類したが、今後の研究では、(自分のパーセンタイルグループの推定値ではなく)人々の個人的なパフォーマンススコアの推定値の正確さに基づいてグループを分類した場合の潜在的な違いを調査することが有益であろう。具体的には、今回の研究では、自分がどのパーセンタイルグループに属していると考えているかという点では差がなく、記憶課題で実際にどのようなパフォーマンスをしたかという点でのみ差があった。つまり、ある人の推定値は正しく、ある人の推定値は間違っていたが、誰もが自分は他の人に比べて「平均以上」のパフォーマンスをしていると思っていたのである。今回の結果のグルーピングは、このように、一部は記憶タスクのパフォーマンスによって、一部は他者がどのようなパフォーマンスをしているかを直感的に「知っている」能力によって行われており、これは「偽コンセンサス効果」(Bauman & Gehar, 2002; Marks & Miller, 1987; Ross, Greene, & House, 1977; タスクパフォーマンスに関する関連する知見についてはMcIntosh, Fowler, Lyu, and Della Sala, 2019も参照)と同様である。

このように他者に関する知識は、この比較効果に重要な役割を果たしており、今回の研究では、意図的に他者に関するガイダンスを参加者に与えなかった。また、テスト後に参加者自身の自己推定の評価を収集したが、それらの単一の試行では、グループパーセンタイルに関するテスト内の評価の平均値と差がなく、また、ERPや反応時間の測定において効果的なS/N比を得るために多くの試行を必要とする分析には使用できなかった。DKEは伝統的に、他者と比較した自分自身の推定値(すなわち、グループ配置のパーセンタイル推定値)として測定されてきたことから、今回の調査では、既存の文献との一貫性を保つことを目指した。

今回の研究は、すべての初期調査に内在する限界も維持している。発見は、一般化可能性の評価、境界条件のテスト、他のサンプルサイズや実験変数での再現性の独立調査が必要である。特に、我々の行動学的知見のいくつかは、比較的小さなサンプルサイズに頼る必要があった(すなわち、高い推定値と低い推定値のRT)。現在のパラダイムは、さらに小さなサンプルサイズの臨床患者を用いた先行研究で有効であることが判明しているが(Addante, 2015; Addante, Ranganath, Olichney, er al)。 先に述べたように、このような探索的な分析は、他の科学的知見と同様に、独立した研究機関による裏付けが必要となる。しかし、この研究に参加したほとんどの人は、過大評価のエラー(我々が研究しようとした目標)を示していたので、今回の比較的大きなサンプル(N = 61)の大部分は、過小評価の小さなグループには含まれないと定義されたことに留意すべきである。しかし,これらの効果を検討する際には,効果的なS/N比を得るために,試験の組み入れ基準を厳密に管理した(「方法」を参照)。また,今回の研究で観察された信頼性の高い効果からもわかるように,サンプルサイズが小さいと,本質的に達成すべき課題が大きくなります(我々はこれを克服した)。

さらに,電気生理学的な結果は,ダニング・クルーガー現象に寄与する記憶効果を示唆するものとして説得力があるが,逆推論に頼りすぎないように注意する必要がある(Paller, Lucas, & Voss, 2012; Poldrack, 2011)暗黙的な流暢性や概念的なプライミングなど、他の認知プロセスもERP効果に寄与する可能性があるからである(Voss & Paller, 2010a, 2010b; Voss, Lucas, & Paller, 2012; Leynes & Zish; Leynes & Addante, 2016; ただし、Addante, Ranganath, & Yonelinas, 2012; Addante, Ranganath, Olichney, er al)。 , 2012; Bader & Mecklinger, 2017; Bridger et al 2012; Mecklinger et al 2012)。今後の研究では、このような方向性の探求が有益であると考えられるが、今回の研究は、確立されたERPの知見の広範な文献に基づいている(Addante, Ranganath, Olichney, et al 2012; Addante, Ranganath, & Yonelinas, 2012; Rugg et al, 1998 for Review see Rugg & Curran, 2007)認知プロセスの行動的・生理的相関の間に系統的な関係を観察した(図8;Addante et al 2011;Stiers, Falbo, Goulas, van Gog, & de Bruin, 2016;Macleod & Donaldson, 2017)。

今回の研究の最後の制限は、著者も、本質的にDKEのバイアスが蔓延していて、その価値を過大評価していたり、結果を誤って解釈していたり、反実例の証拠に気づかなかったりする可能性があるということである。今回の研究が、これらの発見をより深く研究し、拡張し、競合する仮説に対して検証するという、今後の研究の動機付けとなる価値を提供することを期待している。

4  まとめと結論

結論として、本研究は一連の小さなステップによって文献に追加された。第一に、本研究はDKEの最初の生理学的測定と現象の反応時間測定を表している。第二に、本研究は、Dunning-Krugerメタ認知判断の複数の反復試行を測定できるように開発された統合的な新しいパラダイムであり、他の研究者が我々の理解をさらに深めるために使用することができる。第三に、このパラダイムの革新により、複雑なエピソード記憶課題でDKEを捉えることが可能となり、DKEに関する研究を項目記憶やソース記憶の確信度測定のエピソード記憶課題にまで拡張することができた。これらの工夫により、なぜ人によってこの現象に違いがあるのかという収束的な洞察が明らかになった。我々は、将来の研究者がこの現象を継続的に探求するための道筋を提供してくれることを願っている。

他人に比べて自分の能力を過大評価するという悪質な心理現象は、歴史的にも文化的にも、ソクラテスや孔子などの哲学者によって観察されてきた(Socrates from Apology by Plato, 21d; Confucius, trans. 1938/500; Confucius, 1938)ユダヤ教、キリスト教、ポリネシア教、イスラム教などの古文書で戒められている(Proverbs 12:15; 1 Corinthians, 3:18; Qur’an 31: また、現代においても、大学教授、学長、学部長、査読者など、最高位の役職と最低位の役職の両方に就く指導者にまで及んでいる(Cross, 1977; Huang, 2013; Bradley, 1981)。DKEの大前提は、重力が物理的な宇宙の背景を形成するのと同じように、社会心理学的な宇宙を形成する基本的な力であるように思える。錯覚的な優越感の落とし穴を避けるためには、自己認識を持って取り組む必要があり、実践と情報に基づいたフィードバックから確実に利益を得ることができる。

ここでは、その方法の一つとして、直感、流暢さ、親しみやすさに頼って素早く判断することを避けることを示している。その代わりに、他人と比較したときに錯覚的優越感のエラーを減らすために、詳細の記憶とゆっくりとした反応に頼ることを推奨する結果となった。さらなる実験が必要であるが、今回の研究では、他者と比較して自分の能力を過大評価したり過小評価したりするという、リーダーシップや安全面での危険につながるエラーに関与する認知プロセスの一部を明らかにした。今回の研究が、我々の心理的プロセスの神経相関を発見し、我々自身と人間の行動の真実をよりよく理解するための、新たな探求のきっかけとなることを期待している。

謝辞

EEGデータの収集にご協力いただいたCelene Gonzalez氏、Rose DeKock氏、Constance Greenwood氏、Raechel Marino氏、Yoselin Canizales氏、Kevin Benitez氏、Yesensia Casas氏、Maynori Hinton氏、Roman Lopez氏に感謝する。また、エンコーディング反応時間の分析にご協力いただいたRosalinda Valencia氏、パラメータ推定値の算出に使用したROC Toolboxにご協力いただいたJoshua Koen博士に感謝する。また,2人の匿名の査読者からは,洞察力に富んだコメントをいただき,貴重な改善点を指摘していただきたので,感謝いたする。

本研究は,以下の助成金および資金提供を受けて実施した。国立神経疾患・脳卒中研究所(National Institute of Neurological Disorders & Stroke)からRJAへのNational Institute of Health Grant 1 L30 NS112849-01,CSUSB Office of Sponsored ResearchからRJAへのMini-Grant Program,CSUSB Office of Student Research (OSR)からRJAへのFaculty Assigned Time Grants.CSUSB学術研究局からRJAへの教員夏季研究奨学金、社会・行動科学部からRJAへの学部夏季研究奨学金、教授会・プロボストからRJAへのCSUSB Assigned Time for Exceptional Service to Students賞。CSUSB Student Success Initiative Innovative Scholars Fund(LASとAM)CSUSB Student Success Initiative Culminating Project Awards(LASとAM)CSUSB社会・行動科学部長からのOutstanding Graduate Student Award(AM)CSUSB OSRからのOutstanding Graduate Student Researcher Award(AM)CSUSB Graduate Studies OfficeからのOutstanding Master’s Thesis Award(AM)などがある。

資金調達情報

米国国立神経疾患・脳卒中研究所、グラント/アワード番号:1 L30 NS112849-01

略語の説明

DKE ダニング-クルーガー効果
EEG 脳波
ERP イベント関連電位

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー