因果関係の非対称性についての考察
Reflections on the asymmetry of causation

強調オフ

因果論・統計学

サイトのご利用には利用規約への同意が必要です

royalsocietypublishing.org/doi/10.1098/rsfs.2022.0081

研究論文

Reflections on the asymmetry of causation

公開日:2023年4月14日

要旨

私たちの世界観の中で最も顕著な非対称性は、因果関係の非対称性である。この数十年、因果関係の非対称性に新たな光を当てたのは、統計力学の基礎が明らかになったことと、因果関係の介入概念の発展という2つの進展である。本論文では、熱力学的勾配を仮定した因果の矢印と、因果の介入主義的な説明はどのような状態なのかを問うものである。熱力学的勾配に根ざした客観的非対称性が因果関係の非対称性を支えていることがわかった。熱力学的勾配に沿って、介入主義的因果経路(足場のある介入、変数間の確率的関係を支持する)は、未来に影響を伝播するが、過去には伝播しない。なぜなら、低エントロピーの境界条件が存在する現在の世界のマクロ状態は、過去への確率的相関を遮断してしまうからだ。しかし、この非対称性は、巨視的な粗視化によってのみ現れるものであり、このことは、矢印が単に私たちが世界を見る巨視的なレンズの人工物だろうかという疑問を提起する。この疑問は研ぎ澄まされ、答えが提示される。

1. はじめに

ニュートン以前は、因果関係は客観的な世界的関係のパラダイム例であると大きく想定されていた。初期の科学では、因果関係は世界の基本的な秩序関係として扱われていた。物理学における因果関係の議論は、バートランド・ラッセルが1903年に発表した論文から始まった。彼は、現代の数学的な形態の物理学には、因果関係のようなものが基本レベルでは組み込まれていないことを観察した。彼は、因果関係の概念の後継は、時間的進化の時間対称の法則であると主張し、科学的文脈で因果関係の話を排除し、それを支持することを提案した[1]。ラッセルの立場は、様々な理由から実現不可能であることが判明したが、根本的な力学が時間対称であるにもかかわらず、非対称性はどこから来るのかという疑問を提起した。因果関係の非対称性は、私たちの世界経験を特徴づける一連の時間的非対称性の中で、間違いなく最も重要なものである。過去数十年の間に、因果関係の非対称性に光を当てたのは、(i)因果関係の介入分析の導入、(ii)統計力学の基礎の明確化、という2つの進展である。しかし、これらの進展を利用した最近の研究では、非対称性が視点的だろうかどうか(どのような意味で)疑問が呈された([2-7]、特に[8]を参照)。

本論文は、この問題を明確にするための試みである。熱力学的勾配と因果の介入論的説明を前提とした因果の矢の正確な位置づけはどうなっているのか。私たちは、熱力学的勾配に根ざした完全客観的な非対称性が、因果関係の非対称性を支えていることを発見した。熱力学的勾配に沿って、介入主義的因果経路-すなわち、変数間の確率的関係を支持する足場となる介入-は、未来に影響を伝播するが、過去には伝播しない。その理由は、低エントロピーの境界条件が存在する場合、世界の現在のマクロ状態が過去への確率的な相関関係を遮断してしまうからである(後述する)。この観察は、因果的な非対称性を、熱力学的な矢印を生み出す非対称な境界条件と直接結びつけている。しかし、この非対称性は、巨視的な粗視化によってのみ出現する。この相対化によって、因果の矢印が透視可能になるのか(どういう意味で)評価する。

2. 因果関係

なぜラッセルは正しくなかったのか?因果関係の言語が、相関関係のパターンの単なる記述に何を加えるのか。そして、なぜそのような情報が必要なのだろうか。喫煙の例を考えてみよう。喫煙と癌になることには相関関係がある。喫煙とガンの間には相関関係があり、喫煙者の口臭とガンの間には相関関係がある。しかし、禁煙はがんのリスクを減らすのに有効だが、口臭を治療するのは有効ではない。なぜだろうか?喫煙はがんの原因であり、口臭は原因ではないからだ。

この違いを捉えること、つまり情報と影響の違い、つまりある事象が他の事象についての情報を伝える相関関係と、ある事象が他の事象に影響を与える(ために使われる)相関関係の違いを捉えることが、因果関係のある情報の目的なのである。因果関係言語が相関関係のパターンに加えるものは、影響が移動する経路に関する情報である。私たちがこの情報を必要とするのは、秩序ある事象の流れに戦略的に介入する方法を知るためだ。私たちのように、観察するだけでなく介入し、自分の介入が出来事にどのような影響を与えるかを知りたがる生き物にとって、因果関係の知識は不可欠なものなのである。

ナンシー・カートライトは、1979年にラッセルに対する影響力のある回答でこのことを指摘している[9]。哲学の分野では、因果関係の概念の分析に関心が向けられた。人々は因果情報を特殊な相関パターンに還元しようとし、反実仮想の説明が流行ったが、反実仮想の意味論を作り出そうとして泥沼化した。因果関係についての人々の理論以前の直感を捉えようとしているのか、それとも因果関係の探索に積極的に関与している科学の部分と関係づけられるような説明をしようとしているのか、混乱があった。この問題は未解決のままであった。

熱力学の基礎や時間的非対称性の物理的裏付けへの注目との関連で再浮上したが、因果関係の概念を明確に(正確に)分析しなければ、議論が盛り上がることは困難であった。

介入主義の導入ですべてが変わった。介入主義は、Pearl[10]とGlymour, Spirtes and Scheines[11]によって独自に導入され、Woodward[13]によって哲学的に発展したものである1介入主義の核心は、Aに介入することでBを操作できる状況がある場合に限り、AはBの原因であるという考え方である2。介入とは、操作された変数と過去の他の原因との関係を断ち切り、残った相関関係を操作された変数に割り当てることができるようにすることを意図した理想化された根拠のない実験操作のことを指す。介入主義は、確率に加えられる因果関係の知識、因果関係を確立するために使用されるデータの種類、それらの関係がサポートする推論のパターンについて、実験的実践に基づく正確な理解を提供する。また、因果関係を表現し推論するための、確率論に類似した正式な計算機も提供する3

科学的知識は本来、因果関係の言葉で伝えられ、考えられているにもかかわらず、それを統計的、確率的な言葉で形式的に表現するという点で、長い間バイアスがかかっていたのである。因果関係の話はヒューリスティックなものであり、事実の内容は統計学によって伝えられるという考え方だった。介入主義によって、そのようなバイアスの根拠はなくなった。

3. 統計力学

古典力学法則の時間対称性が、熱力学第二法則に捉えられた非対称性の源について疑問を投げかけて以来、世界における時間的非対称性の源について疑問が持たれてきた。統計力学の基礎に関する1世紀半の研究は、基礎となる法則が時間的に対称であるにもかかわらず、出現した力学的非対称性を回復する方法を示した。

David Albertが『Time and chance[18]で示した統計力学のボルツマン的説明は、これらの基礎を極めて明確かつ慎重に概念的に表現したものである4。この説明では、3つのことを前提としている:

(1) 古典力学法則:これは、おなじみのニュートンの運動法則に過ぎない。
(2) 統計的仮定:統計力学の中心的な仮定であり、あるマクロ状態にあるシステムが、そのマクロ状態に適合するミクロ状態の1つまたは別のものにある(より正確には、そのマクロ状態に関連する位相空間の体積のある部分体積にある)確率を与える位相空間上の標準ルベーグ測度である。
(3) 過去仮説:これは遠い過去における境界条件のことで、最も多くの場合、宇宙はかつて非常に低いエントロピーの状態にあったという仮説として組み立てられている。

これらは、以下のように、未来と過去の両方に対する熱力学的な一般化を生み出すために協働する。力学的法則は、物理的に可能な世界の集合を限定する。過去仮説は、遠い過去のある時点で非常に低いエントロピー状態にあった世界を除いて、すべての世界を排除するその結果、私たちの世界の歴史は、圧倒的にエントロピーが増大する可能性が高くなる。3つの原理のうち、(1)と(2)は時間的に対称的である。ニュートンの力学法則は、時間的反射のもとで対称である。AからBに至る閉じた系の物理的に可能な軌跡に対して、その軌跡の反転(位置と運動量を反転させて得られる)もまた物理的に可能である。この確率分布は時間に依存しない。非対称性は、時間の一方の端にのみ非対称な境界条件を課す(3)にすべて具現化されている。

アルバートの説明の様々な要素については、論争がある。しかし、統計力学の基礎の説明として好ましくないのであれば、あなた自身の説明で代用することができる。熱力学的な一般化で成功した統計力学の基礎の説明は、記録の非対称性を裏打ちすることになる。アルバートの説明で、それがどのように機能するかを見ることは有益だが、あなた自身の仮定から記録の非対称性を導き出すためにどのような論理を使うとしても、その論理を逆転させれば、以下に述べるような形で因果の非対称性を導き出すことができるはずだ。

4. 知識の非対称性

私たちの経験における時間的な非対称性を特徴づけ、それを熱力学的な勾配に基づかせようとするプロジェクトは、ライヘンバッハに遡る。そして、Paul Horwich、Huw Priceを経て、Albertとともに発展してきたのである6。認識論的な非対称性とは、私たちが未来よりも過去についてより多くを知っているという意味を捉えようとするものである。実践的な非対称性は、私たちが未来に影響を与えることはできても、過去に影響を与えることはできないという意味を捉えようとするものである。

まず、環境の現在の調査可能なマクロ状態に知覚的にアクセスできるエージェントを想定し、その情報からエージェントが何を推論できるかを統計力学で検証する7。その結果、エージェントには、マクロな過去に関する多くの具体的な詳細情報が残るが、未来についてはほとんど残らない確率分布となる[18,23]なぜなら、現在の世界のマクロな状態を過去の仮説に条件づけることで、エージェントは、その環境にあるほぼ孤立したサブシステムの半秩序状態のすべてが、さらに秩序ある状態から進化していると(圧倒的な高確率で)推論することができ、それによって、それらが事実上過去の記録と化すからだ。例えば、半分混ざったコーヒーカップや砂の上の足跡、あるいは、環境の中で断熱的に孤立したサブシステムの半順序なマクロ状態を考えてみよう。このマクロ状態を確率論に当てはめて前方に進化させると、圧倒的な確率でエントロピーが高い状態に向かうことが推測できる(クリームはより混ざり、足跡は薄くなる)。

同じ分布を過去の仮説を条件とせずに後方に進化させると、力学法則が時間対称であるため、その方向では同じように、エントロピーが高い状態から来る可能性が圧倒的に高いことがわかる。しかし、過去にエントロピーの低い状態があったことを条件とすると、すべてが違ってくる。エントロピーの低い状態から来た軌跡だけを考えるので、半分混ざったクリームは混ざりにくく、足跡はより顕著になったと推論できる。そして、その軌跡を、最初に秩序だった状態を作り出した偶数に遡ると、半分混ざったクリームは雫の導入の記録、足跡は足音の記録、木の傷は過去の傷の記録であることがわかる。

現実的な非対称性、つまり未来には影響するが過去には影響しない考え方はどうだろうか。その輪郭は、記録について述べたものと同じだ。同じ材料を使って、私たちのようなエージェントがもたらすことのできる世界の変化が、どのように過去と未来に伝播していくのかを問うのであるつまり、私が何らかの作業をして、環境に秩序ある状態を作ったらどうなるのか?この問いに答えるために、私たちは世界の現在の調査可能なマクロ状態を取り上げ、確率論を適用してそれに適合するミクロ状態の分布を求め、それを力学的法則を使って前方に進化させ、過去の仮説に条件付けをして後方に進化させる。その結果、マクロ的に世界と知覚的に結合しているエージェントは、過去はそのままに、未来に向かう影響を見ることができることがわかった。例えば、私が砂浜を歩けば、潮に流されるまで足跡が残る。溝を掘ったり、家を建てたりすれば、より耐久性のある素材を使うが、環境に秩序ある状態を作り出し、それが朽ちていくのに時間がかかるという点では同じだ。

記録の非対称性と効果の非対称性は、互いに裏表の関係にある。自分の行動がもたらす効果というのは、それが発生したときの未来の記録に過ぎない。知的エージェントは、自分の介入を戦略的に利用し、後で遭遇する自分の行動の記録を作成する。

過去の仮説を条件とすることで、巨視的な記録が存在する過去のあらゆる特徴が固定化されるからだ。巨視的な記録の可能性さえある過去の特徴は、今ここにある局所的な巨視的介入に鈍感になる。つまり、現在のマクロ状態を過去の仮説に条件付けると、(圧倒的な確率で)過去の出来事との信頼できる確率的相関関係が出現することはない10

これまでのところ、因果関係については明示的に何も言っていない。法則、確率仮定、過去仮説を仮定し、環境のマクロ状態に知覚的にアクセスできるエージェントが、過去と未来についてどのような情報を入手できるか、また、自分の行動の結果についてどのような種類の期待を形成できるかを述べてきたのである。因果の非対称性については、手っ取り早く言えばそれで終わりなのだが、それではあまりにも多くの疑問が残る。

私たちが知りたいのは、エージェントの側に何があるかということである。彼女が持ってくる概念のネットワークに、因果関係の概念はどのように組み込まれているのか。また、その概念は他の概念とどのような推論的つながりを持ち、世界との実践的・認識的交流にどのように包まれているのか。また、世界の側に何があるのか、つまり、それらの概念の適用をサポートする環境における外部インフラは何なのかを知りたい。エージェント自身が物理的世界の一部であるため、エージェント+環境、あるいは環境に埋め込まれたエージェントという単位全体を物理的分析の単位とすることができる。介入主義的な説明は、エージェントの視点に本質的な言及をしない因果関係を説明するものである。このフレームワークを用いて、エージェントの導入前に特定できる非対称性があるかどうかを明確に診断する。

5. 介入主義的な因果関係

介入主義によれば、変数のネットワークと制約のセットが与えられたとき、変数Aは、Aへの介入(Aの値の外科的変化)がBに影響を与える(またはBの確率に影響を与える)場合に限り、(そのネットワークと制約の下で)Bと因果関係にある。私たちは、AがBの原因だろうかどうかを知りたいので、Aに介入し、それが(値の値または確率の)Bに影響を与えるかどうかを確認する(図1)。

図1

図1 コーザルグラフ

マクロ変数に制限はないので、ここでいうAやBは何でもいい。このフレームワークは時間的対称性を持っている。通常、私たちは将来における因果効果を求めているので、時間的に非対称な方法で介入を定義し(介入とは、過去における他の潜在的な原因との関係を断ち切る変数の値の外科的変化)、時間的に下流の変数への因果効果を探す。アスピリンを飲むと頭痛が和らぐかどうかを知りたければ、通常、世界の広範な調査可能なマクロ状態や過去の仮説とともに、実験セットを定義する環境制約を固定する。しかし、介入主義の枠組みには、そのように考えざるを得ないようなものはない。私たちは、変数のネットワークを取り、変数Aを選び、時間的に上流の変数との関係を外科的に切断し、Aへの介入が時間的過去の変数の値(の確率)に影響を与えるかどうかを尋ねるのと同じくらい簡単にできる。

Pearlは2000年の著書[28]で、この非対称性について論じている。彼の見解では、方向性は、何を外生的、何を内生的と扱うかの選択から来るものである。人は世界の一部を切り離し、自分が手を伸ばして、ある変数の値を設定し、他の変数への影響を観察していると考える。ネットワーク外のプロセスによって値が設定される変数は外生的であり、それ以外は内生的である。というようなことを言っている:

[内生変数と外生変数を選択することで、物事の見方に非対称性が生まれる。この非対称性があるからこそ、「外部からの介入」、つまり因果関係や因果の方向性について語ることができるのだ

外生変数を内生変数より早く選ぶ傾向があるのは、初期の状態の違いによって後の状態がどう変化するかという疑問が、行動を導く上で特別重要だからだ。しかし、形式的には、外生変数を内生変数より遅く選択しても問題はない。過去の状態が未来に及ぼす影響と同様に、未来の状態の変動が過去に及ぼす影響についても疑問を投げかけることができる。そのような問いは論理的によく振舞うものである。

その教訓とは、「原因と結果に関連付ける方向性を決定するのは、私たちが宇宙を切り分ける方法であるということである。このような切り分けは、あらゆる科学的調査で暗黙のうちに想定されている。人工知能では、マッカーシーが『circumscription』と呼んでいた。経済学では、どの変数を内生的とみなし、どの変数を外生的とみなすか、モデルにINするかEXTERNALするかを決めることになる」[28、p.420]。

この見解では、事象間の関係には本質的な依存性の方向性はない。世界そのものが(時間対称の法則によって与えられる)モード的な部分構造を持っており、外生変数と内生変数の選択によって定義される仮想的な状況において何が起こるかについての判断の基礎を提供する(特定の制約がある場合)。依存性の方向は、外因性変数と内因性変数の選択によって決定される。それらは順番に、実験者の実際的な利益によって定義される。私たちは時間志向のエージェントであるため、熟慮の際には過去を固定し、下流で因果関係を探す傾向があるが、事象自体の関係には本質的な非対称性は存在しない11

それは全く間違ってはいないが、誤解を招くような不完全なものである。この絵を埋めることで、エージェンシーの非対称性と因果の非対称性の関係をより深く、より明確に理解することができる。事象間の関係に局所的な非対称性があるのではなく、熱力学的勾配に沿った事象の巨視的パターンに非対称性があり、それを利用するために代理人が出現することが判明する。つまり、マクロな非対称性の存在から、エージェントの出現に至るという説明である。そして、マクロなレンズで見る理由は、非対称性が情報収集と活用をサポートする方法と関係がある。

先ほどの話に戻る。古典的な法則、過去の仮説、マイクロカノンの確率分布が、過去から未来へと続く因果関係を裏打ちすることを確認した。もし、時間を逆転させた質問をしたらどうだろうか。そこで、調査可能な世界の広範なマクロ状態を確定する。ネットワークに手を伸ばし、ある変数を手に入れ、未来の変数との関係を断ち切り、後の変数を揺さぶったら前の変数に何が起こるかを問う。その過去の変数に確率的な影響はあるのだろうか?低エントロピーの過去を固定する限り、答えはノーである。現在の調査可能なマクロ状態と低エントロピーの過去は、マクロな記録が残っているすべての過去の出来事を固定し、過去に及ぶ潜在的な確率的影響を排除する。

統計力学的な観点からは、因果関係を介入的に理解する場合、過去の仮説は私たちが一般的に課す制約の一つであり、それだけで客観的事実として因果の矢印を確保することができるということである。時間的過去における低エントロピー境界条件は、単に「私たちが一般的に課す制約」ではなく、世界に関する事実であり、私たちが行動する固定的背景の一部である何かである。それは、私たちが介入の未来の効果を予測し、過去について知ることを可能にする、私たちの世界における不変の足場の一部なのである。「因果的影響の方向」が局所的介入の確率的影響が伝播する方向であるとすれば、エントロピー勾配がある世界では、因果的影響は過去はそのままに未来に伝播する。介入主義の枠組みは、それ自体が時間的に対称的であるため、非対称性の原因を突き止める(あるいは明示する)のに役立つ12

エージェントが行動する物理的環境における非対称性に焦点を当てるために、エージェントを絵から外し、介入主義的分析を用いることができる。熱力学的勾配に沿って、因果関係、すなわち変数間の確率的関係を支える足場となる介入は、非常に一般的な理由から、未来から過去へ向かうことはない。未来には類似の境界条件がないため、確率的な影響はその方向に自由に伝播していく。

6. 巨視的な粗視化

しかし、エージェントの影を完全に排除したわけではなく、マクロ状態についてまだ話している。マクロ状態という概念は少し曖昧で、ミクロ状態の粗視化という意味で一般的に使われることもあれば、熱力学的変数による粗視化という意味で特別に使われることもある。ここまでは、曖昧さを気にせず特定の意味で使っていたが、この後の展開で重要になるので、この項では、一般的な意味の場合は小文字を使い、熱力学的変数による粗視化という意味の場合は大文字を使うことにする。世界を様々な粗視化状態に切り分ける方法の中で、熱力学的粗視化は、私たちの感覚がたまたま選んだものであるということ以外に、何か特別なものがあるのだろうか。仮にマクロな粗視化で客観的な非対称性があるとしても、なぜマクロな状態の話をするのか?

もし私たちの感覚がミクロのレベルまで見ることができたなら、法則に決定の方向性は見られないということに、私たち全員が同意したとしよう。そして、法則、熱力学的勾配、世界のマクロ構造と結合したエージェントが局所的な変数に介入するという構造全体を組み立てたとき、エージェントの視点から、私たちの視点と一致する時間的非対称性が現れることに、私たち全員が同意したとしよう。しかし、私たちがマクロなレンズを通して見ているために、自分の行動の影響が未来に伝わり、過去には伝わらないのではないかという疑問が残る。

この問いを解くには、同じ世界に対して他のどのような視点がありうるかを問うことである。同じミクロの状態、同じ時間対称の法則という、ミクロレベルでは私たちと同じような世界を想定する。エージェントを導入し、エージェントのセンサーが特定の粗い粒度の変数を選んで「照らす」ようにする。それ以外のものは、目に見える変数のダイナミクスを制御する舞台裏の見えないネットワークとして、背景に追いやられるのである(図2)。

図2

図2 マジックアイの絵

異なるマクロ変数に対して粗視化することで、異なるパターンを浮き彫りにすることができる。マクロ変数のセットを選択すると、ミクロダイナミクスはそれらの変数に対するダイナミクスを誘発する(それらが時間的にどのように進化するかを教えてくれる)。私たちは、熱力学の第二法則に従うマクロ変数を通じて世界と結合する。つまり、不可逆的なプロセスや、私たち自身の介入による影響が、未来に向かって進行していくのを見ることができる。しかし、形式的には、さまざまな方法で粗視化することができる。どんな複雑な構造でも、自由裁量を与えられれば、さまざまなパターンを「見る」エージェントを導入することができる。鳥や魚を見つける方法があるかもしれないし、「Jesus」という単語が一文字ずつ見えてくるかもしれない。ボトムアップで見ると、見えているパターンが特別なものであることを知らせるものは何もない。そこで、同じ世界にエージェントを導入し、センサーやアクチュエーターを選択することで、そのエージェントの時間的な視点を逆転させることができないか、と考えている。つまり、私たちの世界のミクロな状態をそのまま固定し、私たちの経験の時間的な特徴を逆転させるような結合の仕方を見つけることができるだろうか。

この質問には、鋭い答えがあるように思える。しかし、現状では、根本的に仕様が決まっていない。粗い粒度の選択にはどの程度の自由度があるのだろうか?位相空間の高度にえり好みされた再分割は許されるのか?保存量の時空間積分だけを許すのか?また、どのような種類の介入を認めるのか?マクスウェル・デモン流の微視的な自由度の制御や、インフレーションのような分散した高レベルの変数の制御を認めるだろうか?宇宙のハミルトニアンについてはどうだろうか?また、どのように制約を動機付けるのだろうか?ポイントは、どのような代替的な視点があるかを探ることだろうから、自分の視点に合うような制約を選びたくはないのである。相空間の任意の体積に対して、通常の熱力学的粗視化を行い、その体積から出てくる軌道の集合を取り出し、それらを反転させるだけだ。次に、ある時間間隔(例えば100)を選び、反転した軌道の点の集合を、新しい位相空間の体積を定義するものとしてとらえる。しかし、ルイヴィルの定理により、体積は保存されることが分かっている。では、この問いをさらに絞り込んで、哲学的に面白いことを考えよう。ここで本当に問いたいことは何だろう?

哲学的な文献では、世界にあるものと視点の人工物とを分離する思考実験が紹介されると、自分自身を外からやってきて、自分とは関係のない世界に結合する超越的な主体として扱う傾向があるようだ。それは、ここでの間違いである。私たちは、超越的な主体が外から世界を取り込むという観点で考えるべきではない。物理的な経路で情報を拾うセンサーや、環境の局所的な特徴を操作するアクチュエーターを持つ世界のエージェントが、どのような方法で世界を見ることができるのか、つまり、私たちのような世界にはどのような具象的な因果関係の視点があるのか、具体的に考えるべきなのである13。最低限、エージェントはセンサーとアクチュエーターを備えたシステムであるべきで、見るものと行うものの区別を認識する必要がある。また、介入の効果について時間をかけて学習し、その情報を使って行動を導くことができるはずだ。このようなエージェントは、自分の行動の効果が伝播すると考える時間的方向によって定義される内部矢印を持つことになる。Pete Evans、Gerard Millburn、Sally Shrapnelによる最近の非常に美しい論文は、この質問を正確にし、それに答えるために必要な、まさに物理的な分析を提供してくれている。彼らは因果律を持つエージェントの最小限のモデルを導入し、そのようなエージェントの内部矢印が熱力学的勾配に沿うようになることを示す。その理由は、そのようなエージェントの物理学が散逸的だからだ。偶然の理由ではなく、この問題の核心であるエネルギーと情報の結びつきに関連した理由である。機能的に情報を収集し、行動を導くために情報を使用する物理システムは、エネルギーを使用することになり、熱力学的な制約を受けることになる14

7. 問題の核心

これは、物語の半分である。情報収集・利用システムが存在するとすれば、それが熱力学的勾配に沿ったものである理由を教えてくれるが、情報収集・利用システムが存在する理由を教えてくれるわけではない。

水力発電の仕組みはこうだ。ダムを作り、水が水門を通ると水路を流れ、タービンを回すようにするのである(図315

図3 水力発電所における水車

タービンは、回転の内部矢印を持つ世界のサブシステムである。内部の矢印は、外部の電流の方向と一致している。なぜか?物理学があるからだ。電流に逆らわず、電流の方向に走るタービンが存在する理由は、この装置の物理学が示している。しかし、「なぜタービンの回転矢印は外部電流の方向と一致しているのか」ではなく、「なぜタービンが存在するのか」と問うたらどうだろう。タービンは、この勾配を利用するために存在するのである。

因果作用物質の時間的な方向性は、熱力学的な勾配に沿うことになると前述した。では、「どのような因果関係エージェントが物理的に実装可能か」だけでなく、「なぜ因果関係エージェントが存在するのか」と問うとどうだろう。なぜ、学習するセンサーやアクチュエーターを持つ生物が存在し、それが熱力学的勾配とどう関係があるのか?私たちのような世界では、どのようなエージェントの視点が自然に、そして固有に生まれてくるのだろうか?エージェントは、熱力学的勾配が生み出す情報活用と制御の機会を利用するために出現する。私たちがこのように粗視化し、粗視化するのは偶然ではない。私たちの感覚は、非対称で情報が豊富なパターンを明らかにするように設計されており、エージェントはそれを把握することができる。

微視的には、局所的なプロセスがあり、不変の法則に則って起こっている。巨視的には、断熱的に隔離されたサブシステムの局所的な過程と、地球レベルの不可逆的な過程の両方が、エントロピーを増大させる方向に起こっている。熱力学的勾配が存在する巨視的世界には、その巨視的な歴史の痕跡を含む記録が散在しているのである砂の上の足跡、木の幹の傷跡、写真、紙に書かれた一連の文字…。あなたの周りにある半秩序のほぼ断熱的に孤立した系はすべて、さらに低いエントロピーの状態から進化して、その過去の痕跡を残している。

足跡が残ったり、氷が溶けたりして、環境中にエネルギーが放出される。しかし、マクロな環境に含まれる情報(エントロピーが低いものから高いものへと進化するシステムの現状)は、他のシステムが自らの行動の基礎として利用することができる。そして、進化は宇宙をそのようなシステムで埋め尽くしている。最近ライオンが狩りをした痕跡を読み取ることができる鹿や、地面に穴が開いているのはネズミが近くにいる可能性が高いということを知っているキツネは、そうでないものよりもうまくいくだろう。何が起こったかについての情報を持っている生き物は、何が起こるかについての情報を持っている。何が起こったかをこれから起こることに結びつける巨視的な規則性が、巨視的な現在に遮られることなく存在するため、環境の中の情報を利用することに選択的な利点がある。

鹿やビーバーのように、私たちは日常生活の中で、過去に関する情報を無批判に記録に頼っている。黒板のチョークの跡、雪の上の足跡、古代の洞窟の壁の絵、あるいは月のクレーターでさえも、かつてはもっと秩序だった状態であった名残であると、私たちは当然のように思っている。熱力学の基礎は、そのような信頼を裏付ける物理的事実を明示することを目的としている。もし宇宙が低エントロピー状態から始まっていなければ、局所的な巨視的環境は、未来に関する情報よりも過去に関する情報の方が多くなることはないだろう。私たちが捕食者と被食者の印として考えているものは、より秩序だった状態から進化するよりも、偶然に均衡を崩して変動することの方がはるかに多かったはずだ。このようなことが可能なのは、低エントロピーな過去が、巨視的な過去に関する情報を容易に入手できるからだ。低エントロピーの過去があるからこそ、過去に関する事実が、長い年月を経たとはいえ、システムの現在のマクロな状態に痕跡を残し、それが今度はローカルなプロセスを制御するために利用される。つまり、マイクロプロセスはすべて局所的でマルコフ(確率的に自分自身の過去を選別する)であるにもかかわらず、過去の低エントロピーの境界条件がある場合、マクロ状態の情報伝達特性を利用して、過去と現在の間に因果的な橋を効果的にかける高次のプロセスが見られる。

つまり、マクロな情報を追跡する感覚器官を持つことは、私たちにとって偶然の事実ではないのである。実際、熱力学系のマクロな状態がわかれば、ミクロな状態に対する条件付けは、マクロな未来に対する確率に影響を与えない(通常、私たちが自然界で発見するような条件下では)。つまり、あるシステムのマクロな状態が分かれば、過去から未来に関する情報に使えるものをすべて抽出したことになる。このことから、私たちの視点は、エージェンシーが機能する情報量の多いマクロパターンを明らかにするために、注意深く作られていることがわかる。微細なノイズをフィルタリングすることで、あなたの視点は認識の負荷を軽減しているのである(考えようによっては、認識の一部を担っているのかもしれない)。

だから、ボトムアップで見ていくと、巨視的な粗視化は、イエスの言葉を明らかにするものよりも、特別なものには見えないだろうし、そうでないものにも見えないだろう。特別な形而上学的地位を持つことはないだろう。しかし、世界の組み立てられた建築の中で、情報の収集と活用を支える地層を探すなら、巨視的な粗視化の下で現れるパターンは、実に特別なものとして立ち現れるだろう17。

もし、私たちに突然、世界をミクロの視点で見ることができる目が与えられたとする。ミクロの情報を追加することで、将来のマクロの予測可能性が高まるかどうかを問うことができる。決定論的には、ある時点で宇宙の微細な状態について完全な情報を持っていれば、他の時点で起こるであろうことをすべて確実に予測することができる。しかし、もし私たちが知っていることがすべてでないなら、その力はなくなってしまう。ミクロの法則は、宇宙の開かれたサブシステムの将来の振る舞いは、その内部のミクロの状態と外的な影響との積であることを意味している。一般に、あるシステムの微細状態を知っても、外部からそのシステムに影響を与える可能性のある微細な影響(空気中の分子の位置から大気圏から降り注ぐ中性子まで)をすべて知っていなければ、振る舞いの予測には役立たない。ミクロのレベルで完全な情報が得られないと、将来のミクロの状態を予測することはできない。ミクロの法則を適用して予測を導き出そうとするならば、完全な情報か、外的な影響を遮蔽する能力が必要である。そのため、ミクロの情報で知覚の視点を強化する明確な選択圧力はなく、情報を捕捉し記録する熱力学的コストがそれに対する圧力となる。実際には、決定論的なミクロの法則ではなく、ミクロの基盤に頑強に依存しない創発的なパターンが予測を可能にする。その最も一般的なものが、熱力学の法則である。これらは普遍的に、(事実上)例外なく適用される。さらに、樹木、カエル、人間、ペンギンなど、特殊なサブシステムの典型的な挙動に関するあらゆる種類の大規則性がある。これらが、実際には世界を予測可能なものにしているのである18

様々な環境の手がかりに対する感受性によって制御される行動が選択されるであろう条件を理解するのに役立つ進化モデルがある。例えば、ピーター・ゴッドフリー・スミスは、行動を制御するために環境の様々な種類の情報に注意を払うことの期待報酬を計算するための公式を提供している[32]。彼はこの公式を使って、ウミゴケには常にトゲがあるべきか、それともウミゴケが出す化学物質を検知するセンサーを持ち、それが十分にあるときだけトゲを出すべきか、というような問いを立てている。どのような状況下で、柔軟な戦略(局所的な環境パラメータによって行動を制御させる戦略)は、柔軟でない最善の戦略よりも優れているのだろうか?柔軟である方が良いかどうかは、使用される手がかりが、2つの世界の状態の期待される重要性の差を克服するのに十分な信頼性を持っているかどうかによる。世界のある状態の重要性は、その状態での適切な行動から得られるペイオフと、その状態での別の(不適切な)行動から得られるペイオフの差と定義される。期待される重要性は、重要性にその状態の確率を掛けたものと定義される。もし生物が単一の行動しか起こさないのであれば、より高い期待重要度を持つ状態に適した行動を起こすのが最善である。柔軟な戦略を用いる価値があるのは、その戦略に関連する手がかりが、2つの世界の状態の期待重要度の間の非対称性を克服するのに十分な信頼性を持っている場合だけである19

このモデルは、「行動を誘導するために使う価値のある手がかりが持つべき信頼性の特性は何か」という問いに取り組んでいる。このモデルは、私たちのような環境下で行動を誘導するために、ミクロな情報とマクロな情報を使い分けた場合に期待されるペイオフを測るために適用することができる。このことは、マクロな情報があれば、ミクロな情報は典型的な条件下ではほとんど、あるいはまったく報われないということを示唆しているこのことは、環境の巨視的な状態が、認知が働く情報の豊富なパターンであるという教訓を強めるものである。つまり、巨視的な粗視化で浮かび上がる矢印は視点の偶然に過ぎないという心配に対する正しい答えは、私たちの視点に偶然はないということである21

8. まとめ

私たちは、私たちの経験の時間的な特徴は、遠近法の「単なる」人工物であるという懸念から出発した。しかし、私たちの遠近法は、むしろ世界にしっかりと統合されており、認知、特に、私たちが例証するような豊かな形の認知が機能する情報豊富なパターンを浮き彫りにするように調整されているということがわかった。知覚と認知は、具現化された生物の進化した活動であり、彼らが活動する世界の基礎となる物理学から切り離すことはできない。物理学が提供する機会を利用するために、それらは発生する。

これはパースペクティヴの一種なのだろうか?それは、思慮の浅い視点主義ではない。世界のある特徴について、思慮の浅い視点主義では、それは単に私たちがそれを見るレンズの産物であると言う。つまり、バラ色は世界にあるのではなく、メガネの中にあるのであって、それを世界に帰するのは誤認である、という意味である。浅い視点主義に対して、「世界は良いことも悪いこともいっぱいある」と考えるのが、思慮深い視点主義である。バラ色のメガネで世界を見ている人は、世界の良いところに目を向け、それが自分の視野を支配している、「本当のものを見ているのだ」と考える。思慮深い視点主義者は、現実のパターンを明らかにするレンズを通して世界を見る人である22経済学者のメガネを通して世界を見、経済変数に注目することもできるし、ジェンダー関係を浮き彫りにするジェンダーレンズを通して世界を見ることもできる。また、情報の流れや力関係を浮き彫りにするレンズを通して世界を見ることもできる。このような場合、彼らが見ているものは完全に現実のものである。レンズは、世界に存在する何かを明らかにする。どのようなパターンがあるのか、場合によっては、与えられた目的のために、どのパターンが見る価値があるのかは、客観的な問題である。

利益相反宣言

私は競合する利害関係がないことを宣言する。

ファンディング

本稿は、Foundations Questions InstituteとFetzer Franklin Funの助成金(FQXi助成番号FQXi-RFP-IPW-1906)によって実現した研究の一部に基づいている。

謝辞

David AlbertとCarlo Rovelliには、インスピレーション、コメント、その他多くのことを感謝している。また、非常に貴重な推薦をしてくれた2人の優秀な匿名査読者にも感謝したい。

巻末資料

  • 1形式的な枠組みについては[10,11]を、介入という概念の議論を含む哲学的な展開についてはWoodward[12]を参照されたい。
  • 2介入の正式な定義については、依然として議論の余地がある([13]参照)。介入主義は、明確に定義でき、科学に有用であると証明できる唯一の因果概念を提供しない。因果過程概念[14,15]は、介入主義的な原因概念では捉えられない、私たちの因果的直感の側面を捉えている。私の考えでは、これらの直感をすべて捉える単一の概念は存在せず、むしろ異なる因果的直感に答える、正確に定義可能な物理的概念の集合体について、複数主義であるべきだと考えている。ここで介入型概念に注目する理由は、因果過程は本質的に非対称ではないからだ。因果の非対称性を分析する対象となるのは、介入的な経路なのである。
  • 3確率論と介入論的形式論の比較については、[16,17]を参照のこと。
  • 418]を参照してほしい。量子論的なケースも扱った最近の特にニュアンスのある評価については、[19]を参照してほしい。
  • 5増加する、ここ=非減少する。
  • 6Albertの著書[18]、その後Albert[23]に掲載された。また、[24,25]も参照されたい。
  • 7詳細はAlbert[18]、[23]に記載されている。
  • 8もちろん、現実のエージェントが世界のマクロ状態について完全な情報を持っていることはないので、これはエージェントが原理的にアクセス可能な情報を特徴付けるものである。「調査済み」を「調査可能」に置き換えると、エージェントが実際に持っている情報は何かということがわかる。
  • 9このあたりは、世の中の事象をアジェンシャルな制御下に置くと考えるのが正しいのだが、どのように特徴づけるかについて、少し微妙なところがある。例えば、腕を上げると、その腕を構成するすべての微粒子が上がり、電気インパルスが発生して筋肉を駆け上がり、脳に微細な神経変化を引き起こすのである。しかし、制御には知覚的なフィードバックが必要である。人間の体には複雑な感覚運動ネットワークがあり、手足の動き、頭の動き、声の響きなどをループさせているが、それ以上の細かい自発的な制御はできない。
  • 10Albert[18,23]は因果関係の反実仮想の説明を行い、熱力学的勾配から因果関係の非対称性を導き出そうとした。Frisch[26]とElga[27]は、現在の行動に対する過去の出来事の反実仮想的依存性を確保するために設計された特殊な条件を含む反例を提案した。アルバートは、正しい条件のもとでは、彼の説明が過去の出来事の現在の出来事への反実仮想的依存を生じさせ、それゆえ、後ろ向きの因果関係が存在することを認めたが、それは過去の出来事をもたらすために戦略的に使用できるような依存関係ではないと論じた。両者の例における(現在の出来事が過去に関する情報を提供できるという事実を利用した)後方依存は、問題の出来事が介入である場合、介入はその依存先である過去の確率的依存の種類を壊すので、消滅する。介入主義的因果経路は、介入を支持する確率的関係を足場とするものである。過去に走るこの種の関係が存在しないことは、未来の現在の記録が存在しない理由の鏡である。
  • 11それは、私が(2016)[29]で効果的に主張したことで、何を固定し、何を変動させるかによって、すべてが決まる。
  • 12低エントロピーの過去が制約として課されなければ、現在の介入の過去の効果(上流の変数との関係を断ち、過去に対する介入の効果について尋ねる)は、現在の介入の未来の効果を正確に反映する。低エントロピーの境界条件を課すと、非対称性は、未来にのみ走る確率的な効果で現れる。
  • 13遠近法という概念は、常に二重生活を送ってきた。ある領域が、ある種の形式的な参照枠を導入することを許可しているかどうか、また、ある興味ある特徴が参照枠にどのように依存するかを問うために、視点を形式的に扱うことができる。あるいは、視点を物理的に実現されるものとして扱うこともできる。例えば、時空間物理学では、形式的に定義された空間参照枠を意味し、ブーストやローテーションなどの対称変換について話すときは、純粋に形式的な操作を意味することがある。つまり、世界をまったく無視して、法則(あるいはモデルや議論中のシステム)をそのままにして、参照枠に数学的な変換を加えることができる、ということである。他にも、モデル化しているシステムの一部である物理的に具現化された参照枠、例えば動いている船やエレベーターの中の人を意味し、対称変換はその枠の位置や運動状態における物理的な変化であることもある。その設定では、この区別はしばしば指摘され、大部分は良性のものだった。しかし、ここでは、システム内部のダイナミクスと、非対称性が作用する環境のダイナミクスの整合性について話しているため、この区別は重要になる。
  • 14philsci-archive.pitt.edu/18844/、https://arxiv.org/abs/2009.04121。彼らの論文は多岐に渡り、詳細に論じられている。このような観点で考えるようになると、エネルギーと情報の結びつきが重要になり、情報を使用し処理する物理的に実装可能なシステムは、熱力学的勾配に沿うようになるという(法則に近づく)ように見え始めるだろう。30,31]を参照。
  • 15ある評論家は、より適切なアナロジーは、自然に発生する流れを利用する風車やソーラーパネルかもしれない、と正しく指摘している。この指摘は、「世界は、エージェントが利用するために出現したアフォーダンスを提供する」という、ここでの中心的な示唆をもたらす。進化は、巨視的な変数に敏感な感覚を持つエージェントを生み出す。
  • 16この論文の残りの部分では、熱力学的粗視化という意味で「マクロステート」を特に使用しているが、私は「マクロステート」を大文字で表記しないという通常の慣例に戻している。
  • 17自然界に存在するようなノイズに強い創発的な大規則性の存在は、すでに高度に非属性的だが、熱力学的勾配に沿ってこれらの法則がどうなるかが、長い地平での情報収集と活用を支えている。マクロな粗視化が特別な形而上学的地位を持つことを否定するのは、こうした力学的考察では捉えられない存在論的な区別を必要とするものを意味している。
  • 18よく、(決定論を前提に)難しい決断をする人の脳の状態を正確に知っていれば、その決断を予測できるはずだ、というようなことを言う人がいる。しかし、もちろん、それはナンセンスである。原理的には、微物理的な法則として、空気の特定の分子が肌の表面にぶつかる特定の速度から、首の後ろに落ちた小さな塵まで、あらゆるものが行動に変化を与えることができる。よく、「そんなものは関係ない」という反論があるが、それは、私たちのような生き物の意思決定に何が影響を与えるかについてのマクロな一般論に頼っている。木や信号機の挙動も同様である。
  • 19このモデルは、ベイズ意思決定理論で用いられる情報収集のモデルと密接な関係があり、実験の利点を説明している。あるエージェントが、ある状況下でどのように行動すべきかを決定する必要があり、そのエージェントにはコストのかからない実験を行うという選択肢があると仮定している。実験の結果は、エージェントにとって、行動の成否を決める世界の状態と確率的に関連している。生物学的モデルでは柔軟性のない戦略に劣る柔軟な戦略に関連する手がかりは、ベイズモデルではゼロ値実験に相当する。
  • 20私たちのような環境」とは、熱力学的な勾配に沿った、同様の複雑さを持つ古典的な世界を意味する。密接に関連する結論への別のアプローチについては、[33]を参照されたい。
  • 21Rovelli[34]は、私たちのような複雑な世界では、この一連の特徴を逆転させるような粗い粒子が存在するはずだと推測している。このことは、熱力学的エントロピーに対して勾配が逆転したエントロピー概念を定義するマクロプロパティによって、私たちの世界に結合されたサブシステムが存在し得るかという問題を提起している。これは、私がここで答えたのとは異なる、はるかに過激な挑戦である。勾配を逆転させる方法で形式的に粗視化する可能性は、粗視化に対する制約があるために具体的な可能性として除外される可能性があるが、私はこの課題を未解決の問題として残しておく。
  • 22この言葉は「リアルパターン」を想起させるために意図的に使われている[35]。

テーマ課題「Making and breaking symmetries in mind and life」に15本中1本が投稿された。

© 2023 The Author(s)

この記事が役に立ったら「いいね」をお願いします。
いいね記事一覧はこちら

備考:機械翻訳に伴う誤訳・文章省略があります。
下線、太字強調、改行、注釈や画像の挿入、代替リンク共有などの編集を行っています。
使用翻訳ソフト:DeepL,ChatGPT /文字起こしソフト:Otter 
alzhacker.com をフォロー