国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
因果一致性:因果與多尺度的碰撞

導語

復雜系統(tǒng)是多尺度的,在許多情況下,對一個復雜系統(tǒng)的綜合或間接測量構成對該系統(tǒng)的宏觀描述的基礎,但幾乎沒有理論來解釋這是否合理,或微觀和宏觀描述是如何相互聯(lián)系的。在集智俱樂部「因果涌現(xiàn)×因果科學」讀書會聯(lián)動中,北京科技大學的楊明哲對論文 Causal Consistency of Structural Equation Models 進行了解讀。這篇文章是從因果視角對復雜系統(tǒng)間轉換的開創(chuàng)性工作,其中提出精確轉換的概念,使用因果語言揭示了不同層級的復雜系統(tǒng)間的因果一致性,該理論可以為普遍存在于復雜系統(tǒng)分析中的重整化/粗?;僮魈峁├碚摶A。

因果涌現(xiàn)讀書會第二季主要圍繞追根溯源、因果涌現(xiàn)、因果表示學習、機器學習多尺度自動建模、量子因果五大主題來探尋涌現(xiàn)、因果科學和機器學習這三大主題之間的聯(lián)系。自2022年5月22日開始,每周日晚上19:00-21:00舉辦,仍在進行中。歡迎對本話題感興趣的朋友報名參加!

研究領域:復雜系統(tǒng),因果涌現(xiàn),因果建模,do-演算

論文標題:Causal Consistency of Structural Equation Models

論文鏈接:https://arxiv.org/abs/1707.00819?context=stat

復雜系統(tǒng)中充斥著因果關系。這里的因果關系按照朱迪亞·珀爾的因果之梯的理論,要滿足干預和反事實的要求,也就是說除了直接觀察到規(guī)律以外,還要在被干預的真實世界甚至是想象中的反事實世界中得到規(guī)律。它比直接觀察的關聯(lián)分析更能解釋事物間關系的本質。

我們來看下面一個簡單的例子。早期研究中,科學家們發(fā)現(xiàn)飲食習慣(diet)通過影響血液中膽固醇含量(TC)進而影響心臟疾病的發(fā)病率(HD)。但奇怪的是,在一些研究中TC對HD有促進作用,而在另一些研究中則是TC對HD有抑制作用,所以沒辦法說清楚TC對HD的因果效應。后來科學家們發(fā)現(xiàn),其實血液中膽固醇分兩種,低密度脂蛋白(LDL)和高密度脂蛋白(HDL),它們分別對HD起到抑制和促進的作用。所以在研究心臟病發(fā)病機理的時候,必須把TC還原到LDL和HDL層面才行。經(jīng)常在生物醫(yī)學中會出現(xiàn)這樣的案例,往往我們以為的一種物質實際上由多種物質組成,它們各有不同的作用,聚在一起則產生令人困惑的結果。

對于只有兩三個變量的系統(tǒng)我們可以很清晰地進行分析,可以畫出如上圖所示的因果結構圖。所以是不是說,在研究每一個問題的時候,就應該把研究對象不斷拆分還原,做細?;?/span>的操作就可以研究清楚了?

但對于非常復雜的系統(tǒng),比如有大量分子運動的封閉空間,由各種細胞構成的生物體等,分析出一個個分子之間的因果關系是不可能做到的,即使能做到也極有可能是不劃算的,因為不是所有因果關系的分析都能幫助解決我們所關心的問題。在這種情形下,我們通常采取粗粒化的策略,把系統(tǒng)的微觀層面映射到某一個宏觀層面上,再去觀測宏觀層面上簡潔的因果關系,便可以非常方便地做研究了。比如對于大量分子運動的系統(tǒng),我們可以去觀測它們的宏觀指標,比如壓強、體積、溫度等,便有了 PV=nRT 這樣簡潔優(yōu)美的規(guī)律涌現(xiàn)出來。

Erik Hoel 最早提出了因果涌現(xiàn)這一理論,與還原論的思路相反,在多尺度中找到因果性最強的層次,在這一層次上進行動力學的研究。Erik也提出了有效信息(EI)這一指標來衡量因果性的強弱。于是接下來便有一個問題,當我們在做粗?;臅r候,是否會像開頭的那個例子一樣,我們付出了還沒有看見的代價?何時要做粗?;?,何時要做細?;?,該如何做一個取舍呢?

在膽固醇與心臟病的例子中,HDL和LDL可以看作是微觀層面,TC是宏觀層面。其中宏觀層面固然簡潔,但不能做出有效的因果描述,可以說這一次宏觀敗給了微觀。我們把這個例子出現(xiàn)的問題可以描述為多個尺度上因果關系不一致。因果一致性便是因果科學領域學者關注的一個問題,如何用嚴謹?shù)臄?shù)學語言來定義因果一致性是本文最大價值的體現(xiàn)。

1. 結構方程模型與精確轉換

給定一個系統(tǒng),如果我們可以表示所有的變量和他們之間的動力學關系,包括所有外生變量的分布,還可以根據(jù)我們關心的問題明確所有的干預操作,就可以用一個結構方程模型(SEM)來描述這個系統(tǒng)。比如在一個房間里有兩個燈泡和窗戶外的自然光,我們首先可以找到這個系統(tǒng)的變量集合

其中B1, B2分別表示兩個燈泡是否亮,L則表示整個房間里是否有光亮,于是有以下動力學方程的集合

其中E1, E2, E3分別都是概率為0.5的二項分布外生變量,互相獨立,也就是說我們只考慮簡單的亮與不亮兩種狀態(tài)。燈泡的狀態(tài)變化可以理解為背后有人以一定概率進行開關操作。OR是一個或運算,即B1, B2, E3中有一個是“亮”,L便是“亮”,E3可以理解為自然光。

接下來引入干預操作(do)。這里我們想研究燈泡對房間亮度的因果影響,所以對燈泡做干預,有以下排列組合的可能

其中

表示不做任何干預的純觀察,do(B1=0)可以理解為把1號燈泡給擰下來,使得它永遠不亮。可以看得出來,do干預的選擇有一定的主觀性。把剛才的符號表達放在一起,便是一個SEM了

這里面關于干預操作之間有一個偏序關系。當某一個干預操作作用的變量集合是另一個干預作用變量集合的子集,那么這兩個干預之間便有一個偏序關系。比如在剛剛燈泡與房間的系統(tǒng)中,便有這樣的一組偏序關系

其中

便是表示偏序關系的符號。在考慮一個系統(tǒng)的因果關系時,這樣的偏序意味著某些干預

(作用變量更多的)可以看作是在另外一些干預(作用變量更少的)的基礎上補充一些干預形成的。我們要保障的因果一致性,可以簡單理解為保持這些偏序關系在各個尺度上都不被破壞。

因為SEM中有隨機變量E,所以其實我們可以把SEM看成一組包括系統(tǒng)中所有變量的聯(lián)合概率分布,這一組中每一個概率分布,都對應一種干預操作下,該系統(tǒng)的狀態(tài)情況(純觀察可以看做一種特殊的干預操作,也對應一個概率分布)。用數(shù)學定義如下

其中

表示在干預操作i的條件下,系統(tǒng)中的所有變量X的聯(lián)合概率分布,而

則是繼承下來的關系,即

。在上述燈泡的案例中,我們已知偏序關系

,于是就能繼承得到,擰下1號燈泡的條件下整個系統(tǒng)的概率分布與兩個燈泡都擰下來的條件下系統(tǒng)概率分布之間的偏序關系。

各個尺度上的SEM之間的對應關系,在本文里用轉換這個詞來描述。當我們從一個系統(tǒng)的微觀層面轉換到它的宏觀層面時,這個轉換其實就對應因果涌現(xiàn)中粗?;母拍?/span>(下文默認我們考慮的都是從一個系統(tǒng)的微觀層面轉換到它的宏觀層面,并用粗?;鼋y(tǒng)一表述)。我們用符號τ表示粗?;?,那么它在數(shù)學上意義便是兩個SEM變量集合之間的映射關系。于是兩個SEM的聯(lián)合分布之間便有如下的映射關系

在眾多粗?;僮髦校幸恍┛梢员环Q作精確轉換。要證明一個粗?;僮魇蔷_轉換,需要在兩個層面的干預集合之間找到一個映射ω,并滿足以下條件:

1.

,即微觀上干預操作后聯(lián)合概率分布要等于宏觀上對應的干預操作后聯(lián)合概率分布。

2. ω需要是滿射,即宏觀上任何一個干預操作都可以在微觀層面上找到對應的一些干預操作并滿足上面的條件。

3. 保序性,

。兩個微觀上的干預操作之間的偏序關系,到了宏觀層面上,它們對應的干預操作之間也要滿足相同的偏序關系。

在這樣的精確轉換下,兩個層面的SEM便保持了因果一致性。另外我們可以簡單地證明恒等映射和標簽的置換都是精確轉換,以及精確轉換具有傳遞性,即兩次精確轉換看作一次轉換的時候也是精確轉換。

2. 不精確轉換的案例

接下來我們用一些反例來更深入理解一下精確轉換的概念。我們定義了一個微觀層面的SEM

其含義為,對于一個變量集合{X1, X2, X3},X1, X2均由兩個外生變量直接決定,其中X1可以是任意的分布,而X2和X1永遠相反,X3則是前兩個變量的和外加一個噪聲變量。干預操作考慮到了對X2以及對X1, X2一起做的操作。接下來我們把前兩個變量相加得到一個宏觀變量,同時X3做恒等映射,粗?;玫揭粋€宏觀層面的SEM

讀者如果不想看公式,也可以看下面的示意圖理解一下

如果讀者在理解的時候感覺到了別扭,那么不必懷疑你的直覺,事實上這本身就是一個不好的粗粒化。因為X1, X2互為相反數(shù),所以Y1應該等于0而不是服從一個隨機的分布。之所以出現(xiàn)這樣的錯位是因為考慮微觀層面時我們只是純觀測,但對應到宏觀上卻等同于做了干預。我們用膽固醇的例子再來闡釋一遍。控制LDL或HDL中的一個,TC則與另一個微觀變量變化一致,服從某一種概率分布,在宏觀上是對TC的觀察而沒有干預;如果對HDL和LDL都不干預,則兩者產生的效應抵消,體現(xiàn)在宏觀水平上則是對TC做了干預使之為0,這時候TC對HD沒有實質的因果效應,而在實驗上觀測到時正時負,便是噪音在起作用了。上述繁瑣的語言描述可以用數(shù)學語言描述如下,讀者可對照理解。

類似膽固醇的例子在生物學中很常見。一般很多相似的蛋白質會形成一個超大的家族。家族中很多成員可以產生一些促進效應,但會有個別成員不起任何作用,但因為結構相似,會占據(jù)關鍵的點位,于是體現(xiàn)出抑制的作用。如果我們不能把家族成員分辨清楚,而是粗?;梢环N蛋白質,那么在實驗中會出現(xiàn)與預期相反但又無法解釋的結果??梢姳3侄喑叨戎械囊蚬恢滦詫τ谠S多學科的研究有非常重要的作用。

3. 精確轉換的三種情形

首先對無關變量的忽略可以證明是精確轉換。這里的無關變量有兩種,一個是在因果圖中沒有孩子節(jié)點的變量,這意味著它無論有沒有被干預都對其他變量沒有任何影響。另一種則是沒有被干預的變量,因為沒有被干預意味著我們并不關注它的作用,雖然它也在系統(tǒng)里但與我們關注的問題無關,例如我在研究血液膽固醇含量對心臟病的影響作用時,血液壓力可能對心臟病也有作用,但可以被忽略。這種忽略過程可以圖示如下。

這里面只有X1, X2, X3被我們干預,下游的綠色結點因為沒有孩子結點可以被忽略,而上游的藍色節(jié)點和粉色的中介結點都可以被忽略。

第二種情況是大量結點編碼粗?;梢粋€模塊。比如大腦有非常多的神經(jīng)元,如果在神經(jīng)元層面研究因果問題太過于復雜了,所以腦科學家們一般會研究一個又一個腦區(qū)。腦區(qū)便是對大量神經(jīng)元的一種粗?;?。由此我們可以延伸出研究多尺度上的因果一致性,對于我們如何劃分腦區(qū)可能有指導作用,甚至在以后闡釋意識涌現(xiàn)出來的本質機理。

上圖是這種情形的一種示意圖。當微觀層次機制是線性的時候,簡單地取個平均值,就可以證明是個不錯的精確轉換。

上種情形是空間上的因果涌現(xiàn),我們還可以看第三種情形,即時間上的因果涌現(xiàn)。這意味著我們要對一個時間上展開的過程,去粗?;臅r間步,譬如把兩步看作一個時間步,甚至直接把一個動態(tài)過程壓縮成一個靜態(tài)過程,如下圖所示。

圖中模型里取的是理想的噪音,即在每一時刻分布相同。同時也要求了微觀上的變化最終會達到平衡。此時對微觀一個時間序列上所有時間點的干預操作可以對應靜態(tài)下對某一個變量的干預。有意思的是這里的精確轉換把非環(huán)的因果圖轉換成了循環(huán)的因果圖,這一點可以啟發(fā)我們如何拆解循環(huán)因果圖變成非環(huán)的因果圖。這個情形看起來不可思議,其實在我們生活中也很常見,比如對化學反應的研究。其實在微觀層面上發(fā)生反應的分子一直在不斷變化,維持著一種動態(tài)的平衡,但因為已經(jīng)達到了平衡,我們就可以測量宏觀上各物質的體積比例等指標,把它看作一個靜態(tài)的結構。

4. 因果一致性視角對因果涌現(xiàn)的補充

我們現(xiàn)在可以把因果涌現(xiàn)和因果一致性的結構圖放在一起進行比較。

第一張圖展現(xiàn)的是因果涌現(xiàn)的過程,更注重動力學在粗?;^程中是否變得更加簡潔,而第二張圖展現(xiàn)了宏微觀兩個層面在連續(xù)干預操作下的展開過程,更注重兩個層面之間的一致性。我們可以進一步將兩個結構嘗試拼在一起。

這或許啟發(fā)我們,在追求最佳尺度上最簡潔的動力學時,應該留意不同層次上動力學的內在約束,比如干預操作的偏序關系,這樣才能保證宏觀層面上對因果關系的有效描述。

這時我們再回答一開始的問題,有效信息的衡量是萬能的嗎?來看下面一個例子。

此時我們把各種顏色的微觀結點直接映射成綠色這一種顏色,實質上是直接忽略所有變量,包括我們可能關心的變量,那么在因果一致性上想見肯定會很差。而如果去測量它的EI值,實際上會發(fā)現(xiàn)它的EI很高,因為它是一個非常簡潔清晰的動力學過程,甚至清晰到無聊的程度。在直覺上,我們也會認為這是一種非常糟糕的粗?;呗?,因為它對我們關心的問題不會有任何助益。單靠EI這一指標是無法摒除掉這樣的情形的,補充因果一致性的視角便可以幫助去除這樣糟糕的粗粒化策略。

至此我們可以設想這樣一個評價的架構,如下圖所示。

一個維度衡量動力學上的復雜程度,比如用有效信息衡量,而另一個維度則是衡量多尺度間的一致性。本文目前是給出完全精確轉換的判定方法,而在未來工作中,則有可能度量一致性的程度,從而可以刻畫近似精確轉換的情形。圖中箭頭方向代表我們粗?;姆较?。當我們粗?;容^保守時,可以容易保障一致性,但可能動力學上依舊很復雜,不利于研究,比如恒等映射,沒辦法幫助我們簡化問題。而隨著粗粒化逐漸變得激進,在我們享受粗粒化帶來的簡潔的好處的同時,還要注意一致性上的代價,比如忽略所有系統(tǒng)變量的做法,固然讓系統(tǒng)簡潔明了,但同時卻遺失了所有有效的因果信息。

楊明哲 | 作者

鄧一雪 | 編輯

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
讓數(shù)據(jù)站住腳-淺談用戶研究中的信度與效度
反向因果:來源、特征及解決方法| 連享會主頁
NeurIPS 2019 | 基于圖自編碼器的因果結構學習模型
使用結構方程模型需要知道的那些事
【視頻】結構方程模型SEM分析心理學營銷數(shù)據(jù)路徑圖可視化|數(shù)據(jù)分享
組圖:電子顯微鏡帶你開啟人體微觀之旅
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服