整理 | 智源社區,龔鶴揚&高亦斌

2020年6月21日,在第二屆北京智源大會開幕式及全體會議上,圖靈獎得主、貝葉斯網絡奠基人Judea Pearl 做了名爲《The New Science of Cause and Effect with reflections on data science and artificial intelligence》的主題演講。

在演講中,Judea Pearl 站在整個數據科學的視角,簡單回顧了過去的“大數據革命”,指出數據科學正在從當前以數據爲中心的範式向以科學爲中心的範式偏移,現在正在發生一場席捲各個研究領域的“因果革命”。Pearl 解釋了什麼是因果科學以及相關新邏輯和推理引擎的思想脈絡,包括介紹了被稱之爲“Double-Helix”的兩個因果推理的基本定理,並以其作爲出發點推演出因果圖模型框架,最後概述了該框架下因果推理的七大工具。

另外,爲了幫助讀者們更加透徹地理解Pearl 的因果推理思想,我們結合 Judea Pearl 近年來的論文、訪談和報告,以及其學生 Elias Bareinbion、馬普智能所 Bernhard Scholkopf 團隊等的相關研究工作,對本報告進行了一定的補充說明。

Judea Pearl 個人簡介

朱迪亞·珀爾(Judea Pearl)是加州大學洛杉磯分校(UCLA)教授,圖靈獎(Turing Award)得主。他在 20 世紀 80 年代開發並倡導了AI 的概率方法,被稱爲貝葉斯網絡之父。然而爲了強人工智能的願景,Pearl 脫離主流 AI 研究社區,提出了一套因果的數學語言和理論,引領了正在席捲各個學科的”因果革命“。他自己最引以爲傲的工作是 “The fundamental law of counterfactuals。”[4]

 To Build Truly Intelligent Machines, Teach Them Cause and Effect。
         ——Judea Pearl

因果革命:改變數據科學的新革命

在報告中 ,Pearl 首先介紹了一場正在改變數據科學的新革命 --- ”因果革命“。因果革命和以數據爲中心的第一次數據科學革命,也就是大數據革命(涉及機器學習,深度學習機器應用,例如Alpha-Go、語音識別、機器翻譯、自動駕駛等等 )的不同之處在於,它以科學爲中心,涉及從數據到政策、可解釋性、機制的泛化,再到一些社會科學中的基礎概念信用、責備和公平性, 甚至哲學中的創造性和自由意志 。可以說, 因果革命徹底改變了科學家處理因果問題的方式。

      

圖1:Pearl 關於數據科學本質的洞見,見文獻[3]

因果革命中,數據科學的任務被重新分成了三類:預測, 描述和反事實預測[6]。關於它具體如何席捲各個學科,詳情可參見:

  • Bernhard Scholkopf 最引以爲傲的論文之一《Causality for Machine Learning》,它概述了信息革命時代下因果和機器學習的融合的基本原理和深刻思考[5];

  • 《Causal Inference and Data-Fusion in Econometrics》是 Elias Eareinboim(Pearl 學生) 關於因果結合經濟學領域的最新綜述[7];

  • 因果也影響了社會科學, 醫療健康科學, 計算機和統計學等,見資料[1, 8]。

哈佛大學教授 Gary King(2014) 盛讚了這場因果革命,它指出“過去三十年關於因果理論的進展超過了人類前面積累的總和。” Pearl 繼續解釋說,成百上千過去認爲不可能解決的問題,現在可以通過簡單的數學和可計算的算法解決。在介紹完“因果革命”之後,Pearl接着介紹了本次報告的大綱:

  • 什麼是因果科學,爲什麼它需要新的邏輯和推斷引擎

  • 如何讓機器獲得因果推理的能力(因果推理引擎的結構)

  • 因果推理的兩個基本定律

  • 因果智慧的七個工具

什麼是因果科學?

當前曲線擬合的機器學習和深度學習取得了巨大的成功,爲什麼需要研究因果[8]?Pearl 在去年接受 Lex Fridman 訪談[4]時提到 “Everything starts with the question: What is the research question? ”。

而Pearl 在這次報告中,則用了幾個統計學中的經典例子。第一個問題是:“鍛鍊身體是否能夠有利於健康?”見下圖,x軸表示運動時間,y軸表示膽固醇水平。

圖2:鍛鍊是否有利於健康?

一方面,在圖2(左)中,可以看大每個年齡組中都出現了向下的趨勢,表明運動可能的確有降低人體膽固醇水平的效果;另一方面,在圖2(右)中,同樣的散點圖並不依據年齡對數據進行分層,那麼我們就會看到一個明顯向上的趨勢,這表明運動得越多,人體膽固醇水平就越高,這種矛盾在統計學中被成爲辛普森悖論。Pearl 介紹的另外兩個例子,一個是關於“藥物”、“性別”、“死亡率”的研究問題:“藥物有效果嗎?” 另外一個是關於“疫苗”、“天花”、“死亡率”的研究問題:“疫苗有效果嗎?”

這幾個例子共同說明了數據可能對你講出兩個不同的故事。如果信息發生了一些變化,得到的結論就可能是不一樣的。更加準確地來說,這幾個例子本質上是要回答因果問題,僅有數據信息而沒有先驗因果關係信息的時候,就可能得出與關注研究的問題相互矛盾的答案。回答因果問題需要因果信息。

Pearl 在這次報告中指出,因果科學始於因果問題,因果科學研究如何回答因果問題。

什麼是因果問題呢?他舉了幾個簡單的例子:

1. 給定的治療方法在預防疾病方面效果如何?

2. 是新的減稅政策導致銷售額上升嗎?還是我們的營銷活動?

3. 肥胖引起的年度醫療保健費用是多少?

4. 僱傭記錄可以證明僱主犯了性別歧視嗎?

5. 我即將辭職,我會後悔嗎?

他解釋到,上面這五個因果問題,因爲這些問題都包含着不對稱信息,所以無法用現在標準的科學語言,也就是具備對稱性的數學公式來描述。相對於“=”表示對稱信息,他用箭頭 → 表示非對稱信息,見下圖:

圖3:對稱 VS 非對稱

在過去的30年中,Pearl 和他的同事找到了非對稱性的表達工具。他認爲因果科學是回答因果問題的邏輯和工具,也就是推理引擎。通俗來說它有三個輸入,包括我們想知道什麼、我們已經知道什麼和可用數據,以及作爲輸出的兩類關注問題的答案:a) 現在某個行動會有什麼結果?b) 過去換個選擇會有什麼不同的結果?

因果推理是人類思想中不可或缺的組成部分,應該對其進行形式化和算法化處理,以實現人類水平的機器智能[3]。Pearl 描述了一個因果推理的三級結構,把因果信息按其能夠回答的類型進行分類。該分類形成了一個三層的層級結構,某層的問題,只有在獲取不低於該層信息時,才能夠被回答。

a) 三個因果層級  

        圖4:三個因果層級,參見書籍[2]

第一層是關聯(Association),它涉及由數據定義的統計相關性。大多數機器學習系統圍繞這一層運行。

第二層是干預(Intervention),不僅涉及到能看到什麼,還涉及一個干預或行動將會導致什麼結果。作爲例子,Pearl 提了一個問題:“如果我們把價格翻倍,將會發生什麼?”

第三層是反事實(Counterfactual),是對以前發生的事情的反思和溯因,解決的是“如果過去作出不一樣的行爲,現在的結果會有何不同?”的問題。

頂層也就是反事實層是功能最強大的層次,如果我們有一個可以回答反事實問題的模型,那麼我們也可以回答有關干預和觀察的問題。例如,干預問題:What will happen if we double the price? 可以通過反事實問題來回答:What would happen had the price been twice its current value? 同樣,一旦我們回答了干預問題,就可以回答關聯問題。我們只是忽略了干預動作部分,而是讓觀測取代了。但是在相反的方向上,干預問題不能僅憑觀測信息(也就是統計相關性)回答,涉及反思和溯因的反事實問題也不能僅用從隨機對照實驗中獲得的干預信息來回答。

反事實是科學思維以及法律和道德推理的基礎。舉個例子,在法庭判定被告是否應該負法律責任的時候,判定有罪的一個依據是 ——“若非”被告的行爲,損失就很可能不會發生(For example, in civil court, a defendant is considered responsible for an injury if, but for the defendant's action, it is more likely than not the injury would not have occurred)。"若非" 的計算含義要求將現實世界與被告未發生某行爲反事實世界進行比較。用個更通俗的例子來講,已知的事實是"一個人喫了藥死了",對應的一個反事實問題是“如果此人沒有喫藥,不死的概率是多少?”

Pearl 在報告中指出,理解因果推理需要抓住一個竅門,那就是區分 seeing 和 doing 的不同,一個簡單例子就是某個便利店中”觀測到某商品的價格翻倍“和“店主強制讓某商品價格翻倍”存在區別。Pearl 發明了 do 算子來數學化表示干預或行爲,有了它我們能用數學公式區分 seeing 和 doing:

????(????|????)≠????(????|????????(????))

這裏我們借用文獻[5]中一個表格補充說明,表格的行是不同類型的問題,而列是不同類型模型:

表1:從統計模型到因果模型,再到物理模型[5]

可以看到統計模型只有關聯層的信息,所以只能回答相關性問題,而不能回答干預問題和反事實問題。基於圖的因果貝葉斯網絡因果只有干預層的信息,所以只能回答干預和關聯層的問題,而不能回答反事實問題。最後基於結構的因果模型,它的能力最接近物理模型,三個層級的問題都能夠回答。事實上,朱松純教授[10]在報告的最後向 Pearl 提出了因果建模的定位問題, 他說他喜歡因果建模的思想 “From data to science”,從上面的表格中可以看到因果模型是從統計模型走向物理模型的過渡。

b) 因果推理引擎

Pearl 提出了一套基於結構的關於因果的數學語言和理論,作爲因果科學是回答因果問題的推理引擎,該引擎的特點是 “Knowledge in, Knowledge out, Data in between”, 而基本出點是因果推理的兩大基本定律:  

圖5: 因果推理的兩大基本定律

他指出第一個定律是關於反事實的信息,可以推演出需要使用函數來刻畫變量之間的因果關係,而第二個定律刻畫了因果圖結構,因果圖上每個每條缺失的邊都意味着在給定某些變量下的條件獨立性,可用它做模型檢驗,結構學習和因果問題的符號演算。他以這兩大基本定律爲出發點,發展出了被稱爲結構因果模型(SCM)的數學框架,該框架能夠回答三個層級的因果問題。在如下的例子中,模型用函數關係表示,而因果圖上的缺失的邊 CW 和 SR 都意味着給定某些變量之下的條件獨立性。

  圖6:一個簡單結構因果模型

現代因果建模工具的發展已對所有數據密集型科學(尤其是社會科學和流行病學)產生了變革性的影響,其中因果圖已成爲它們的第二語言。在這些學科中,因果圖模型幫助科學家從觀測數據中提取因果關係,並解構了困擾研究人員數十年的悖論。

我們根據 Pearl 的論文[3]補充說明因果科學的推理引擎,它由三個部分組成:圖模型,結構方程以及反事實和干預邏輯。圖模型是一種語言,用於表示 Agent 對世界的瞭解。反事實幫助他們闡明他們想知道的事情。結構方程將兩者以紮實的語義聯繫在一起。該推理引擎將假設(以圖模型的形式)、數據和 Query 作爲輸入。

圖7:SCM推理引擎如何結合數據和因果模型回答因果問題,見文獻[3]

SCM推理引擎存在三個輸出:

  • 估計式(Estimand) 是關注的查詢(Query)的某個概率表達式,表示在已有模型假定下計算 Query 的一種方法;

  • Estimate 是用某種統計方法和已有數據對 Estimand 概率表達式的估計;

  • 一組擬合指標(Fit Indices)用於衡量數據與假設的兼容程度。

第一個輸出是較難理解的,如果已有模型假定下某 Query 無法回答,也就是沒有對應的 Estimand,則稱該 Query 爲“不可識別”,Pearl 的 do-calculus 就是判斷 Query 是否可識別的一個完備的演算工具。Pearl 僅用抽象的方式描述了這個推理引擎,關於該引擎如何回答因果問題,如何解決數據科學中的混雜偏差,選擇偏差和遷移學習問題的細節可以參考 Elia Bareinboim 的論文[7]。

因果推理的七個工具

接着 Pearl 概述了通過因果科學的推理引擎完成七個任務以及每個任務中使用的工具,並討論了每個工具對自動推理技術的獨特貢獻。下面是因果智慧的七大工具:

Tool 1. Encoding causal assumptions in transparent and testable way. 

Tool 2. Predicting the effects of actions and policies.   

Tool 3. Computing counterfactuals and finding causes of effects (attribution, explanation, susceptibility). 

Tool 4. Computing direct and indirect effects (Mediation) (discrimination, inequities, fairness)

Tool 5. Integrating data from diverse sources (external validity and selection bias). 

Tool 6. Recovering from missing data.   

Tool 7. Discovering causal relations from data

第一個工具就是使用因果圖透明的編碼了因果知識,使用 d-分離圖準則下的條件獨立性來檢驗因果結構先驗假設。Pearl 給出了 Shrier 和 Platt 於 2008 年提出的運動醫學領域的簡單例子(熱身對於運動損傷的影響),在這個例子中變量之間相互如何相互影響被透明的表示了出來,變量之間因果關係的確定可以基於合理的事實,它能用 d-分離圖準則下的條件獨立性來檢驗。

圖8:一個因果圖模型實例

第二個工具就是使用 Do-Calculus 定義和回答干預層的因果問題,這些問題包括計算某個行爲,干預或策略產生的因果效應。繼續看熱身對於運動損傷的因果效應例子,我們需要選擇哪些變量作爲控制變量呢?是不是控制變量越多越好呢?Pearl的回答是,一定不要控制變量 Z3(也就是Previous Injury), 否則下圖的因果路徑(加粗)會被聯通,造成混雜偏差,不能正確估計回答該因果效應的問題,正確的做法是控制變量 Z1, Z2 。具體 Do-Calculus 解決混雜偏差建議參考文獻[7]。

        圖9:Do-Calculus 確定控制變量

第三個工具是計算反事實,找出某個結果的原因。我們要去找到事件結果的原因,我們要進行歸因,進行解釋。反事實是科學思維以及法律和道德推理的基礎,例如,反事實問題 “一個人喫了藥死了,如果此人沒有喫藥,不死的概率是多少?”的答案是法律責任判定中的重要依據。

 

圖10:反事實概率回答歸因問題

第四個工具是中介分析。直接(間接)因果效應是指一個變量對另一變量的既定影響在多大程度上是直接的(間接的),這是許多不同學科都關注的一類重要因果問題,它們可用 Pearl 的推理引擎解決。這一工具現在也被用於判斷「歧視」、「不公正的做法」、「不公平現象」,我們要討論人工智能和機器學習領域中的公平性問題時,我們必須考慮中介效應,Pearl 給出了一個僱主是否有性別歧視的例子,也就是回答如何用數據判斷僱主是否用性別決定錄用員工與否的問題。

圖11:中介分析回答性別歧視與否問題

第五個工具是泛化和數據融合。它的基本問題關於如何融合分佈不同的實驗性研究或觀測性研究,Pearl 及其學生 Elias Bareinboim 提出一個解決此任務的框架,這是 Pearl 在文獻[1]中稱因果建模工具能夠幫助解決 AI 應用中魯棒性或適應性的原因。Pearl 在報告中用一個例子簡單的講解了一下基本思路,首先把數據源的數據類型(觀測/RCT)和其他特點用圖表(上)列出來,然後轉化稱對應的因果圖(下),其中圖中 S 節點標記了數據源的 S 指向變量有差異。這樣就可以用因果建模工具綜合不同數據源,回答關注總體的感興趣因果問題,其詳情見文獻[7]

圖12:因果推理解決多源數據集融合問題實例

第六個工具是從缺失數據恢復。由於缺少數據而導致的問題困擾着實驗科學的每個分支,所有的數據都會有一個缺失值的問題,它本質是一個因果問題。實際上建立一個缺失數據因果模型之後,可以用因果推理引擎判斷和實現從缺失數據下的所關注問題的推斷。

圖13:缺失數據問題本質是因果問題

第七個工具是因果發現。因果發現就是要去尋找一系列的模式或者圖結構,能夠與數據相兼容的,同時能夠進行簡潔的表示。當前從數據中得到因果結構的因果結構學習,不僅要學習因果結構,還要學習從數據中直接得出哪些變量是因果變量的因果表示學習,這已經成爲了當前一個熱點研究課題,Pearl 在文獻[2]中提出了爲 AI 提出小圖靈測試作:

How can machines represent causal knowledge in a way that would enable them to access the necessary information swiftly, answer questions correctly, and do it with ease, as a human can?

結論

最後,Pearl 指出,因果革命不僅僅席捲了各個研究領域,也開始影響教育和實際應用,將數據科學從當前以數據爲中心的範式往科學爲中心的範式偏移。這個革命的高潮還沒有到來,但我們將會看到一個非常聲勢浩大的革命,尤其是從社會智能的角度來觀察。我們將能夠與機器智能進行緊密的交流和互動,無論用戶是誰,其可能是另外一個機器或者電力服務系統,這在社會智能領域未來的十年中就會發生。另外一個,是與倫理學相關的,即同理心,最終機器甚至會有意識和自由意志、同情心以及倫理道德。所以,我們每一個人都應更多地關注因果科學。

For me, consciousness is having a blueprint of your software. 
---Pearl, 2019 Dec[4]

特別注意,我們在文章中引用論文的方式並不嚴格,應該把當成一個參考資料來理解。事實上,這一部分給出了筆者認爲對參與這場“因果革命”至關重要,精心挑選之後的資料。希望在教會讀者機器因果思維,構建能夠通過小圖靈測試的 Causal AI 之路上,這些資料可以幫助讀者快速理解和把握因果科學全局。

下面是這些資料及其簡介:

[1] “Foundations and new horizons for causal inference”  研討會, 2019,https://opc.mfo.de/show_workshop?id=3271

因果推斷始於經濟和生物統計等學科,它剛剛纔開始成爲人工智能的一個重要工具,數學基礎依舊很零碎,該研討會聚集了來自人工智能,生物統計學,計算機科學,經濟學,流行病學,機器學習,數學和統計學的頂尖研究人員,研討會上的報告和討論將有助於在未來幾年內塑造和改變這一領域的發展。

[2] "The Book of Why: the new science of cause and effect," Judea Pearl and Dana MacKenzie, (Basic Books, 2018). http://bayes.cs.ucla.edu/WHY/

[3] J. Pearl, “The Seven Tools of Causal Inference with Reflections on Machine Learning,”  Communications of ACM, 62(3): 54-60, March 2019

[4] Judea Pearl: Causal Reasoning, Counterfactuals, Bayesian Networks, and the Path to AGI | AI Podcast https://youtu.be/pEBI0vF45ic

這三個材料是 Pearl 的因果理論的最新綜述,較爲通俗易懂介紹了因果關係的新科學,描繪了一條教會機器因果思維的強人工智能之路。

[5] Causality for Machine Learning, Bernhard Schölkopf, 2019

這是一篇剛剛掛 arxiv 就被 Pearl  親自 twitter 點讚的論文,是馬普智能所所長 Bernhard Scholkopf 最引以爲傲的論文之一,他將被 Pearl 點贊這事情寫在其個人主頁自我介紹的第一段中。Scholkopf 及其團隊在因果結合機器學習方面做了最多的工作,此文總結和昇華了提出了信息革命時代下因果結合機器學習的一般理論和深刻思考。

[6] A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks, Miguel A. Hernán, John Hsu &Brian Healy, 2019

來自哈佛教授 Migual A. Hernan 對當前數據科學的深刻反思,澄清了數據科學任務如何分類的基本問題:prediction, description and counterfactual prediction.

[7] Causal Inference and Data-Fusion in Econometrics, P. Hünermund, E. Bareinboim.Dec, 2019. 

該論文是因果革命,Pearl 的因果圖模型框架如何影響某一個特定領域--計量經濟學的範例。 

[8] Beyond Curve Fitting: Causation, Counterfactuals, and Imagination-based AI, AAAI Spring Symposium, March 25-27, 2019 https://why19.causalai.net/

這是 Judea Pearl 和其學生 Elias Eareinboim 組織的一次研討會,探索了 Causality + X: X 代表了某個學科。

[9]  NeurIPS’2019, From System 1 Deep Learning to System 2 Deep Learning, Yoshua Bengio. Video with synchoronized slides https://slideslive.com/38921750/from-system-1-deep-learning-to-system-2-deep-learning.

Bengio 描繪了一個具備因果推理能力和 AI 系統 

[10] 加州大學洛杉磯分校UCLA朱松純教授,淺談人工智能:現狀、任務、構架與統一 | 正本清源

推薦閱讀
你點的每個“在看”,我都認真當成了AI
相關文章