本書以構(gòu)建因果推斷基礎(chǔ)知識框架,主要從Rubin因果模型、Pearl因果模型、基于圖模型的因果效應(yīng)計算、因果結(jié)構(gòu)學(xué)習(xí)、因果機器學(xué)習(xí)五個篇章為大家介紹智因果推斷的基礎(chǔ)理論、模型、方法、和前沿應(yīng)用,引領(lǐng)學(xué)生步入充滿趣味與挑戰(zhàn)的因果推理領(lǐng)域。
本書是一本系統(tǒng)介紹因果推斷的基本概念、理論與方法的參考書,主要特色如下:
?從Rubin潛在結(jié)果模型開始,系統(tǒng)的介紹了因果推斷的基本概念、基本問題和重要假設(shè),然后詳細介紹了基于Rubin潛在結(jié)果模型的經(jīng)典和代表性的因果效應(yīng)計算方法;
?基于Rubin潛在結(jié)果模型引入Pearl因果結(jié)構(gòu)模型,比較系統(tǒng)的從圖模型的角度詳細介紹了Pearl因果推斷框架下的do演算、混雜偏差、選擇偏差、反事實、中介效應(yīng)等因果推斷的重要概念與理論方法;
?從Pearl因果結(jié)構(gòu)模型的角度詳細介紹了經(jīng)典與最新因果結(jié)構(gòu)學(xué)習(xí)算法的基本思想和執(zhí)行過程,以及Pearl因果推斷框架在實際數(shù)據(jù)中的因果效應(yīng)計算方法。
PREFACE
前 言
因果關(guān)系是事物之間的本質(zhì)關(guān)系,在揭示事物的發(fā)生機制、指導(dǎo)干預(yù)行為等方面具有不可替代的作用。自然科學(xué)、人文科學(xué)等學(xué)科和研究領(lǐng)域需要探索事物之間的因果關(guān)系和因果作用,以便更深層次地理解和認知自然現(xiàn)象和社會現(xiàn)象的規(guī)律,推動學(xué)科和研究領(lǐng)域的發(fā)展。例如,在人工智能與計算機科學(xué)領(lǐng)域,當前以數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)技術(shù)可以使機器發(fā)現(xiàn)數(shù)據(jù)中的相關(guān)關(guān)系,但是忽略了數(shù)據(jù)中固有的因果關(guān)系,使得現(xiàn)有機器學(xué)習(xí)算法在面臨數(shù)據(jù)分布發(fā)生變化時表現(xiàn)出泛化能力弱且缺乏可解釋性等問題,難以適用于開放、動態(tài)、真實的應(yīng)用場景。圖靈獎獲得者Judea Pearl教授在其專著《為什么:關(guān)于因果關(guān)系的新科學(xué)》中指出如果要真正解決科學(xué)問題,甚至開發(fā)具有真正意義智能的機器,因果關(guān)系是必然要邁過的一道坎。 圖靈獎得主Yoshua Bengio教授在Nature雜志2019年4月的專訪中認為人工智能下一步發(fā)展的關(guān)鍵要素是對因果關(guān)系的理解。2017年7月,國務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中明確指出,因果模型是建立新一代人工智能前沿基礎(chǔ)理論的重要組成部分。
本書是面向高年級本科生或研究生的因果關(guān)系推斷的入門參考書,主要介紹數(shù)據(jù)驅(qū)動的因果推斷模型,以因果推斷中混雜偏差的識別與修正問題為核心內(nèi)容,首先從Rubin的潛在結(jié)果模型框架開始,詳細介紹因果推斷的基本概念、假設(shè)、方法,然后從潛在結(jié)果模型引入Pearl的結(jié)構(gòu)因果模型框架。本書以Pearl的結(jié)構(gòu)因果模型框架為主,詳細介紹Pearl因果推斷框架下的do演算、混雜偏差、選擇偏差、反事實、中介效應(yīng)、因果結(jié)構(gòu)學(xué)習(xí)方法等基于圖模型的因果推斷的基本概念、理論、方法。
本書包括13章內(nèi)容。第1章介紹了因果關(guān)系推斷的基本概念。第2章和第3章介紹了Rubin的潛在結(jié)果模型,包括潛在結(jié)果模型的基本概念、假設(shè),以及因果效應(yīng)估計方法。第4章介紹了Pearl結(jié)構(gòu)因果模型框架下的do演算、因果貝葉斯網(wǎng)絡(luò)、結(jié)構(gòu)因果模型的基本概念。第5章介紹了混雜偏差的圖形化定義與識別、后門準則和前門準則。第6章介紹了圖形化定義的選擇偏差與計算方法。第7章和第8章分別介紹了反事實和中介效應(yīng)。第9章介紹了圖形化定義的工具變量的基本概念和計算方法。第10~12章介紹了從觀測數(shù)據(jù)中學(xué)習(xí)因果結(jié)構(gòu)的基本概念與方法。第13章介紹了因果結(jié)構(gòu)未知情形下的因果效應(yīng)估計方法。
CONTENTS
目??錄
推薦序
前言
符號表
第一部分 因果推斷基礎(chǔ)
第1章 因果關(guān)系推斷的基本概念 2
1.1 因果關(guān)系推斷 2
1.2 混雜與辛普森悖論 3
1.3 隨機對照試驗 4
1.4 數(shù)據(jù)驅(qū)動的因果推斷模型 4
1.5 圖模型 5
1.5.1 有向無環(huán)圖 5
1.5.2 最大祖先圖 7
1.6 貝葉斯網(wǎng)絡(luò) 11
參考文獻 15
第二部分 Rubin潛在結(jié)果
模型與因果效應(yīng)
第2章 潛在結(jié)果模型與因果效應(yīng)
的概念 18
2.1 潛在結(jié)果模型的概念 18
2.1.1 潛在結(jié)果的定義 18
2.1.2 潛在結(jié)果模型 20
2.2 因果效應(yīng)定義與假設(shè) 20
2.2.1 個體因果效應(yīng) 20
2.2.2 平均因果效應(yīng) 21
2.2.3 異質(zhì)性因果效應(yīng) 25
2.3 拓展閱讀 27
參考文獻 27
第3章 因果效應(yīng)估計方法 29
3.1 匹配方法 29
3.1.1 選擇協(xié)變量 31
3.1.2 定義距離度量 31
3.1.3 選擇匹配算法 34
3.1.4 評估匹配算法 39
3.2 分層方法 40
3.3 重加權(quán)方法 42
3.3.1 樣本重加權(quán) 42
3.3.2 樣本和協(xié)變量重加權(quán) 46
3.4 表示學(xué)習(xí)方法 49
3.4.1 問題轉(zhuǎn)化 49
3.4.2 反事實回歸方法 50
3.4.3 保持個體相似性的
因果效應(yīng)估計方法 54
3.5 拓展閱讀 60
參考文獻 61
第三部分 Pearl因果
圖模型與方法
第4章 干預(yù)與因果圖模型 64
4.1 干預(yù)與do演算 64
4.2 因果貝葉斯網(wǎng)絡(luò)模型 65
4.2.1 因果貝葉斯網(wǎng)絡(luò)基礎(chǔ) 65
4.2.2 因果貝葉斯網(wǎng)絡(luò)與干預(yù) 68
4.3 結(jié)構(gòu)因果模型 71
4.3.1 結(jié)構(gòu)因果模型的定義 71
4.3.2 結(jié)構(gòu)因果模型與干預(yù) 72
4.4 拓展閱讀 73
參考文獻 73
第5章 混雜偏差 75
5.1 混雜因子的圖形化表示 75
5.2 父代因果效應(yīng)準則 77
5.3 后門準則 79
5.4 前門準則 81
5.5 do演算公理系統(tǒng) 83
5.6 拓展閱讀 85
參考文獻 86
第6章 選擇偏差 87
6.1 選擇偏差的概念 87
6.2 選擇偏差的圖形化表示 88
6.3 選擇后門標準 90
6.4 拓展閱讀 92
參考文獻 93
第7章 反事實推斷 95
7.1 反事實的定義 95
7.2 反事實計算 96
7.3 反事實和干預(yù) 98
7.3.1 反事實與do算子 98
7.3.2 后門的反事實解釋 100
7.4 反事實與潛在結(jié)果 102
7.5 反事實與決策 104
7.5.1 必要因、充分因和充要因 104
7.5.2 參與者處理效應(yīng) 106
7.6 拓展閱讀 108
參考文獻 108
第8章 因果中介效應(yīng) 110
8.1 中介效應(yīng)的基本概念 110
8.2 基于線性模型的因果中介效應(yīng) 113
8.3 基于反事實的因果中介效應(yīng) 115
8.4 進一步分析 121
8.5 拓展閱讀 123
參考文獻 123
第9章 工具變量 125
9.1 工具變量的概念 125
9.1.1 三個基本條件 125
9.1.2 工具變量不等式 126
9.1.3 同質(zhì)性與單調(diào)性 127
9.2 工具因果效應(yīng)估計 129
9.2.1 二值工具因果效應(yīng)估計 129
9.2.2 連續(xù)工具因果效應(yīng)估計 130
9.3 條件工具變量 131
9.4 識別工具變量 133
9.5 拓展閱讀 135
參考文獻 135
第四部分 因果結(jié)構(gòu)學(xué)習(xí)方法
第10章 組合優(yōu)化因果結(jié)構(gòu)學(xué)習(xí) 138
10.1 限制優(yōu)化學(xué)習(xí) 139
10.1.1 理論基礎(chǔ) 139
10.1.2 PC算法 142
10.1.3 FCI算法 154
10.2 打分優(yōu)化學(xué)習(xí) 161
10.2.1 基本思路 161
10.2.2 評分函數(shù) 162
10.2.3 經(jīng)典的打分優(yōu)化
學(xué)習(xí)算法 165
10.3 拓展閱讀 168
參考文獻 168
第11章 連續(xù)優(yōu)化因果結(jié)構(gòu)
學(xué)習(xí) 171
11.1 連續(xù)優(yōu)化方法 171
11.1.1 模型構(gòu)造 171
11.1.2 權(quán)重鄰接矩陣 172
11.1.3 數(shù)值問題轉(zhuǎn)化 173
11.1.4 無環(huán)約束方法 174
11.1.5 迭代優(yōu)化 176
11.2 從線性模型到神經(jīng)網(wǎng)絡(luò) 177
11.3 用MLP進行DAG學(xué)習(xí) 179
11.3.1 多層感知機 179
11.3.2 生成模型構(gòu)建 180
11.3.3 鄰接矩陣表示 181
11.3.4 訓(xùn)練優(yōu)化 183
11.4 DAG-GNN 183
11.4.1 問題轉(zhuǎn)化 184
11.4.2 變分自編碼器 184
11.4.3 模型構(gòu)造 187
11.4.4 離散情形 188
11.4.5 無環(huán)約束改進 188
11.4.6 訓(xùn)練優(yōu)化 189
11.5 對抗優(yōu)化方法SAM 190
11.5.1 生成對抗網(wǎng)絡(luò) 190
11.5.2 深度神經(jīng)網(wǎng)絡(luò)擬合
因果機制 190
11.5.3 學(xué)習(xí)準則 192
11.6 拓展閱讀 195
參考文獻 196
第12章 局部因果結(jié)構(gòu)學(xué)習(xí) 198
12.1 基于限制的局部因果結(jié)構(gòu)學(xué)習(xí) 198
12.1.1 局部骨架學(xué)習(xí) 198
12.1.2 局部骨架定向 208
12.2 基于打分的局部因果結(jié)構(gòu)學(xué)習(xí) 210
12.3 局部到全局的因果
結(jié)構(gòu)學(xué)習(xí) 211
12.3.1 MMHC算法 211
12.3.2 對稱性校正 212
12.4 拓展閱讀 213
參考文獻 214
第五部分 因果結(jié)構(gòu)未知情形下的因果效應(yīng)估計
第13章 基于CPDAG的因果效應(yīng)
估計 218
13.1 基于全局CPDAG的
因果效應(yīng)估計 218
13.1.1 IDA算法思想 218
13.1.2 IDA算法執(zhí)行 219
13.2 基于局部因果結(jié)構(gòu)的
因果效應(yīng)估計 222
13.2.1 總效應(yīng)和直接效應(yīng) 222
13.2.2 等價類與鏈組件 223
13.2.3 基于鏈組件的全局方法 224
13.2.4 基于鏈組件的局部方法 227
13.3 拓展閱讀 231
參考文獻 231