目錄
中文版序言 1
英文版序言 1
譯校者序 11引言 1
1.1本書概述 3
1.2如何使用本書 6
1.3R的簡介 9
1.3.1算術(shù)運算 10
1.3.2對象 11
1.3.3向量 14
1.3.4函數(shù) 16
1.3.5數(shù)據(jù)文件 19
1.3.6保存對象 22
1.3.7軟件包 23
1.3.8編程及學(xué)習(xí)技巧 24
1.4總結(jié) 26
1.5練習(xí) 26
1.5.1自我匯報是否參加投票的偏差 26
1.5.2了解世界人口動態(tài) 282因果關(guān)系 31
2.1勞動力市場的種族歧視 31
2.2用R取得的數(shù)據(jù)子集 35
2.2.1邏輯值和運算符號 36
2.2.2關(guān)系運算符 38
2.2.3生成子集 39
2.2.4簡單的條件語句 42
2.2.5因子變量 43
2.3因果效應(yīng)與反事實 45
2.4隨機對照試驗 47
2.4.1隨機化的作用 47
2.4.2社會壓力和投票率 49
2.5觀察性研究 53
2.5.1最低工資和失業(yè) 53
2.5.2混淆偏誤 56
2.5.3前后設(shè)計和倍差設(shè)計 59
2.6單變量的描述性統(tǒng)計量 62
2.6.1分位數(shù) 62
2.6.2標(biāo)準(zhǔn)差 65
2.7總結(jié) 66
2.8習(xí)題 67
2.8.1早教小班化的有效性 67
2.8.2改變對同性戀婚姻的看法 69
2.8.3刺殺領(lǐng)導(dǎo)人成功率的自然實驗 703度量 73
3.1戰(zhàn)爭時期平民受傷情況的度量 73
3.2處理R中缺失的數(shù)據(jù) 76
3.3可視化單變量分布 78
3.3.1條形圖 78
3.3.2直方圖 80
3.3.3箱形圖 83
3.3.4打印及保存圖表 85
3.4調(diào)查抽樣 86
3.4.1隨機化的作用 87
3.4.2拒訪和其他偏誤來源 91
3.5度量政治極化 93
3.6概括雙變量關(guān)系 95
3.6.1散點圖 95
3.6.2相關(guān)性 98
3.6.3分位數(shù)—分位數(shù)圖 102
3.7聚類 104
3.7.1R中的矩陣 105
3.7.2R中的列表 107
3.7.3k均值算法 108
3.8總結(jié) 112
3.9練習(xí) 113
3.9.1改變對待同性戀婚姻的看法(再探) 113
3.9.2中國和墨西哥的政治效力 114
3.9.3聯(lián)合國大會投票表決 1164預(yù)測 119
4.1預(yù)測選舉結(jié)果 119
4.1.1R的循環(huán)語句 120
4.1.2R中的一般條件語句 123
4.1.3基于民意調(diào)查的預(yù)測 126
4.2線性回歸 134
4.2.1面部長相與選舉結(jié)果的聯(lián)系 134
4.2.2相關(guān)性與散點圖 136
4.2.3最小二乘法 138
4.2.4趨中回歸 143
4.2.5R中的合并數(shù)據(jù)集 144
4.2.6模型擬合 151
4.3回歸與因果關(guān)系 156
4.3.1隨機化的實驗 156
4.3.2多元預(yù)測回歸 159
4.3.3異質(zhì)性干預(yù)效應(yīng) 164
4.3.4斷點回歸設(shè)計 169
4.4總結(jié) 174
4.5練習(xí) 174
4.5.1基于博彩市場的預(yù)測 174
4.5.2墨西哥的選舉和條件現(xiàn)金轉(zhuǎn)移計劃 176
4.5.3巴西政府轉(zhuǎn)移和減少貧困率 1795數(shù)據(jù)探索 181
5.1文本數(shù)據(jù) 181
5.1.1《聯(lián)邦黨人文集》懸而未決的作者問題 181
5.1.2文本—項矩陣 185
5.1.3挖掘主題 186
5.1.4作者預(yù)測 191
5.1.5交叉驗證 193
5.2網(wǎng)絡(luò)數(shù)據(jù) 196
5.2.1文藝復(fù)興時期佛羅倫薩的婚姻網(wǎng)絡(luò) 197
5.2.2無方向的繪圖和中心性度量 198
5.2.3推特關(guān)注網(wǎng)絡(luò) 202
5.2.4有方向的圖和中心性 204
5.3空間數(shù)據(jù) 210
5.3.11854年倫敦暴發(fā)霍亂 210
5.3.2R中的空間數(shù)據(jù) 213
5.3.3R中的色彩 216
5.3.4美國總統(tǒng)選舉 219
5.3.5沃爾瑪?shù)臄U張 221
5.3.6R中的動畫 223
5.4總結(jié) 225
5.5練習(xí) 226
5.5.1分析憲法的序言 226
5.5.2國際貿(mào)易網(wǎng)絡(luò) 228
5.5.3制作美國總統(tǒng)選舉跨時間的地圖 2296概率 232
6.1概率 232
6.1.1頻率統(tǒng)計與貝葉斯統(tǒng)計 232
6.1.2定義和公理 234
6.1.3排列 237
6.1.4有和沒有替換的抽樣 240
6.1.5組合 241
6.2條件概率 244
6.2.1條件、邊際和聯(lián)合概率 244
6.2.2獨立性 251
6.2.3貝葉斯法則 255
6.2.4用姓氏和居住地來預(yù)測種族 257
6.3隨機變量和概率分布 267
6.3.1隨機變量 267
6.3.2伯努利和均勻分布 268
6.3.3二項分布 272
6.3.4正態(tài)分布 276
6.3.5期望和方差 281
6.3.6預(yù)測充滿不確定性的選舉結(jié)果 285
6.4大樣本定理 288
6.4.1大數(shù)定律 288
6.4.2中心極限定理 290
6.5總結(jié) 294
6.6練習(xí) 295
6.6.1恩格瑪機中的數(shù)學(xué) 295
6.6.2博彩市場選舉預(yù)測的概率模型 296
6.6.3俄羅斯的選舉舞弊 2987不確定性 301
7.1估計 301
7.1.1無偏性和一致性 302
7.1.2標(biāo)準(zhǔn)誤 308
7.1.3置信區(qū)間 313
7.1.4誤差邊際和民意調(diào)查中的樣本規(guī)模計算 318
7.1.5隨機對照試驗分析 322
7.1.6基于學(xué)生t分布的分析 325
7.2假設(shè)檢驗 328
7.2.1品茶試驗 328
7.2.2總體框架 331
7.2.3單樣本檢驗 335
7.2.4雙樣本檢驗 341
7.2.5假設(shè)檢驗的陷阱 346
7.2.6效力分析 348
7.3含不確定性的線性回歸模型 354
7.3.1作為生成模型的線性回歸模型 354
7.3.2估計系數(shù)的無偏性 359
7.3.3估計系數(shù)的標(biāo)準(zhǔn)誤 362
7.3.4關(guān)于參數(shù)的推斷 364
7.3.5關(guān)于預(yù)測的推斷 367
7.4總結(jié) 373
7.5練習(xí) 373
7.5.1性別比和中國農(nóng)作物的價格 373
7.5.2學(xué)術(shù)研究中的抽屜偏誤和發(fā)表偏見 375
7.5.31932年德國魏瑪共和國的大選 377
8下一步 380
詞匯表 383