第一部分 Python和統(tǒng)計(jì)學(xué)
第 1章 為什么學(xué)習(xí)統(tǒng)計(jì)學(xué) 2
第 2章 Python 4
2.1 開始 4
2.1.1 慣例 4
2.1.2 發(fā)行版和包 5
2.1.3 安裝Python 7
2.1.4 安裝R和rpy2 8
2.1.5 個(gè)性化IPython/Jupyter 9
2.1.6 Python資源 12
2.1.7 * 一個(gè)Python程序 13
2.2 Python數(shù)據(jù)結(jié)構(gòu) 14
2.2.1 Python數(shù)據(jù)類型 14
2.2.2 索引和切片 16
2.2.3 向量和數(shù)組 17
2.3 IPython/Jupyter:一個(gè)交互式的Python編程環(huán)境 18
2.3.1 Qt控制臺(tái)的* 一個(gè)會(huì)話 19
2.3.2 Notebook和rpy2 21
2.3.3 IPython小貼士 23
2.4 開發(fā)Python程序 24
2.4.1 將交互式命令轉(zhuǎn)化為一個(gè)Python程序 24
2.4.2 函數(shù)、模塊和包 26
2.4.3 Python小貼士 30
2.4.4 代碼版本控制 31
2.5 Pandas:用于統(tǒng)計(jì)學(xué)的數(shù)據(jù)結(jié)構(gòu) 31
2.5.1 數(shù)據(jù)處理 31
2.5.2 分組(Grouping) 33
2.6 Statsmodels:統(tǒng)計(jì)建模的工具 34
2.7 Seaborn:數(shù)據(jù)可視化 35
2.8 一般慣例 36
2.9 練習(xí) 36
第3章 數(shù)據(jù)輸入 38
3.1 從文本文件中輸入 38
3.1.1 目視檢查 38
3.1.2 讀入ASCII數(shù)據(jù)到Python中 38
3.2 從MS Excel中導(dǎo)入 42
3.3 從其他格式導(dǎo)入數(shù)據(jù) 43
第4章 統(tǒng)計(jì)數(shù)據(jù)的展示 45
4.1 數(shù)據(jù)類型 45
4.1.1 分類數(shù)據(jù) 45
4.1.2 數(shù)值型 46
4.2 在Python中作圖 46
4.2.1 函數(shù)式和面向?qū)ο笫降睦L圖方法 47
4.2.2 交互式繪圖 48
4.3 展示統(tǒng)計(jì)學(xué)數(shù)據(jù)集 52
4.3.1 單變量數(shù)據(jù) 53
4.3.2 二元變量和多元變量繪圖 59
4.4 練習(xí) 61
第二部分 分布和假設(shè)檢驗(yàn)
第5章 背景 63
5.1 總體和樣本 63
5.2 概率分布 64
5.2.1 離散分布 64
5.2.2 連續(xù)分布 65
5.2.3 期望值和方差 65
5.3 自由度 66
5.4 研究設(shè)計(jì) 66
5.4.1 術(shù)語 67
5.4.2 概述 67
5.4.3 研究類型 68
5.4.4 實(shí)驗(yàn)設(shè)計(jì) 69
5.4.5 個(gè)人建議 72
5.4.6 臨床研究計(jì)劃 73
第6章 單變量的分布 74
6.1 分布的特征描述 74
6.1.1 分布中心 74
6.1.2 量化變異度 76
6.1.3 分布形狀的參數(shù)描述 79
6.1.4 概率密度的重要展示 81
6.2 離散分布 82
6.2.1 伯努利分布 82
6.2.2 二項(xiàng)分布 83
6.2.3 泊松分布 85
6.3 正態(tài)分布 86
6.3.1 正態(tài)分布的例子 88
6.3.2 中心極限定理 88
6.3.3 分布和假設(shè)檢驗(yàn) 89
6.4 來自正態(tài)分布的連續(xù)型分布 90
6.4.1 t分布 90
6.4.2 卡方分布 92
6.4.3 F分布 94
6.5 其他連續(xù)型分布 95
6.5.1 對(duì)數(shù)正態(tài)分布 96
6.5.2 韋伯分布 96
6.5.3 指數(shù)分布 97
6.5.4 均勻分布 98
6.6 練習(xí) 98
第7章 假設(shè)檢驗(yàn) 100
7.1 典型分析步驟 100
7.1.1 數(shù)據(jù)篩選和離群值 100
7.1.2 正態(tài)性檢驗(yàn) 101
7.1.3 轉(zhuǎn)換 104
7.2 假設(shè)概念、、p值和樣本量 104
7.2.1 一個(gè)例子 104
7.2.2 推廣和應(yīng)用 105
7.2.3 p值的解釋 106
7.2.4 的類型 107
7.2.5 樣本量 108
7.3 靈敏度和特異度 110
7.4 受試者操作特征(ROC)曲線 113
第8章 數(shù)值型數(shù)據(jù)的均值檢驗(yàn) 114
8.1 樣本均值的分布 114
8.1.1 單樣本均值的t檢驗(yàn) 114
8.1.2 Wilcoxon符號(hào)秩和檢驗(yàn) 116
8.2 兩組之間的比較 117
8.2.1 配對(duì)t檢驗(yàn) 117
8.2.2 獨(dú)立組別之間的t檢驗(yàn) 118
8.2.3 兩組之間的非參數(shù)比較:Mann-Whitney檢驗(yàn) 118
8.2.4 統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)與統(tǒng)計(jì)學(xué)建!118
8.3 多組比較 120
8.3.1 方差分析(ANOVA) 120
8.3.2 多重比較 123
8.3.3 Kruskal–Wallis檢驗(yàn) 125
8.3.4 兩因素方差分析 126
8.3.5 三因素方差分析 126
8.4 總結(jié):選擇正確的檢驗(yàn)方法進(jìn)行組間比較 127
8.4.1 典型的檢驗(yàn) 127
8.4.2 假設(shè)的例子 128
8.5 練習(xí) 129
第9章 分類數(shù)據(jù)的檢驗(yàn) 131
9.1 單個(gè)率 131
9.1.1 置信區(qū)間 131
9.1.2 解釋 132
9.1.3 例子 132
9.2 頻數(shù)表 133
9.2.1 單因素卡方檢驗(yàn) 133
9.2.2 卡方列聯(lián)表檢驗(yàn) 134
9.2.3 Fisher 檢驗(yàn) 136
9.2.4 McNemar檢驗(yàn) 139
9.2.5 Cochran's Q檢驗(yàn) 140
9.3 練習(xí) 141
第 10章 生存時(shí)間分析 144
10.1 生存分布 144
10.2 生存概率 145
10.2.1 刪失 145
10.2.2 Kaplan–Meier生存曲線 146
10.3 在兩組間比較生存曲線 148
第三部分 統(tǒng)計(jì)建模
第 11章 線性回歸模型 150
11.1 線性相關(guān) 150
11.1.1 相關(guān)系數(shù) 150
11.1.2 秩相關(guān) 151
11.2 一般線性回歸模型 152
11.2.1 例子1:簡(jiǎn)單線性回歸 153
11.2.2 例子2:二次方擬合 153
11.2.3 決定系數(shù) 154
11.3 Patsy:公式的語言 155
11.4 用Python進(jìn)行線性回歸分析 158
11.4.1 例子1:擬合帶置信區(qū)間的直線 158
11.4.2 例子2:嘈雜的二次多項(xiàng)式 159
11.5 線性回歸模型的結(jié)果 162
11.5.1 例子:英國(guó)的和酒精 162
11.5.2 帶有截距的回歸的定義 165
11.5.3 R2值 165
11.5.4 調(diào)整后的R2值 165
11.5.5 模型的系數(shù)和它們的解釋 168
11.5.6 殘差分析 171
11.5.7 異常值 174
11.5.8 用Sklearn進(jìn)行回歸 175
11.5.9 結(jié)論 176
11.6 線性回歸模型的假設(shè) 177
11.7 線性回歸模型結(jié)果的解釋 180
11.8 Bootstrapping 180
11.9 練習(xí) 181
第 12章 多元數(shù)據(jù)分析 182
12.1 可視化多元相關(guān) 182
12.1.1 散點(diǎn)圖矩陣 182
12.1.2 相關(guān)性矩陣 182
12.2 多重線性回歸 184
第 13章 離散數(shù)據(jù)的檢驗(yàn) 185
13.1 等級(jí)資料的組間比較 185
13.2 Logistic回歸 186
13.3 廣義線性模型 188
13.3.1 指數(shù)族分布 189
13.3.2 線性預(yù)測(cè)器和連接函數(shù) 189
13.4 有序Logistic回歸 189
13.4.1 問題定義 189
13.4.2 優(yōu)化 191
13.4.3 代碼 191
13.4.4 性能 191
第 14章 貝葉斯統(tǒng)計(jì)學(xué) 193
14.1 貝葉斯學(xué)派與頻率學(xué)派的解釋 193
14.2 計(jì)算機(jī)時(shí)代的貝葉斯方法 195
14.3 例子:用馬爾可夫鏈蒙特卡洛模擬分析挑戰(zhàn)者號(hào)災(zāi)難 195
14.4 總結(jié) 198
參考答案 199
術(shù)語表 219
參考文獻(xiàn) 223