隨著醫(yī)學研究和信息技術(shù)的快速發(fā)展,多元數(shù)據(jù)分析方法廣泛應用于醫(yī)學各個領(lǐng)域。R 是一款優(yōu)秀的開源軟件,有著實用的統(tǒng)計計算與可視化功能。本書使用 R 語言,結(jié)合精選的醫(yī)學實例介紹常用多元統(tǒng)計分析方法。
統(tǒng)計分析方法只有在實際應用中才能得到直接、生動的驗證。本書強調(diào)實戰(zhàn)和應用,盡量淡化統(tǒng)計公式的推導和計算過程。通過本書的學習,讀者能熟練使用 R 語言及相關(guān)包實現(xiàn)多元統(tǒng)計計算,還能更深入地理解多元數(shù)據(jù)分析方法。
本書可作為醫(yī)學院校高年級本科生或研究生的多元統(tǒng)計分析課程教材,亦可作為其他專業(yè)讀者和科研工作者從事科研活動的參考資料。全書附有代碼和數(shù)據(jù)集,每章后都有習題,書后附有習題參考答案,可供讀者自學使用。
1.R語言多元統(tǒng)計分析在醫(yī)學領(lǐng)域的應用指南,結(jié)合精選的醫(yī)學實例,幫助讀者熟練使用R語言及相關(guān)包實現(xiàn)多元統(tǒng)計計算,并且更深入地理解多元數(shù)據(jù)分析方法。
2.作者趙軍副教授在流行病學、醫(yī)學統(tǒng)計學和數(shù)據(jù)科學領(lǐng)域擁有超過15年的教學和科研工作經(jīng)驗是國內(nèi)多家醫(yī)院的統(tǒng)計分析咨詢與服務專家。
3.強調(diào)實戰(zhàn)和應用,使用R語言介紹常用的多元統(tǒng)計分析方法,不僅介紹理論知識,還提供了大量的應用案例和代碼,幫助讀者更好地理解和應用所學知識。
4.本書可作為醫(yī)學院校高年級本科生或研究生的多元統(tǒng)計分析課程教材,也可作為其他專業(yè)讀者和科研工作者從事科研活動的參考資料。
5.資源豐富:全書附有代碼和數(shù)據(jù)集,習題參考答案等資源,可供讀者隨時查閱和參考。
趙軍,流行病學博士,湖北醫(yī)藥學院公共衛(wèi)生與健康學院副教授,預防醫(yī)學系主任,碩士研究生導師。主要研究方向為流行病學、醫(yī)學統(tǒng)計學、數(shù)據(jù)科學。主講“醫(yī)學統(tǒng)計學”“R語言醫(yī)學數(shù)據(jù)分析”和“醫(yī)藥數(shù)理統(tǒng)計方法”等課程。有超過15年的統(tǒng)計學和數(shù)據(jù)科學教學和科研工作經(jīng)驗,為國內(nèi)多家醫(yī)院提供統(tǒng)計分析咨詢與服務。擔任環(huán)境衛(wèi)生學雜志編委,湖北醫(yī)藥學院學報編委,十堰市健康管理學會理事等。主持和參與多項國家級、省部級科研項目,已發(fā)表SCI學術(shù)論文20余篇;撰寫了《R語言醫(yī)學數(shù)據(jù)分析實戰(zhàn)》《Python醫(yī)學數(shù)據(jù)分析入門》等圖書。
第 1 章 緒論 1
1 1 多元數(shù)據(jù) 1
1 2 多元描述性統(tǒng)計量 3
1 2 1 均值向量 3
1 2 2 協(xié)方差矩陣 3
1 2 3 相關(guān)系數(shù)矩陣 4
1 3 距離、相異系數(shù)、相似系數(shù)和列聯(lián)系數(shù) 5
1 3 1 基于數(shù)值型變量的距離 5
1 3 2 基于分類變量的相異系數(shù) 7
1 3 3 基于混合類型變量的相異系數(shù) 8
1 3 4 相似系數(shù) 9
1 3 5 列聯(lián)系數(shù) 12
1 4 多元正態(tài)分布 13
1 4 1 多元正態(tài)分布的定義 13
1 4 2 多元正態(tài)分布的檢驗 14
1 4 3 二元正態(tài)分布及其參考值范圍 15
1 5 小結(jié) 17
1 6 習題 18
第 2 章 多元數(shù)據(jù)可視化 19
2 1 相關(guān)系數(shù)圖 19
2 2 散點圖矩陣 21
2 3 符號圖 23
2 4 臉譜圖 25
2 5 星狀圖和雷達圖 27
2 6 平行坐標圖 30
2 7 調(diào)和曲線圖 32
2 8 小結(jié) 33
2 9 習題 33
第 3 章 多元數(shù)據(jù)的組間比較 34
3 1 多元 T 檢驗 34
3 1 1 單個正態(tài)總體均值向量檢驗 34
3 1 2 多元配對設(shè)計的均值向量檢驗 36
3 1 3 多元成組設(shè)計兩樣本的均值向量檢驗 38
3 2 多元方差分析 40
3 3 重復測量資料的多變量分析 42
3 4 協(xié)方差矩陣的檢驗 46
3 5 多變量的非參數(shù)檢驗 47
3 6 小結(jié) 48
3 7 習題 48
第 4 章 聚類分析 49
4 1 聚類分析的目的與方法 49
4 2 層次聚類法 50
4 2 1 度量類與類之間距離的方法 50
4 2 2 Q 型聚類實例 52
4 2 3 R 型聚類實例 59
4 3 k 均值聚類法 60
4 4 模糊 C 均值聚類法 63
4 5 基于模型的聚類 68
4 6 小結(jié) 73
4 7 習題 73
第 5 章 判別分析 75
5 1 距離判別法 75
5 2 Fisher 判別法 79
5 3 Bayes 判別法 82
5 4 機器學習分類算法 83
5 4 1 決策樹模型 84
5 4 2 使用 caret 包實現(xiàn)機器學習算法 87
5 4 3 K 最鄰近分類 92
5 4 4 支持向量機分類 95
5 4 5 神經(jīng)網(wǎng)絡分類 97
5 4 6 隨機森林分類 100
5 5 小結(jié) 102
5 6 習題 103
第 6 章 主成分分析 104
6 1 主成分分析的基本原理 104
6 1 1 主成分的定義 104
6 1 2 主成分分析的幾何意義 105
6 1 3 主成分的求法 105
6 2 使用 R 包計算主成分 107
6 2 1 使用 stats 包計算主成分 108
6 2 2 使用 FactoMineR 包計算主成分 109
6 3 主成分的應用 118
6 3 1 主成分評價 118
6 3 2 主成分回歸 122
6 4 小結(jié) 123
6 5 習題 123
第 7 章 因子分析 125
7 1 因子分析模型 125
7 2 因子分析模型的求解 126
7 3 因子旋轉(zhuǎn) 129
7 4 因子分析的注意事項 133
7 5 小結(jié) 134
7 6 習題 134
第 8 章 結(jié)構(gòu)方程模型 135
8 1 結(jié)構(gòu)方程模型概述 135
8 1 1 變量類型 135
8 1 2 結(jié)構(gòu)方程模型的組成與路徑圖 135
8 1 3 結(jié)構(gòu)方程模型分析步驟 138
8 1 4 lavaan 包簡介 141
8 2 驗證性因子分析 142
8 3 實例分析 148
8 4 小結(jié) 152
8 5 習題 152
第 9 章 典型相關(guān)分析 154
9 1 典型相關(guān)分析的基本思想 154
9 2 典型相關(guān)分析的基本原理 155
9 3 典型相關(guān)分析的基本步驟 155
9 4 實例分析 157
9 4 1 兩組變量之間的相關(guān)性 159
9 4 2 典型相關(guān)系數(shù)和典型變量 160
9 4 3 典型相關(guān)系數(shù)的顯著性檢驗 164
9 4 4 典型結(jié)構(gòu)分析 165
9 5 小結(jié) 166
9 6 習題 166
第 10 章 偏最小二乘回歸分析 168
10 1 偏最小二乘回歸的基本原理 168
10 2 偏最小二乘回歸的基本步驟 168
10 3 實例分析 170
10 4 小結(jié) 174
10 5 習題 174
第 11 章 對應分析 176
11 1 對應分析概述 176
11 1 1 對應分析的基本思想 176
11 1 2 基本概念 176
11 1 3 R 型與 Q 型因子分析的對等關(guān)系 178
11 1 4 對應分析應用于定量變量的情形 179
11 1 5 對應分析的計算步驟 179
11 2 簡單對應分析 180
11 3 多重對應分析 185
11 4 小結(jié) 194
11 5 習題 194
附錄 A 矩陣運算基礎(chǔ) 196
A 1 矩陣的定義與創(chuàng)建 196
A 2 矩陣的基本運算 197
A 3 方陣的行列式與逆矩陣 198
A 4 矩陣的特征值與特征向量 198
A 5 矩陣的奇異值分解 198
附錄 B 習題參考答案 200
參考文獻 212