醫(yī)療大數(shù)據(jù)是大數(shù)據(jù)在醫(yī)療領域的一個分支,處理的是在與人類健康相關的活動中產生的與生命健康和醫(yī)療有關的數(shù)據(jù)。本書將對醫(yī)療大數(shù)據(jù)進行全面、透徹的分析,從醫(yī)療大數(shù)據(jù)的現(xiàn)狀開始,介紹醫(yī)療大數(shù)據(jù)方向的統(tǒng)計、數(shù)據(jù)挖掘、數(shù)據(jù)預處理、建模以及可視化等技術與應用。此外,還介紹了醫(yī)療領域的圖像處理和自然語言處理等人工智能技術。在本書的末尾,還討論了這個領域普遍關注的一個問題——醫(yī)療數(shù)據(jù)隱私保護,介紹了潛在的隱私風險和隱私保護方法等,并關注了醫(yī)療經濟的概況與前景。
通過閱讀本書,你將了解:
醫(yī)療大數(shù)據(jù)的現(xiàn)狀及產業(yè)劃分等;
如何統(tǒng)計挖掘和處理醫(yī)療領域的數(shù)據(jù)以方便分析;
醫(yī)學數(shù)據(jù)可視化如何提升醫(yī)療人員診斷病情的效率;
人工智能技術在醫(yī)療領域的應用;
如何對醫(yī)療數(shù)據(jù)進行隱私保護。
前言
第1章 醫(yī)療大數(shù)據(jù)概述 1
1.1 全球大數(shù)據(jù)現(xiàn)狀與特點 2
1.2 醫(yī)療大數(shù)據(jù)簡介 8
1.3 醫(yī)療大數(shù)據(jù)分析 11
1.4 醫(yī)療大數(shù)據(jù)產業(yè)劃分 13
1.4.1 基礎層 13
1.4.2 數(shù)據(jù)層 14
1.4.3 應用層 14
1.5 醫(yī)療大數(shù)據(jù)的挑戰(zhàn) 15
1.6 大數(shù)據(jù)在醫(yī)療中的實例 17
參考文獻 18
第2章 數(shù)據(jù)預處理 19
2.1 數(shù)據(jù)清洗 19
2.1.1 處理缺失值 20
2.1.2 處理異常值 21
2.1.3 處理噪聲 22
2.2 大規(guī)模計算系統(tǒng)搭建 24
2.2.1 Hadoop 24
2.2.2 MapReduce 26
第3章 統(tǒng)計學在醫(yī)療領域的應用 29
3.1 回歸模型 29
3.1.1 一元線性回歸 29
3.1.2 多元線性回歸 30
3.1.3 邏輯回歸 32
3.2 假設檢驗 33
3.2.1 基本步驟 33
3.2.2 檢驗方法 37
3.3 統(tǒng)計軟件概述 38
3.3.1 SPSS 39
3.3.2 SAS 44
3.3.3 R 45
第4章 經典傳染病模型 49
4.1 傳染病模型概述 49
4.1.1 傳染病倉室模型 50
4.1.2 微分方程描述下的傳染病倉室模型 53
4.1.3 傳染病倉室模型的簡單仿真 55
4.2 復雜網絡傳染病模型 58
4.2.1 網絡的基本概念及度量 58
4.2.2 復雜網絡上的傳染病模型 63
參考文獻 65
第5章 醫(yī)療數(shù)據(jù)挖掘 67
5.1 醫(yī)療數(shù)據(jù)挖掘的應用類型和過程 68
5.1.1 數(shù)據(jù)挖掘的應用類型 68
5.1.2 數(shù)據(jù)挖掘的過程 73
5.2 數(shù)據(jù)挖掘中的常用技術 75
5.2.1 聚類分析 75
5.2.2 K-means 層次聚類 76
5.2.3 主成分分析的數(shù)據(jù)降維 77
5.2.4 隨機鄰域嵌入原理及優(yōu)化 78
5.2.5 t分布隨機鄰域嵌入原理及優(yōu)化 79
5.2.6 t分布隨機鄰域嵌入示例 80
5.3 數(shù)據(jù)挖掘中需要注意的問題 81
參考文獻 85
第6章 醫(yī)療數(shù)據(jù)可視化 87
6.1 數(shù)據(jù)可視化概述 87
6.1.1 數(shù)據(jù)可視化的概念 87
6.1.2 數(shù)據(jù)可視化的目的 88
6.1.3 數(shù)據(jù)可視化的分類 89
6.2 醫(yī)療數(shù)據(jù)可視化技術 94
6.2.1 科學可視化應用 94
6.2.2 信息可視化應用 97
參考文獻 112
第7章 大數(shù)據(jù)和醫(yī)學影像 113
7.1 影像大數(shù)據(jù)中的5個V 113
7.2 影像數(shù)據(jù)的使用 114
7.3 深度學習過程所需的要素 120
7.4 在醫(yī)學影像上開展深度學習研究 122
7.4.1 深度學習的幾個步驟 122
7.4.2 如何衡量深度學習的成功 125
7.4.3 深度學習在醫(yī)學影像上的應用 126
參考文獻 134
第8章 醫(yī)療領域的自然語言處理 137
8.1 自然語言 137
8.2 自然語言處理概述 138
8.3 數(shù)據(jù)集的預處理 139
8.3.1 句法分析 139
8.3.2 語義分析 143
8.4 常見的自然語言處理技術 145
8.4.1 文本向量化 145
8.4.2 詞云 146
8.4.3 知識圖譜 147
8.4.4 自動文摘 147
8.4.5 情感分析 149
8.4.6 谷歌BERT技術 149
8.5 自然語言處理在醫(yī)療領域的應用 152
8.5.1 生物醫(yī)學文本挖掘 152
8.5.2 臨床決策支持系統(tǒng) 154
8.5.3 自動問答系統(tǒng) 154
參考文獻 156
第9章 醫(yī)療數(shù)據(jù)隱私保護 159
9.1 醫(yī)療數(shù)據(jù)隱私保護概述 159
9.1.1 醫(yī)療大數(shù)據(jù)的來源及潛在的隱私風險 160
9.1.2 全流程的醫(yī)療大數(shù)據(jù)隱私保護 161
9.2 匿名隱私保護 163
9.3 差分隱私及其應用 165
9.3.1 差分隱私的定義及相關概念 166
9.3.2 差分隱私的實現(xiàn)機制 169
9.4 其他隱私保護方法 171
9.4.1 機密計算 171
9.4.2 模型隱私 174
參考文獻 175
第10章 醫(yī)療經濟概況與前景 179
10.1 醫(yī)療經濟概況 179
10.2 醫(yī)療經濟的市場分析 181
10.3 醫(yī)療大數(shù)據(jù)現(xiàn)狀 190
10.4 醫(yī)療經濟的前景 190