本書采用案例和理論相結合的形式,以Anaconda和PyCharm為開發(fā)工具,系統(tǒng)地重點闡述了利用Python進行數(shù)據預處理、分析與可視化等相關知識,講解了Python各種數(shù)據處理展示的函數(shù)方法的使用方法。全書共有6章,分別是數(shù)據分析概述、Python基礎、利用Pandas進行數(shù)據預處理、利用Pandas進行數(shù)據分析、利用Matplotlib進行數(shù)據可視化、Python數(shù)據分析與綜合應用。書中安排了思維導圖、學習目標、知識指南、任務實訓、結果分析、鞏固訓練、每章測試等模塊。本書既可以作為本科和高職院校各專業(yè)數(shù)據分析相關課程的教材,也可以作為企業(yè)電子商務、市場營銷、數(shù)據分析人員的參考資料。
李良,男,講師,就職于蘇州工業(yè)職業(yè)技術性學院,2018年,國家精品在線開放課程《計算機應用基礎》,排名第四
第1章 數(shù)據分析概述 1
1.1 認識數(shù)據分析 1
一、數(shù)據分析背景 1
二、數(shù)據分析流程 2
三、數(shù)據分析應用 3
1.2 認識Python 3
一、Python的發(fā)展趨勢 3
二、Python的特點 4
三、Python的常用庫 4
1.3 安裝環(huán)境 6
一、安裝Anaconda 6
二、安裝PyCharm 11
三、在PyCharm中導入Anaconda環(huán)境 14
四、查看PyCharm中的安裝庫 18
1.4 數(shù)據分析概述測試題 21
第2章 Python基礎 23
2.1 Python基本操作 23
一、變量 24
二、轉義符 24
三、輸入與輸出 25
四、算術運算符 27
2.2 Python選擇結構 29
一、關系運算符 29
二、單分支選擇結構 30
三、雙分支選擇結構 31
四、多分支選擇結構 31
2.3 Python循環(huán)語句 33
一、while循環(huán)語句 34
二、for循環(huán)語句一般形式 34
2.4 Python列表操作 39
一、創(chuàng)建列表 39
二、訪問列表元素與切片列表 40
三、添加列表元素 41
四、修改列表元素 42
五、刪除列表元素 42
六、列表的常用方法 43
2.5 Python字符串操作 46
一、字符串的訪問 46
二、字符串的操作 47
2.6 Python字典操作 52
一、創(chuàng)建字典 53
二、訪問字典關鍵字 53
三、訪問字典元素 54
四、更新字典元素 54
五、刪除字典元素 55
六、利用字典創(chuàng)建二維數(shù)據 56
2.7 Python函數(shù)操作 58
一、定義函數(shù) 59
二、調用函數(shù) 59
三、匿名函數(shù) 60
2.8 Python的NumPy庫 64
一、創(chuàng)建數(shù)組對象 64
二、查看數(shù)組屬性 66
三、數(shù)組的索引與切片 67
四、NumPy隨機數(shù) 68
五、NumPy的操作 70
2.9 Python基礎測試題 72
第3章 利用Pandas進行數(shù)據預處理 74
3.1 數(shù)據的創(chuàng)建與操作 74
一、Series的創(chuàng)建與操作 75
二、DataFrame的創(chuàng)建與操作 80
3.2 數(shù)據的導入與保存 84
一、導入數(shù)據設置 84
二、導入外部文件 85
三、導入Sklearn自帶數(shù)據 86
四、保存數(shù)據 86
3.3 數(shù)據的新增與刪除 91
一、新增列數(shù)據 91
二、數(shù)據的刪除 93
3.4 數(shù)據的篩選與切片 96
一、直接選取列數(shù)據 96
二、利用loc函數(shù)選取行數(shù)據 97
三、選取DataFrame切片數(shù)據 99
3.5 數(shù)據的去空與去重 104
一、數(shù)據去空 104
二、數(shù)據去重 107
3.6 數(shù)據的填充與替換 111
一、空值填充 111
二、批量替換 113
3.7 數(shù)據的拼接和合并 117
一、數(shù)據的縱向拼接 117
二、數(shù)據的橫向合并 119
3.8 時間的轉換與提取 123
一、生成時間類數(shù)據 124
二、轉化DataFrame時間數(shù)據 126
三、提取時間信息 126
3.9 利用Pandas進行數(shù)據預處理測試題 129
第4章 利用Pandas進行數(shù)據分析 132
4.1 數(shù)據的排序與排名 132
一、數(shù)據排序 133
二、數(shù)據排名 134
4.2 數(shù)據的統(tǒng)計與描述 137
一、數(shù)值型字段的統(tǒng)計與描述 137
二、分類型字段的統(tǒng)計與描述 140
4.3 數(shù)據的分組與分段 144
一、數(shù)據分組統(tǒng)計分析 144
二、數(shù)據分段統(tǒng)計分析 147
4.4 數(shù)據的交叉與透視 149
一、頻數(shù)交叉表 149
二、數(shù)據透視表 151
4.5 數(shù)據的正態(tài)性分析 156
一、數(shù)據的正態(tài)分布 156
二、正態(tài)分布的描述 157
三、正態(tài)分布的驗證 158
4.6 數(shù)據的相關性分析 164
一、相關關系的概念 164
二、相關分析 164
4.7 利用Pandas進行數(shù)據分析測試題 169
第5章 利用Matplotlib進行數(shù)據可視化 171
5.1 繪圖設置與簡單繪圖 171
一、繪圖設置 172
二、簡單繪圖 177
5.2 繪制柱形圖 180
一、柱形圖 180
二、添加數(shù)據標簽 184
5.3 繪制條形圖 187
一、直接繪制條形圖 187
二、利用數(shù)據分組繪制條形圖 190
5.4 繪制折線圖 194
一、折線圖 194
二、添加折線圖輔助線 195
5.5 繪制散點氣泡圖 200
一、散點圖 200
二、繪制氣泡圖 202
5.6 繪制餅圖與圓環(huán)圖 208
一、繪制餅圖及其文本設置 208
二、繪制圓環(huán)圖 210
5.7 利用Matplotlib進行數(shù)據可視化測試題 214
第6章 Python數(shù)據分析與綜合應用 216
6.1 成績數(shù)據預處理與分析 216
一、數(shù)據源 216
二、要求 217
三、步驟 217
四、結論 221
6.2 房產數(shù)據預處理與分析 221
一、數(shù)據源 221
二、目標 222
三、步驟 222
四、結論 227
6.3 餐飲數(shù)據分析與可視化 227
一、數(shù)據源 227
二、目標 228
三、步驟 228
四、結論 235
6.4 超市數(shù)據分析與可視化 236
一、數(shù)據源 236
二、目標 237
三、步驟 238
四、結論 245
6.5 工業(yè)數(shù)據分析與可視化 246
一、數(shù)據源分析 246
二、目標 248
三、分析步驟 248
四、結論 255
附錄A 函數(shù)方法表 257
附錄B 顏色表 261
參考文獻 262