本書(shū)采用案例和理論相結(jié)合的形式,以Anaconda和PyCharm為開(kāi)發(fā)工具,系統(tǒng)地重點(diǎn)闡述了利用Python進(jìn)行數(shù)據(jù)預(yù)處理、分析與可視化等相關(guān)知識(shí),講解了Python各種數(shù)據(jù)處理展示的函數(shù)方法的使用方法。全書(shū)共有6章,分別是數(shù)據(jù)分析概述、Python基礎(chǔ)、利用Pandas進(jìn)行數(shù)據(jù)預(yù)處理、利用Pandas進(jìn)行數(shù)據(jù)分析、利用Matplotlib進(jìn)行數(shù)據(jù)可視化、Python數(shù)據(jù)分析與綜合應(yīng)用。在教學(xué)設(shè)計(jì)中安排了知識(shí)圖譜、學(xué)習(xí)目標(biāo)、知識(shí)指南、任務(wù)實(shí)訓(xùn)、結(jié)果分析、鞏固訓(xùn)練、每章測(cè)試等模塊。本書(shū)既可以作為本科和高職院校各專(zhuān)業(yè)數(shù)據(jù)分析相關(guān)課程的教材,也可以作為企業(yè)電子商務(wù)、市場(chǎng)營(yíng)銷(xiāo)、數(shù)據(jù)分析人員的參考資料。
李良,男,講師,就職于蘇州工業(yè)職業(yè)技術(shù)性學(xué)院,2018年,國(guó)家精品在線開(kāi)放課程《計(jì)算機(jī)應(yīng)用基礎(chǔ)》,排名第四,主要針對(duì)大數(shù)據(jù)、人工智能等專(zhuān)業(yè)領(lǐng)域的教學(xué)。
第1章 數(shù)據(jù)分析概述 1
1.1 認(rèn)識(shí)數(shù)據(jù)分析 1
一、數(shù)據(jù)分析背景 1
二、數(shù)據(jù)分析流程 2
三、數(shù)據(jù)分析應(yīng)用 3
1.2 認(rèn)識(shí)Python 3
一、Python的發(fā)展趨勢(shì) 3
二、Python的特點(diǎn) 4
三、Python的常用庫(kù) 4
1.3 安裝環(huán)境 6
一、安裝Anaconda 6
二、安裝PyCharm 11
三、在PyCharm中導(dǎo)入Anaconda環(huán)境 14
四、查看PyCharm中的安裝庫(kù) 18
1.4 數(shù)據(jù)分析概述測(cè)試題 21
第2章 Python基礎(chǔ) 23
2.1 Python基本操作 23
一、變量 24
二、轉(zhuǎn)義符 24
三、輸入與輸出 25
四、算術(shù)運(yùn)算符 27
2.2 Python選擇結(jié)構(gòu) 29
一、關(guān)系運(yùn)算符 29
二、單分支選擇結(jié)構(gòu) 30
三、雙分支選擇結(jié)構(gòu) 31
四、多分支選擇結(jié)構(gòu) 31
2.3 Python循環(huán)語(yǔ)句 33
一、while循環(huán)語(yǔ)句 34
二、for循環(huán)語(yǔ)句一般形式 34
2.4 Python列表操作 39
一、創(chuàng)建列表 39
二、訪問(wèn)列表元素與切片列表 40
三、添加列表元素 41
四、修改列表元素 42
五、刪除列表元素 42
六、列表的常用方法 43
2.5 Python字符串操作 46
一、字符串的訪問(wèn) 46
二、字符串的操作 47
2.6 Python字典操作 52
一、創(chuàng)建字典 53
二、訪問(wèn)字典關(guān)鍵字 53
三、訪問(wèn)字典元素 54
四、更新字典元素 54
五、刪除字典元素 55
六、利用字典創(chuàng)建二維字典 56
2.7 Python函數(shù)操作 58
一、定義函數(shù) 59
二、調(diào)用函數(shù) 59
三、匿名函數(shù) 60
2.8 Python的NumPy庫(kù) 64
一、創(chuàng)建數(shù)組對(duì)象 64
二、查看數(shù)組屬性 66
三、數(shù)組的索引與切片 67
四、NumPy隨機(jī)數(shù) 68
五、NumPy的操作 70
2.9 Python基礎(chǔ)測(cè)試題 72
第3章 利用Pandas進(jìn)行數(shù)據(jù)預(yù)處理 74
3.1 數(shù)據(jù)的創(chuàng)建與操作 74
一、Series的創(chuàng)建與操作 75
二、DataFrame的創(chuàng)建與操作 80
3.2 數(shù)據(jù)的導(dǎo)入與保存 84
一、導(dǎo)入數(shù)據(jù)設(shè)置 84
二、導(dǎo)入外部文件 85
三、導(dǎo)入Sklearn自帶數(shù)據(jù) 86
四、保存數(shù)據(jù) 86
3.3 數(shù)據(jù)的新增與刪除 91
一、新增列數(shù)據(jù) 91
二、數(shù)據(jù)的刪除 93
3.4 數(shù)據(jù)的篩選與切片 96
一、直接選取列數(shù)據(jù) 96
二、利用loc函數(shù)選取行數(shù)據(jù) 97
三、選取DataFrame切片數(shù)據(jù) 99
3.5 數(shù)據(jù)的去空與去重 104
一、數(shù)據(jù)去空 104
二、數(shù)據(jù)去重 107
3.6 數(shù)據(jù)的填充與替換 111
一、空值填充 111
二、批量替換 113
3.7 數(shù)據(jù)的拼接和合并 117
一、數(shù)據(jù)的縱向拼接 117
二、數(shù)據(jù)的橫向合并 119
3.8 時(shí)間的轉(zhuǎn)換與提取 123
一、生成時(shí)間類(lèi)數(shù)據(jù) 124
二、轉(zhuǎn)化DataFrame時(shí)間數(shù)據(jù) 126
三、提取時(shí)間信息 126
3.9 利用Pandas進(jìn)行數(shù)據(jù)預(yù)處理測(cè)試題 129
第4章 利用Pandas進(jìn)行數(shù)據(jù)分析 132
4.1 數(shù)據(jù)的排序與排名 132
一、數(shù)據(jù)排序 133
二、數(shù)據(jù)排名 134
4.2 數(shù)據(jù)的統(tǒng)計(jì)與描述 137
一、數(shù)值型字段的統(tǒng)計(jì)與描述 137
二、分類(lèi)型字段的統(tǒng)計(jì)與描述 140
4.3 數(shù)據(jù)的分組與分段 144
一、數(shù)據(jù)分組統(tǒng)計(jì)分析 144
二、數(shù)據(jù)分段統(tǒng)計(jì)分析 147
4.4 數(shù)據(jù)的交叉與透視 149
一、頻數(shù)交叉表 149
二、數(shù)據(jù)透視表 151
4.5 數(shù)據(jù)的正態(tài)性分析 156
一、數(shù)據(jù)的正態(tài)分布 156
二、正態(tài)分布的描述 157
三、正態(tài)分布的驗(yàn)證 158
4.6 數(shù)據(jù)的相關(guān)性分析 164
一、相關(guān)關(guān)系的概念 164
二、相關(guān)分析 164
4.7 利用Pandas進(jìn)行數(shù)據(jù)分析測(cè)試題 169
第5章 利用Matplotlib進(jìn)行數(shù)據(jù)可視化 171
5.1 繪圖設(shè)置與簡(jiǎn)單繪圖 171
一、繪圖設(shè)置 172
二、簡(jiǎn)單繪圖 177
5.2 繪制柱形圖 180
一、柱形圖 180
二、添加數(shù)據(jù)標(biāo)簽 184
5.3 繪制條形圖 187
一、直接繪制條形圖 187
二、利用數(shù)據(jù)分組繪制條形圖 190
5.4 繪制折線圖 194
一、折線圖 194
二、添加折線圖輔助線 195
5.5 繪制散點(diǎn)氣泡圖 200
一、散點(diǎn)圖 200
二、繪制氣泡圖 202
5.6 繪制餅圖與圓環(huán)圖 208
一、繪制餅圖及其文本設(shè)置 208
二、繪制圓環(huán)圖 210
5.7 利用Matplotlib進(jìn)行數(shù)據(jù)可視化測(cè)試題 214
第6章 Python數(shù)據(jù)分析與綜合應(yīng)用 216
6.1 成績(jī)數(shù)據(jù)預(yù)處理與分析 216
一、數(shù)據(jù)源 216
二、要求 217
三、步驟 217
四、結(jié)論 221
6.2 房產(chǎn)數(shù)據(jù)預(yù)處理與分析 221
一、數(shù)據(jù)源 221
二、目標(biāo) 222
三、步驟 222
四、結(jié)論 227
6.3 餐飲數(shù)據(jù)分析與可視化 227
一、數(shù)據(jù)源 227
二、目標(biāo) 228
三、步驟 228
四、結(jié)論 235
6.4 超市數(shù)據(jù)分析與可視化 236
一、數(shù)據(jù)源 236
二、目標(biāo) 237
三、步驟 238
四、結(jié)論 245
6.5 工業(yè)數(shù)據(jù)分析與可視化 246
一、數(shù)據(jù)源分析 246
二、目標(biāo) 248
三、分析步驟 248
四、結(jié)論 255
附錄A 函數(shù)方法表 257
附錄B 顏色表 261
參考文獻(xiàn) 262