Jupyter數(shù)據(jù)科學(xué)實(shí)戰(zhàn)
定 價(jià):79 元
- 作者:[印]普拉泰克·古普塔(Prateek Gupta)
- 出版時(shí)間:2020/11/1
- ISBN:9787115544391
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.561
- 頁碼:254
- 紙張:
- 版次:01
- 開本:16K
本書旨在成為讀者進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域的指南。全書共20章,涵蓋了數(shù)據(jù)科學(xué)及其應(yīng)用的各個(gè)方面,引入經(jīng)典數(shù)據(jù)集將理論與實(shí)踐相結(jié)合,采用Jupyter等工具,以Python語言由淺入深地介紹了數(shù)據(jù)科學(xué)及相關(guān)學(xué)科的基本概念、數(shù)據(jù)預(yù)處理、機(jī)器學(xué)習(xí)及時(shí)間序列等內(nèi)容,并提供了不同的案例研究,以達(dá)到學(xué)以致用的效果。通過閱讀本書,讀者將獲得成為一名數(shù)據(jù)科學(xué)家所需的基本知識(shí)和技能。
本書適合有Python或其他編程語言基礎(chǔ),并對(duì)數(shù)據(jù)科學(xué)感興趣的人員閱讀。
1.本書是目前市面上僅有的以Jupyter為主題的圖書。
2.本書涵蓋大量的實(shí)際案例,幫助讀者學(xué)以致用。
3.通過簡(jiǎn)單易懂的Python示例,掌握數(shù)據(jù)科學(xué)技能。
學(xué)習(xí)Python編程技能以展開獨(dú)立的數(shù)據(jù)科學(xué)項(xiàng)目。
通過Python語言學(xué)習(xí)線性代數(shù)和統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí)。
建立預(yù)測(cè)模型,調(diào)整其參數(shù)并分析性能。
對(duì)無標(biāo)簽的數(shù)據(jù)集進(jìn)行聚類、轉(zhuǎn)換、可視化和提取。
學(xué)習(xí)如何使用matplotlib和seaborn實(shí)現(xiàn)數(shù)據(jù)可視化。
為實(shí)際業(yè)務(wù)場(chǎng)景實(shí)現(xiàn)和保存機(jī)器學(xué)習(xí)模型。
現(xiàn)代商業(yè)中充斥著數(shù)據(jù),因而由數(shù)據(jù)驅(qū)動(dòng)的決策任務(wù)變得越來越復(fù)雜,執(zhí)行此類任務(wù)就需要相關(guān)的技術(shù)知識(shí)和分析技能。本書旨在幫助您掌握Python知識(shí),同時(shí)熟練使用Jupyter Notebook等工具,以勝任數(shù)據(jù)科學(xué)家的角色。
本書簡(jiǎn)要介紹了數(shù)據(jù)科學(xué)的基礎(chǔ)知識(shí)和您在學(xué)習(xí)中可能遇到的問題,并概述了書中涵蓋的關(guān)鍵主題。您將學(xué)會(huì)如何安裝Anaconda和設(shè)置Jupyter Notebook,如何使用導(dǎo)入、清理、可視化和處理數(shù)據(jù)所需的基本數(shù)據(jù)結(jié)構(gòu)、函數(shù)、庫和包,并且深入研究監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和其他機(jī)器學(xué)習(xí)技術(shù)。
本書的最后通過一些案例將書中介紹的知識(shí)用于實(shí)踐,解決實(shí)際的業(yè)務(wù)問題,如預(yù)測(cè)借款人償還貸款的能力、對(duì)垃圾短信進(jìn)行分類、構(gòu)建電影推薦引擎和預(yù)測(cè)房?jī)r(jià)。
普拉泰克·古普塔(Prateek Gupta)是一位有著超過6年工作經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)專業(yè)人士,曾在HCL、Zensar和Sapient等多家跨國(guó)IT巨頭就職,其專業(yè)領(lǐng)域主要是尋找模式、運(yùn)用先進(jìn)統(tǒng)計(jì)方法和算法揭示隱藏的規(guī)律,力爭(zhēng)最大限度地提高企業(yè)收入和盈利能力,并確保高效的運(yùn)營(yíng)管理。
他是一位具有主觀能動(dòng)性并且在電子商務(wù)領(lǐng)域頗有建樹的忠實(shí)數(shù)據(jù)愛好者,還憑借自己在商品自動(dòng)分類、情感分析、客戶細(xì)分和推薦引擎方面的機(jī)器學(xué)習(xí)專業(yè)知識(shí)幫助了NTUC Singapore和Times Group India等多個(gè)客戶。他秉持著這一理念:“當(dāng)天才放棄努力時(shí),勤奮將超越天賦”。
他感興趣的是有關(guān)機(jī)器學(xué)習(xí)和自然語言處理在各個(gè)行業(yè)的應(yīng)用的前沿研究領(lǐng)域。閑暇時(shí),他喜歡通過自己的博客分享知識(shí),并激勵(lì)年輕人進(jìn)入令人興奮的數(shù)據(jù)科學(xué)世界。
第 1章 數(shù)據(jù)科學(xué)基本概念 1
1.1 數(shù)據(jù)的概念 2
1.1.1 結(jié)構(gòu)化數(shù)據(jù) 2
1.1.2 非結(jié)構(gòu)化數(shù)據(jù) 2
1.1.3 半結(jié)構(gòu)化數(shù)據(jù) 3
1.2 數(shù)據(jù)科學(xué)的定義 3
1.3 數(shù)據(jù)科學(xué)家的工作 4
1.4 數(shù)據(jù)科學(xué)應(yīng)用實(shí)例 5
1.5 為何Python適合數(shù)據(jù)科學(xué) 6
1.6 小結(jié) 7
第 2章 軟件安裝與配置 8
2.1 系統(tǒng)要求 9
2.2 下載Anaconda 9
2.3 在Windows系統(tǒng)上安裝Anaconda 10
2.4 在Linux系統(tǒng)上安裝Anaconda 11
2.5 如何在Anaconda中安裝新的Python庫 13
2.6 打開筆記本—Jupyter 14
2.7 了解筆記本 15
2.8 小結(jié) 19
第3章 列表與字典 20
3.1 什么是列表 21
3.2 如何創(chuàng)建列表 21
3.3 列表的不同操作 22
3.4 列表與數(shù)組的差異 25
3.5 什么是字典 26
3.6 如何創(chuàng)建字典 26
3.7 字典的相關(guān)操作 26
3.8 小結(jié) 28
第4章 函數(shù)與包 29
4.1 Python的Help()函數(shù) 30
4.2 如何導(dǎo)入Python包 30
4.3 如何創(chuàng)建并調(diào)用函數(shù) 31
4.4 在函數(shù)中傳遞參數(shù) 31
4.5 函數(shù)的默認(rèn)參數(shù) 32
4.6 如何在函數(shù)中使用未知參數(shù) 32
4.7 函數(shù)的全局與本地變量 33
4.8 Lambda函數(shù) 35
4.9 了解Python中的main方法 35
4.10 小結(jié) 38
第5章 NumPy基本概念 39
5.1 導(dǎo)入NumPy包 39
5.2 為何NumPy數(shù)組優(yōu)于列表 40
5.3 NumPy數(shù)組屬性 41
5.4 創(chuàng)建NumPy數(shù)組 41
5.5 訪問NumPy數(shù)組中的元素 43
5.6 NumPy數(shù)組的切片 44
5.7 數(shù)組連接 46
5.8 小結(jié) 47
第6章 Pandas和數(shù)據(jù)幀 48
6.1 導(dǎo)入Pandas 48
6.2 Pandas數(shù)據(jù)結(jié)構(gòu) 49
6.3 .loc[]和.iloc[] 54
6.4 一些有用的數(shù)據(jù)幀函數(shù) 55
6.5 處理數(shù)據(jù)幀中的缺失值 57
6.6 小結(jié) 60
第7章 與數(shù)據(jù)庫交互 61
7.1 SQLAlchemy 62
7.2 安裝SQLAlchemy包 62
7.3 如何使用SQLAlchemy 63
7.4 SQLAlchemy引擎配置 64
7.5 在數(shù)據(jù)庫中新建表 65
7.6 在表中插入數(shù)據(jù) 66
7.7 更新記錄 67
7.8 如何合并表格 68
7.8.1 內(nèi)連接 68
7.8.2 左連接 69
7.8.3 右連接 70
7.9 小結(jié) 70
第8章 數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)思維 71
8.1 數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué) 72
8.2 統(tǒng)計(jì)數(shù)據(jù)/變量的類型 72
8.3 平均數(shù)、中位數(shù)和眾數(shù) 73
8.4 概率的基本概念 74
8.5 統(tǒng)計(jì)分布 75
8.6 Pearson相關(guān)系數(shù) 77
8.7 概率密度函數(shù) 78
8.8 真實(shí)案例 79
8.9 統(tǒng)計(jì)推斷與假設(shè)檢驗(yàn) 79
8.10 小結(jié) 86
第9章 如何在Python中導(dǎo)入數(shù)據(jù) 87
9.1 導(dǎo)入TXT數(shù)據(jù) 88
9.2 導(dǎo)入CSV數(shù)據(jù) 89
9.3 導(dǎo)入Excel數(shù)據(jù) 90
9.4 導(dǎo)入JSON數(shù)據(jù) 90
9.5 導(dǎo)入腌制數(shù)據(jù) 91
9.6 導(dǎo)入壓縮數(shù)據(jù) 91
9.7 小結(jié) 92
第 10章 清洗導(dǎo)入的數(shù)據(jù) 93
10.1 了解數(shù)據(jù) 94
10.2 分析缺失值 95
10.3 丟棄缺失值 97
10.4 自動(dòng)填充缺失值 98
10.5 如何縮放和歸一化數(shù)據(jù) 99
10.6 如何解析日期 102
10.7 如何應(yīng)用字符編碼 104
10.8 清洗不一致的數(shù)據(jù) 105
10.9 小結(jié) 106
第 11章 數(shù)據(jù)可視化 107
11.1 條形圖 108
11.2 折線圖 109
11.3 直方圖 110
11.4 散點(diǎn)圖 111
11.5 堆積圖 111
11.6 箱線圖 113
11.7 小結(jié) 115
第 12章 數(shù)據(jù)預(yù)處理 116
12.1 關(guān)于案例研究 116
12.2 導(dǎo)入數(shù)據(jù)集 117
12.3 探索性數(shù)據(jù)分析 118
12.4 數(shù)據(jù)清洗與預(yù)處理 122
12.5 特征工程 124
12.6 小結(jié) 129
第 13章 監(jiān)督式機(jī)器學(xué)習(xí) 130
13.1 常見的機(jī)器學(xué)習(xí)術(shù)語 131
13.2 機(jī)器學(xué)習(xí)導(dǎo)論 132
13.3 常用機(jī)器學(xué)習(xí)算法列述 133
13.4 監(jiān)督式機(jī)器學(xué)習(xí)基礎(chǔ) 134
13.5 解決分類機(jī)器學(xué)習(xí)問題 136
13.6 為何要進(jìn)行訓(xùn)練/測(cè)試拆分和交叉驗(yàn)證 140
13.7 解決回歸機(jī)器學(xué)習(xí)問題 144
13.8 如何調(diào)整機(jī)器學(xué)習(xí)模型 152
13.9 如何處理sklearn中的分類變量 154
13.10 處理缺失數(shù)據(jù)的高級(jí)技術(shù) 155
13.11 小結(jié) 158
第 14章 無監(jiān)督式機(jī)器學(xué)習(xí) 159
14.1 為何選擇無監(jiān)督式機(jī)器學(xué)習(xí) 160
14.2 無監(jiān)督式機(jī)器學(xué)習(xí)技術(shù) 160
14.2.1 聚類 161
14.2.2 主成分分析 169
14.3 案例研究 172
14.4 驗(yàn)證無監(jiān)督式機(jī)器學(xué)習(xí) 178
14.5 小結(jié) 179
第 15章 處理時(shí)間序列數(shù)據(jù) 180
15.1 為何時(shí)間序列重要 181
15.2 如何處理日期和時(shí)間 181
15.3 轉(zhuǎn)換時(shí)間序列數(shù)據(jù) 184
15.4 操作時(shí)間序列數(shù)據(jù) 187
15.5 比較時(shí)間序列的增長(zhǎng)率 189
15.6 如何改變時(shí)間序列頻率 192
15.7 小結(jié) 198
第 16章 時(shí)間序列法 199
16.1 時(shí)間序列預(yù)測(cè)的定義 200
16.2 預(yù)測(cè)的基本步驟 200
16.3 時(shí)間序列預(yù)測(cè)的技術(shù) 201
16.3.1 自回歸 201
16.3.2 移動(dòng)平均 202
16.3.3 自回歸移動(dòng)平均 203
16.3.4 自回歸積分移動(dòng)平均 203
16.3.5 季節(jié)性自回歸積分移動(dòng)平均 204
16.3.6 季節(jié)性自回歸積分移動(dòng)平均與外生回歸因子 205
16.3.7 向量自回歸移動(dòng)平均 205
16.3.8 Holt-Winters指數(shù)平滑 206
16.4 預(yù)測(cè)網(wǎng)頁的未來流量 207
16.5 小結(jié) 214
第 17章 案例研究1 215
第 18章 案例研究2 230
第 19章 案例研究3 239
第 20章 案例研究4 247