Jupyter Notebook數(shù)據(jù)分析入門與實戰(zhàn)
定 價:99 元
- 作者:[日] 池內(nèi)孝啟,片柳薫子,巖尾遙,都利來 著,郭海嬌 譯
- 出版時間:2020/11/1
- ISBN:9787115445490
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:391
- 紙張:膠版紙
- 版次:1
- 開本:16開
Jupyter Notebook 被廣泛用作數(shù)據(jù)分析的工具或?qū)W習(xí)Python 的開發(fā)環(huán)境。本書共10章,重點介紹了如何使用Jupyter Notebook 進行數(shù)據(jù)可視化分析,包括Jupyter Notebook 的基礎(chǔ)操作、使用pandas 進行數(shù)據(jù)分析、使用Matplotlib 繪圖、完全掌握Matplotlib、使用Bokeh 繪圖、完全掌握Bokeh、自定義Jupyter Notebook、使用云端Jupyter Notebook、用Jupyter Notebook 編寫Ruby 和R 語言等內(nèi)容。
1.輕松入門
詳細介紹Jupyter Notebook 基礎(chǔ)操作,手把手教你學(xué)會使用Jupyter Notebook。
2.進階技能
使用pandas 進行數(shù)據(jù)分析,掌握Python數(shù)據(jù)分析核心技能。
3.精彩實戰(zhàn)
使用Matplotlib 和Bokeh 繪制多種圖形,輕松實現(xiàn)數(shù)據(jù)可視化。
池內(nèi)孝啟,曾擔(dān)任數(shù)家IT創(chuàng)業(yè)公司,以及株式會社ALBERT的執(zhí)行董事,在2015年創(chuàng)立株式會社eurie(現(xiàn)改名為株式會社slideship),是該公司的Founder&CEO。2017年開發(fā)了用于在線制作和演示幻燈片的網(wǎng)站slideship.com。
同時也是Python和數(shù)據(jù)分析者社區(qū)PyData.Tokyo的發(fā)起人之一。著有《精選python庫技巧大全》(2015年 技術(shù)評論社出版),《Python程序員手冊》(2015年 技術(shù)評論社出版)等。
片柳薫子,在農(nóng)研機構(gòu)農(nóng)業(yè)環(huán)境變動研究中心從事研究工作,也是PyLadies Tokyo的運營工作人員。從2014年開始使用Python進行數(shù)據(jù)分析。
巖尾遙,曾擔(dān)任多家公司的軟件設(shè)計師、架構(gòu)師等,現(xiàn)在就職于谷歌,負責(zé)Google Cloud Platform的開發(fā)。積極參與各種相關(guān)活動以使更多的人能夠使用Python云環(huán)境。
都利來,使用Python進行金融數(shù)據(jù)分析,Python×金融社區(qū) fin-py的主要創(chuàng)始人。
第 1章導(dǎo)入Jupyter Notebook
1-1 Project Jupyter 的起源 2
1-2 利用Anaconda 構(gòu)建環(huán)境 3
在Windows上安裝Anaconda 3
在macOS 上安裝Anaconda 10
1-3 conda 命令的使用方法 14
使用conda命令進行包管理 15
刪除和更新軟件包 15
Anaconda虛擬環(huán)境 16
激活虛擬環(huán)境 16
關(guān)閉conda環(huán)境 17
1-4 設(shè)置環(huán)境支持中文 18
繪制圖形時的亂碼問題 18
安裝中文字體 19
使用中文字體 20
通過配置文件設(shè)置中文字體 24
第 2章Jupyter Notebook 的基礎(chǔ)操作
2-1 在Jupyter Notebook 上運行代碼 28
新建Notebook 28
運行代碼 30
變量和函數(shù)的定義及用法 31
使用Python的標(biāo)準庫 32
使用代碼補全功能 34
2-2 Jupyter Notebook 的界面 34
File菜單 34
Edit 菜單 35
View 菜單 36
Insert 菜單 38
Cell菜單 38
Kernel菜單 39
Widgets菜單 40
Help菜單 40
工具欄 40
2-3 Jupyter Notebook 的快捷鍵 42
編輯模式與命令模式 42
顯示快捷鍵一覽 42
常用的快捷鍵 43
2-4 Jupyter Notebook 的保存和復(fù)用 44
Notebook文件(.ipynb文件)的內(nèi)部結(jié)構(gòu) 44
保存文件 45
Auto Save 功能 46
Checkpoint 46
讀取文件并復(fù)用 47
2-5 使用Markdown 和公式 47
什么是Markdown 47
使用Markdown 47
使用Markdown 為Notebook的內(nèi)容寫注釋 49
使用公式 50
上傳圖片 51
2-6 使用魔法命令 52
Shell腳本(命令行)的使用方法 52
魔法命令的基本用法 52
常用的魔法命令 53
%history 55
%ls 55
%autosave 56
%matplotlib 56
2-7 共享Jupyter Notebook 的方法 58
在GitHub上公開Notebook 58
nbviewer 59
第3章使用pandas進行數(shù)據(jù)分析
63
3-1 pandas 的特點 64
3-2 樣本數(shù)據(jù)的說明 64
anime.csv文件 65
anime_master.csv文件 66
anime_split_genre.csv文件 67
anime_genre_top10.csv文件 67
anime_genre_top10_pivoted.csv文件 68
anime_stock_price.csv文件 68
anime_stock_returns.csv文件 69
4816.csv文件、3791.csv文件、n225.csv文件 69
3-3 Series 70
新建Series 71
使用標(biāo)簽選擇數(shù)據(jù) 71
通過指定位置選擇數(shù)據(jù) 72
使用布爾值選擇數(shù)據(jù) 73
3-4 DataFrame 74
新建DataFrame 75
使用標(biāo)簽選擇數(shù)據(jù) 75
使用iloc選擇數(shù)據(jù) 76
通過指定列名選擇數(shù)據(jù) 77
使用布爾值選擇數(shù)據(jù) 77
3-5 讀取各種格式的數(shù)據(jù) 78
讀取CSV 文件 78
讀取Excel 文件 81
使用SQL 讀取 82
讀取HTML 文件 82
3-6 數(shù)據(jù)處理 83
用布爾值篩選數(shù)據(jù) 84
使用where方法篩選數(shù)據(jù) 84
修改數(shù)據(jù) 85
去掉缺失值 85
數(shù)據(jù)類型 87
排序 90
應(yīng)用函數(shù)到每個元素 90
3-7 統(tǒng)計計算 93
快速統(tǒng)計匯總 94
3-8 交叉統(tǒng)計 96
使用groupby()統(tǒng)計 96
使用pivot_table()統(tǒng)計 98
交叉統(tǒng)計 98
3-9 時間序列數(shù)據(jù)的處理 100
獲取股票價格 100
使用時間序列數(shù)據(jù)的函數(shù) 101
DatetimeIndex 103
篩選時間序列數(shù)據(jù) 105
采樣 107
3-10 數(shù)據(jù)可視化 108
在Notebook中顯示圖表 108
使用Series 繪圖 109
使用DataFrame繪圖 110
創(chuàng)建折線圖 111
創(chuàng)建散點圖 112
創(chuàng)建柱形圖 113
創(chuàng)建直方圖 115
創(chuàng)建箱形圖 115
創(chuàng)建餅圖 116
第4章使用Matplotlib繪圖
4-1 Matplotlib 是什么 118
4-2 繪圖基礎(chǔ) 119
繪制圖表準備工作 119
Figure和Subplot 120
使用add_subplot()添加Subplot 121
使用subplots()來配置Subplot 123
應(yīng)用樣式表 124
4-3 折線圖 125
創(chuàng)建折線圖 126
活用折線圖 127
繪制雙軸圖表 129
4-4 散點圖 131
創(chuàng)建散點圖 131
活用散點圖 132
創(chuàng)建分組散點圖 135
4-5 柱形圖 136
創(chuàng)建柱形圖 137
活用柱形圖 138
創(chuàng)建分組柱形圖 140
活用分組柱形圖 142
創(chuàng)建堆積柱形圖 144
活用堆積柱形圖 146
4-6 直方圖 147
創(chuàng)建直方圖 147
活用直方圖 149
創(chuàng)建各式各樣的直方圖 152
4-7 箱形圖 159
創(chuàng)建箱形圖 159
活用箱形圖 161
批量設(shè)定箱形圖樣式 163
設(shè)置每個箱子的樣式 166
4-8 餅圖 168
繪制餅圖 169
餅圖的樣式 170
活用餅圖 172
第5章完全掌握Matplotlib
5-1 繪制各種圖形 176
繪制圓弧 176
繪制箭頭 177
繪制圓形 178
繪制正多邊形 179
繪制橢圓 180
繪制扇形 180
繪制矩形 181
繪制多邊形 182
5-2 設(shè)置圖形對象和子圖樣式 183
設(shè)置圖形對象的樣式 183
設(shè)置子圖樣式 184
設(shè)置子圖之間的邊距 184
5-3 設(shè)置顏色與顏色映射 187
設(shè)置顏色和透明度 187
指定顏色 188
使用顏色映射 189
5-4 設(shè)置線條樣式 191
設(shè)置線條顏色和粗細 192
設(shè)置線條頭部的形狀 193
設(shè)置線條連接點的形狀 193
設(shè)置線條的類型 194
設(shè)置虛線以及虛線頭的形狀 196
設(shè)置虛線的連接點形狀 196
5-5 設(shè)置字體和文本框樣式 197
繪制文本 198
設(shè)置字體樣式 199
設(shè)置文本框樣式 200
設(shè)置文本框的水平對齊方式 201
設(shè)置文本框的垂直對齊方式 202
設(shè)置文本框內(nèi)文本的水平對齊方式 203
設(shè)置文本框內(nèi)文本的行間距 204
旋轉(zhuǎn)文本框 204
5-6 設(shè)置圖形的軸和刻度 207
設(shè)置軸的范圍 207
統(tǒng)一軸設(shè)置 208
設(shè)置對數(shù)軸 209
設(shè)置多個軸 210
設(shè)置軸標(biāo)簽 211
設(shè)置主刻度與主刻度線標(biāo)簽 212
設(shè)置刻度樣式 213
設(shè)置刻度線 215
5-7 圖例與標(biāo)題 216
設(shè)置圖例 216
設(shè)置圖例位置 217
設(shè)置子圖標(biāo)題 219
設(shè)置圖形標(biāo)題 220
設(shè)置圖例和標(biāo)題樣式 221
5-8 繪圖樣式表 222
導(dǎo)出樣式列表 222
應(yīng)用樣式 223
5-9 導(dǎo)出文件 223
導(dǎo)出文件 224
設(shè)置導(dǎo)出繪圖對象的樣式 225
導(dǎo)出時調(diào)整大小 226
5-10 show() 函數(shù) 228
show() 函數(shù) 228
確認plt.show() 的操作內(nèi)容 229
使用Matplotlib繪制圖形的兩種風(fēng)格 232
第6章使用Bokeh繪圖
6-1 Bokeh 是什么 236
6-2 Bokeh 的特點 237
與Matplotlib的不同之處 237
3 種級別的接口 237
6-3 繪圖基礎(chǔ) 240
導(dǎo)入必須要用到的模塊 240
把圖形輸出到Notebook上 241
創(chuàng)建Chart 實例 241
調(diào)整圖形屬性 241
輸出圖形 242
輸出圖形至HTML 文件 242
6-4 折線圖 243
使用類列表類型數(shù)據(jù) 243
使用字典類型數(shù)據(jù) 244
使用DataFrame類型數(shù)據(jù) 245
中級別接口 246
6-5 散點圖 248
顏色區(qū)分 249
中級別接口 250
6-6 柱形圖 251
使用類列表類型數(shù)據(jù) 252
使用字典類型數(shù)據(jù) 252
使用DataFrame類型數(shù)據(jù) 252
聚合 254
分組 254
創(chuàng)建堆積柱形圖 255
中級別接口 256
6-7 直方圖 258
使用類列表類型數(shù)據(jù) 258
使用DataFrame類型數(shù)據(jù) 258
顏色區(qū)分 260
創(chuàng)建相對頻率直方圖 261
中級別接口 261
6-8 箱形圖 262
6-9 餅圖 263
使用類列表類型數(shù)據(jù) 264
使用字典類型數(shù)據(jù) 264
使用DataFrame類型數(shù)據(jù) 265
分組 265
第7章完全掌握Bokeh
7-1 繪制各種圖形 268
繪制文本 268
繪制基本圖形 269
繪制可變形狀的圖形 269
繪制直線 275
帶標(biāo)簽的數(shù)據(jù)(ColumnDataSource) 276
7-2 設(shè)置各種對象屬性 277
指定參數(shù)值 277
設(shè)置對象屬性 278
7-3 設(shè)置顏色 278
可配置的屬性 278
設(shè)置顏色 279
通過設(shè)置alpha屬性調(diào)整對象的透明度 281
不同位置設(shè)置不同顏色 281
Bokeh.palettes模塊 281
7-4 設(shè)置各種線條樣式 283
可配置的屬性 283
設(shè)置線條粗細 284
設(shè)置線條顏色 284
設(shè)置線條連接點 285
設(shè)置線條頭部 286
設(shè)置線條類型 287
7-5 設(shè)置文本 288
可配置的屬性 288
設(shè)置字體 289
設(shè)置字體大小 289
設(shè)置字體樣式 290
設(shè)置文本顏色 290
設(shè)置文本的水平對齊方式 291
設(shè)置文本的垂直對齊方式 292
7-6 設(shè)置圖屬性 292
設(shè)置圖的大小 292
設(shè)置圖的背景顏色 293
設(shè)置圖的邊距 293
設(shè)置圖的外邊框 294
設(shè)置圖的標(biāo)題 295
7-7 設(shè)置圖形樣式 297
設(shè)置圖形樣式 297
在選中/ 釋放圖形時設(shè)置樣式 298
7-8 設(shè)置軸屬性 299
指定起始位置和結(jié)束位置并設(shè)置軸范圍 299
用指定元素來設(shè)置軸范圍 300
設(shè)置時間序列軸 301
設(shè)置對數(shù)軸 302
設(shè)置多個軸 302
7-9 設(shè)置軸樣式 304
設(shè)置軸樣式 304
設(shè)置軸的顯示范圍 305
刻度樣式 305
設(shè)置刻度標(biāo)簽樣式 305
設(shè)置刻度比例的長度 306
調(diào)整刻度線 306
7-10 設(shè)置刻度線樣式 309
設(shè)置主刻度線樣式 309
設(shè)置輔刻度線樣式 309
設(shè)置陰影 310
設(shè)置刻度線的范圍 310
7-11 設(shè)置圖例 311
設(shè)置圖例樣式 311
設(shè)置圖例的位置 312
設(shè)置圖例的布局 313
設(shè)置圖例內(nèi)部 314
7-12 設(shè)置多圖布局 315
垂直排列 315
橫向排列 315
在網(wǎng)格中排列① 316
在網(wǎng)格中排列② 316
自定義顯示位置 317
7-13 活用繪圖工具的交互式操作 317
設(shè)置工具欄的位置 317
選擇內(nèi)置工具 319
修改工具的激活狀態(tài) 321
設(shè)置Hover工具 322
7-14 繪制交互式實時圖形 324
動態(tài)修改圖表 324
動態(tài)修改圖形 325
繪制動畫 326
運用ipywidgets進行交互式可視化 327
第8章自定義Jupyter Notebook
8-1 設(shè)置啟動選項 330
啟動設(shè)定 330
使用配置文件 332
8-2 自定義樣式 334
使用CSS 334
第9章使用云端Jupyter Notebook
9-1 Cloud Datalab-Google Cloud Platform 338
Cloud Datalab 338
啟動Cloud Datalab 339
使用Cloud Datalab 340
連接到Cloud Datalab 343
如何使用Cloud Datalab 344
使用BigQuery進行數(shù)據(jù)分析 346
顯示圖表 348
9-2 Azure Notebooks-Microsoft Azure 349
Azure Notebooks的特點 349
支持的運行環(huán)境 350
基本用法 350
Library與Notebook 351
如何使用Notebook 354
安裝其他軟件包 354
第 10章用Jupyter Notebook 編寫Ruby和R
10-1 用Jupyter Notebook 編寫Ruby 358
什么是iruby 358
安裝iruby 358
使用Jupyter Notebook編寫Ruby 362
使用daru進行數(shù)據(jù)分析 363
使用Nyaplot繪圖 364
10-2 用Jupyter Notebook 編寫R 365
安裝R 365
安裝IRkernel 367
用Jupyter Notebook編寫R 367
使用R 進行數(shù)據(jù)分析 368
附錄
A-1 交互式ipywidgets 372
安裝ipywidgets 372
用interact() 函數(shù)實現(xiàn) 372
可使用的窗口控件 374
處理事件 374
窗口控件的布局 375
與可視化工具聯(lián)動 376
A-2 制作幻燈片 380
幻燈片制作流程 382
轉(zhuǎn)換為幻燈片用的文件 384
幻燈片放映文件 386
Slide Type 386
A-3 JupyterLab 387
安裝和啟動 387
選項卡功能 388
Code Console 389