Python數(shù)據(jù)分析與可視化(微課版)
定 價(jià):42.8 元
- 作者:謝志明
- 出版時(shí)間:2024/1/1
- ISBN:9787121468872
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:204
- 紙張:
- 版次:01
- 開本:16開
本書從Python數(shù)據(jù)分析的基礎(chǔ)知識入手,通過大量案例,系統(tǒng)介紹數(shù)據(jù)分析的流程與數(shù)據(jù)可視化的方法,提高讀者應(yīng)用數(shù)據(jù)來解決實(shí)際問題的能力。全書共8章,第1章主要介紹數(shù)據(jù)分析與可視化基本概念等相關(guān)知識;第2章主要介紹使用Python語言編程常用的知識點(diǎn);第3章主要介紹Python數(shù)據(jù)分析常用的兩個(gè)庫NumPy和Pandas;第4章主要介紹如何使用Pandas導(dǎo)入CSV、XLSX和JSON等類型數(shù)據(jù);第5章和第6章主要介紹多個(gè)數(shù)據(jù)分析案例實(shí)戰(zhàn)項(xiàng)目;第7章以《紅樓夢》為例介紹整本書的文本處理與分析方法;第8章主要介紹電商訂單數(shù)據(jù)處理與客戶價(jià)值分析。本書秉承“實(shí)踐為主、理論夠用、注重實(shí)用”原則,將實(shí)驗(yàn)環(huán)節(jié)及實(shí)操內(nèi)容融入各章節(jié)知識點(diǎn)與課程教學(xué)中。本書既可以作為高職高專院校大數(shù)據(jù)技術(shù)、人工智能技術(shù)應(yīng)用等計(jì)算機(jī)相關(guān)專業(yè)學(xué)生的教材,又可以作為Python數(shù)據(jù)分析初學(xué)者、愛好者及從事相關(guān)技術(shù)人員的參考用書。
謝志明,軟件工程碩士,汕尾職業(yè)技術(shù)學(xué)院教師,人工智能教研室主任,計(jì)算機(jī)應(yīng)用副教授,汕尾市優(yōu)秀科技工作者,汕尾市高層次人才。從事計(jì)算機(jī)教學(xué)工作23年,先后承擔(dān)了云計(jì)算專業(yè)、大數(shù)據(jù)專業(yè)、人工智能專業(yè)等多門專業(yè)核心課程的教學(xué)。指導(dǎo)學(xué)生參加省級及以上職業(yè)技能類競賽獲獎(jiǎng)30余次,其中,獲國賽二等獎(jiǎng)3次。作為項(xiàng)目負(fù)責(zé)人獲校級教學(xué)成果獎(jiǎng)二等獎(jiǎng)1次。主持及參與省級、市廳級、校級課題20余項(xiàng),公開發(fā)表論文20余篇(其中,北大核心2篇,EI收錄3篇),申請專利6項(xiàng)及軟著2項(xiàng),作為主編或副主編編寫云計(jì)算和大數(shù)據(jù)系列規(guī)劃教材6本,參編4本。
第1章 數(shù)據(jù)分析與可視化概述 1
學(xué)習(xí)目標(biāo) 1
1.1 數(shù)據(jù)分析 1
1.2 數(shù)據(jù)可視化 2
1.3 數(shù)據(jù)分析的流程 3
1.4 數(shù)據(jù)分析與可視化常用工具 5
1.5 Python數(shù)據(jù)分析與可視化常用類庫 6
1.6 為何選用Python進(jìn)行數(shù)據(jù)分析與可視化 7
1.7 安裝和使用面向科學(xué)計(jì)算的Anaconda 8
1.8 掌握J(rèn)upyter Notebook的基本功能 10
1.9 掌握J(rèn)upyter Notebook的高級功能 14
本章小結(jié) 18
本章習(xí)題 18
第2章 Python語言編程基礎(chǔ) 21
學(xué)習(xí)目標(biāo) 21
2.1 Python基本語法 21
2.2 Python基本數(shù)據(jù)類型 23
2.3 Python組合數(shù)據(jù)類型 26
2.3.1 列表 26
2.3.2 元組 28
2.3.3 字典 29
2.3.4 集合 30
2.4 Python推導(dǎo)式 31
2.4.1 列表推導(dǎo)式 31
2.4.2 元組推導(dǎo)式 32
2.4.3 字典推導(dǎo)式 33
2.4.4 集合推導(dǎo)式 33
2.5 函數(shù) 34
2.5.1 函數(shù)的定義 34
2.5.2 匿名函數(shù) 35
本章小結(jié) 35
本章習(xí)題 36
第3章 NumPy和Pandas的基礎(chǔ)知識 37
學(xué)習(xí)目標(biāo) 37
3.1 NumPy數(shù)值計(jì)算基礎(chǔ) 38
3.1.1 NumPy多維數(shù)組 38
3.1.2 NumPy數(shù)組切片和運(yùn)算 40
3.2 Pandas統(tǒng)計(jì)分析基礎(chǔ) 42
3.2.1 Pandas的數(shù)據(jù)結(jié)構(gòu) 42
3.2.2 Series的語法格式及其基本操作 43
3.2.3 DataFrame的語法格式及其基本操作 47
3.2.4 DataFrame的合并、拼接和組合 52
3.3 分組與聚合 55
3.3.1 數(shù)據(jù)分組 55
3.3.2 數(shù)據(jù)聚合 58
本章小結(jié) 61
本章習(xí)題 61
第4章 使用Pandas導(dǎo)入數(shù)據(jù) 65
學(xué)習(xí)目標(biāo) 65
4.1 讀/寫文本文件 65
4.1.1 讀/寫TXT文本文件 65
4.1.2 讀/寫CSV文件 66
4.2 讀/寫Excel文件 70
4.3 讀/寫HTML文件中的表格數(shù)據(jù) 77
4.4 讀/寫JSON格式文件 79
4.5 讀取MySQL數(shù)據(jù)庫文件 82
4.5.1 將數(shù)據(jù)導(dǎo)入MySQL數(shù)據(jù)庫 83
4.5.2 訪問MySQL數(shù)據(jù)庫 88
本章小結(jié) 91
本章習(xí)題 91
第5章 數(shù)據(jù)清理案例實(shí)戰(zhàn) 93
學(xué)習(xí)目標(biāo) 93
5.1 數(shù)據(jù)清理概述 93
5.2 案例實(shí)戰(zhàn)之成都錦江區(qū)二手房數(shù)據(jù)清理 94
5.3 案例實(shí)戰(zhàn)之?dāng)?shù)據(jù)分析崗位需求分析 100
5.4 案例實(shí)戰(zhàn)之年度銷售數(shù)據(jù)分析 109
本章小結(jié) 117
本章習(xí)題 117
第6章 HTML表格數(shù)據(jù)及JSON數(shù)據(jù)處理與分析案例實(shí)戰(zhàn) 120
學(xué)習(xí)目標(biāo) 120
6.1 案例實(shí)戰(zhàn)之2022年軟科中國大學(xué)排名數(shù)據(jù)處理與分析 120
6.2 案例實(shí)戰(zhàn)之氣象數(shù)據(jù)處理與分析 127
6.3 案例實(shí)戰(zhàn)之某疾病感染人群數(shù)據(jù)處理與分析 132
本章小結(jié) 138
本章習(xí)題 139
第7章 整本書文本處理與分析——以《紅樓夢》為例 141
學(xué)習(xí)目標(biāo) 141
7.1 繪制《紅樓夢》整本書的詞云 142
7.2 《紅樓夢》各章節(jié)詞云圖及柱形圖的展示 147
7.3 文本聚類分析 156
本章小結(jié) 167
本章習(xí)題 168
第8章 電商訂單數(shù)據(jù)處理與客戶價(jià)值分析 171
學(xué)習(xí)目標(biāo) 171
8.1 電商訂單數(shù)據(jù)處理與分析 172
8.2 電商訂單客戶價(jià)值分析 184
本章小結(jié) 192
本章習(xí)題 192
參考文獻(xiàn) 196