定 價(jià):42.8 元
叢書名:普通高等教育人工智能與大數(shù)據(jù)系列教材
- 作者:孫霓剛
- 出版時(shí)間:2022/5/1
- ISBN:9787111703792
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書共分為10章,循序漸進(jìn)地講述了Python數(shù)據(jù)分析的基本概念、NumPy、Pandas、matplotlib以及Python數(shù)據(jù)分析的綜合案例,包括以下主要內(nèi)容:Python數(shù)據(jù)分析的基本概念與環(huán)境安裝配置,以及開發(fā)工具的使用;NumPy模塊的基本概念、結(jié)構(gòu)及語法;介紹數(shù)據(jù)分析的核心模塊Pandas,以及如何使用Pandas中兩大核心對(duì)象Series和DataFrame;如何從數(shù)據(jù)源(文件、數(shù)據(jù)庫)中讀取數(shù)據(jù)并轉(zhuǎn)換為Pandas模塊中的DataFrame對(duì)象,進(jìn)而進(jìn)行數(shù)據(jù)分析;Pandas中的缺失對(duì)象、索引對(duì)象以及常用的數(shù)據(jù)清洗方式;Pandas中的多層索引對(duì)象,以及索引對(duì)象和Pandas中Series與DataFrame的關(guān)系;數(shù)據(jù)合并的概念,以及Pandas中數(shù)據(jù)合并的方法;數(shù)據(jù)分組的概念,以及Pandas中數(shù)據(jù)分組的方法;如何利用matplotlib進(jìn)行數(shù)據(jù)可視化;綜合利用本書知識(shí)為讀者展示對(duì)招聘數(shù)據(jù)進(jìn)行分析的實(shí)戰(zhàn)案例。
本書可作為高校計(jì)算機(jī)及相關(guān)專業(yè)基礎(chǔ)課程教材,也可作為數(shù)據(jù)分析培訓(xùn)教材和提高數(shù)據(jù)分析操作能力的參考書。書中在合理安排內(nèi)容的同時(shí)配有適量的例題與習(xí)題,以輔助教師講授和學(xué)生自學(xué)。
不論從事什么領(lǐng)域的分析工作,掌握計(jì)算機(jī)科學(xué)知識(shí)對(duì)分析師來說都是基本的要求。因?yàn)橹挥芯邆淞己玫挠?jì)算機(jī)科學(xué)知識(shí)及實(shí)際應(yīng)用經(jīng)驗(yàn),才能熟練掌握數(shù)據(jù)分析的工具。數(shù)據(jù)分析離不開計(jì)算機(jī)技術(shù),比如用于計(jì)算的軟件MATLAB和編程語言(C++、Java、Python、R)等。
在Pandas出現(xiàn)之前,R語言在數(shù)據(jù)分析領(lǐng)域一直處于霸主地位,隨著Pandas模塊的出現(xiàn),Python在數(shù)據(jù)分析領(lǐng)域成了后起之秀。比起R和MATLAB等其他用于數(shù)據(jù)分析的編程語言,Python不僅提供數(shù)據(jù)處理平臺(tái),還有其他語言和專業(yè)應(yīng)用軟件沒有的特點(diǎn)。Python的庫一直在增加,其相應(yīng)的算法也在不斷優(yōu)化,其作為“膠水語言”能與很多語言對(duì)接,這些特點(diǎn)使得Python在分析領(lǐng)域與眾不同。
本書主要講述Python數(shù)據(jù)分析中常用到的三大模塊:NumPy、Pandas、matplotlib,后為讀者展示了一個(gè)完整的實(shí)戰(zhàn)案例,使讀者能夠做到學(xué)以致用。讀者在掌握了本書的基礎(chǔ)知識(shí)之后,并在工作中不斷提升數(shù)據(jù)分析的能力,才能做出更復(fù)雜的數(shù)據(jù)分析應(yīng)用。
本書要求讀者邊學(xué)習(xí)、邊實(shí)踐操作,每一章都有大量的案例供讀者學(xué)習(xí)參考,避免學(xué)習(xí)的知識(shí)流于表面、限于理論,Python數(shù)據(jù)分析沒有捷徑可走,的方式就是多實(shí)踐、多動(dòng)手、多學(xué)習(xí)經(jīng)典的數(shù)據(jù)分析案例,進(jìn)而應(yīng)用到自己的分析項(xiàng)目中。
參與本書編寫的有孫霓剛、李祺、王超、徐彬彬、王智超、包宜洋。其中王超負(fù)責(zé)第1、2章的編寫,徐彬彬負(fù)責(zé)第3、4章的編寫,王智超負(fù)責(zé)第5~8章的編寫,包宜洋負(fù)責(zé)第9、10章的編寫,孫霓剛、李祺和包宜洋對(duì)全書進(jìn)行了統(tǒng)稿。
由于作者水平有限,不當(dāng)之處在所難免,懇請(qǐng)讀者批評(píng)指正。
編者
前言
第1章數(shù)據(jù)科學(xué)導(dǎo)論
1.1數(shù)據(jù)科學(xué)的由來
1.2數(shù)據(jù)科學(xué)在不同場景中的應(yīng)用
1.3數(shù)據(jù)科學(xué)工作的一般流程
1.4IPython的概念
1.5IPython的安裝
1.6IPython的功能特點(diǎn)
1.6.1magic特性
1.6.2Tab補(bǔ)全功能
1.6.3代碼自省
1.7Jupyter Notebook的使用
1.7.1Jupyter Notebook的概念及特點(diǎn)
1.7.2安裝Jupyter Notebook
1.7.3啟動(dòng)Jupyter Notebook
1.8本章小結(jié)
1.9練習(xí)
第2章NumPy基礎(chǔ)
2.1NumPy的概念
2.1.1什么是NumPy
2.1.2NumPy的優(yōu)勢(shì)
2.2ndarray對(duì)象基本應(yīng)用
2.2.1創(chuàng)建ndarray
2.2.2元素的類型
2.2.3數(shù)組的屬性
2.3索引與切片
2.3.1基本的索引與切片
2.3.2切片索引
2.3.3布爾型索引
2.3.4花式索引
2.4內(nèi)置函數(shù)
2.4.1字符串函數(shù)
2.4.2統(tǒng)計(jì)函數(shù)
2.4.3數(shù)學(xué)函數(shù)
2.4.4算術(shù)函數(shù)
2.4.5排序、篩選函數(shù)
2.5數(shù)組的運(yùn)算
2.5.1四則運(yùn)算
2.5.2廣播
2.5.3邏輯運(yùn)算
2.6基于數(shù)組的文件輸入與輸出
2.7利用數(shù)組進(jìn)行數(shù)據(jù)處理
2.7.1條件邏輯表述為數(shù)組運(yùn)算
2.7.2用于布爾型數(shù)組的方法
2.8本章小結(jié)
2.9練習(xí)
第3章Pandas入門
3.1Pandas介紹
3.2Pandas數(shù)據(jù)結(jié)構(gòu) Series
3.2.1創(chuàng)建Series對(duì)象
3.2.2Series數(shù)據(jù)的訪問
3.2.3通過NumPy和其他Series對(duì)象
定義新的Series對(duì)象
3.2.4Series的元素判斷和過濾
3.2.5Series的元素組成
3.2.6Series的計(jì)算
3.3Pandas數(shù)據(jù)結(jié)構(gòu) DataFrame
3.3.1創(chuàng)建DataFrame
3.3.2DataFrame數(shù)據(jù)的訪問
3.3.3DataFrame 基礎(chǔ)信息查看
3.3.4DataFrame數(shù)據(jù)的選取和過濾
3.4Pandas的算術(shù)運(yùn)算
3.5Pandas函數(shù)應(yīng)用與映射
3.6本章小結(jié)
3.7練習(xí)
第4章Pandas數(shù)據(jù)加載
4.1讀取CSV文件中的數(shù)據(jù)
4.2處理CSV文件中的無效數(shù)據(jù)
4.3逐塊讀取文本文件
4.4從數(shù)據(jù)庫中讀取數(shù)據(jù)
4.5讀取JSON數(shù)據(jù)
4.6將數(shù)據(jù)寫入CSV文件
4.7本章小結(jié)
4.8練習(xí)
Python科學(xué)計(jì)算目錄第5章Pandas數(shù)據(jù)預(yù)處理
5.1了解缺失值
5.1.1None :Python對(duì)象類型
的缺失值
5.1.2NaN:數(shù)值類型的缺失值
5.1.3Pandas中常用缺失值的總結(jié)
5.2處理缺失值
5.2.1探索缺失值
5.2.2刪除缺失值
5.2.3替換缺失值
5.3本章小結(jié)
5.4練習(xí)
第6章Pandas索引的應(yīng)用
6.1索引對(duì)象
6.1.1初識(shí)Index對(duì)象
6.1.2創(chuàng)建并使用Index對(duì)象
6.1.3創(chuàng)建并使用MultiIndex對(duì)象
6.2索引及切片
6.2.1Series對(duì)象
6.2.2DataFrame對(duì)象
6.3本章小結(jié)
6.4練習(xí)
第7章Pandas數(shù)據(jù)合并及常見字符串
處理7.1字符串常見操作
7.2Series類中str對(duì)象的方法
7.3數(shù)據(jù)拼接
7.3.1低維度數(shù)據(jù)合并
7.3.2高維度數(shù)據(jù)合并
7.4數(shù)據(jù)連接
7.5本章小結(jié)
7.6練習(xí)
第8章Pandas分組
8.1數(shù)據(jù)分組
8.2數(shù)據(jù)分組高級(jí)使用
8.3透視表制作
8.4本章小結(jié)
8.5練習(xí)
第9章使用matplotlib完成數(shù)據(jù)
可視化9.1matplotlib的安裝
9.2matplotlib的快速使用
9.3pyplot的用法詳解
9.3.1pyplot的快速使用
9.3.2繪制多個(gè)子圖
9.3.3為圖表添加文本
9.3.4為圖表添加圖例
9.3.5日期類型的數(shù)據(jù)
9.3.6注解的使用
9.4折線圖
9.5柱狀圖
9.6散點(diǎn)圖
9.7誤差線
9.8本章小結(jié)
9.9練習(xí)
第10章招聘數(shù)據(jù)綜合分析
10.1不同崗位公司類型占比
10.2數(shù)據(jù)分析崗位各招聘公司規(guī)模分布
10.3數(shù)據(jù)分析崗位招聘學(xué)歷以及經(jīng)驗(yàn)
要求
10.4數(shù)據(jù)分析崗位招聘城市需求數(shù)量
占比
10.5數(shù)據(jù)分析崗位招聘不同地區(qū)薪資
分布
10.6本章小結(jié)
10.7練習(xí)
參考文獻(xiàn)