定 價:59 元
叢書名:大數(shù)據(jù)與人工智能技術(shù)叢書
- 作者:柳毅、毛峰、李藝
- 出版時間:2019/7/1
- ISBN:9787302515791
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP311.561
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
Python是信息管理與信息系統(tǒng)、電子商務(wù)等信息管理類本科學(xué)生進(jìn)行數(shù)據(jù)分析所需要掌握的基礎(chǔ)性語言和分析工具,是未來學(xué)生掌握大數(shù)據(jù)分析技術(shù)的學(xué)習(xí)基礎(chǔ)。本書共分12章,著重講述Python語言和數(shù)據(jù)分析工具包的應(yīng)用。
第1章主要介紹Python的發(fā)展歷史、特點、集成開發(fā)環(huán)境、內(nèi)置模塊、幫助的使用等內(nèi)容; 第2章主要介紹Python語言的基礎(chǔ)知識; 第3章主要介紹Python中的常用數(shù)據(jù)結(jié)構(gòu),包括序列、字典、集合等,以及函數(shù)的定義和調(diào)用等; 第4章主要介紹Python中類、對象和方法的相關(guān)內(nèi)容; 第5章主要介紹Python進(jìn)行數(shù)據(jù)分析常用的NumPy、Pandas、Matplotlib、SciPy和Scikitlearn等基礎(chǔ)庫內(nèi)容; 第6章主要介紹網(wǎng)絡(luò)數(shù)據(jù)獲取的HTML和XML兩種網(wǎng)頁組織形式,以及urllib和BeautifulSoup4兩個模塊內(nèi)容; 第7章主要介紹文件的操作; 第8章主要介紹數(shù)據(jù)可視化,以及使用Python繪制圖表的知識; 第9章主要介紹利用Python進(jìn)行數(shù)據(jù)庫應(yīng)用開發(fā); 第10、11章主要介紹Python機器學(xué)習(xí)的基本概念以及有監(jiān)督、無監(jiān)督學(xué)習(xí)算法的原理; 第12章主要介紹Python在地理空間分析上的應(yīng)用。本書中的代碼均在Python 3.5中測試通過。
本書一方面?zhèn)戎貙ython數(shù)據(jù)分析基礎(chǔ)知識的講解,另一方面注重Python數(shù)據(jù)處理方法的應(yīng)用。本書適合作為計算機科學(xué)與技術(shù)專業(yè)學(xué)生學(xué)習(xí)數(shù)據(jù)分析的入門教材,也適合作為Python愛好者的參考書。
本書一方面?zhèn)戎豍ython數(shù)據(jù)分析基礎(chǔ)知識的講解,另一方面?zhèn)戎乩肞ython數(shù)據(jù)處理方法的應(yīng)用。本書適合可作為計算機程序設(shè)計的入門教材或Python愛好者的參考書。
前言
Python是大數(shù)據(jù)時代非常受歡迎的數(shù)據(jù)分析編程語言,近年來隨著機器學(xué)習(xí)、云計算、人工智能等技術(shù)的發(fā)展,Python的流行趨勢扶搖直上,已經(jīng)成為數(shù)據(jù)分析和數(shù)據(jù)科學(xué)事實上的標(biāo)準(zhǔn)語言和標(biāo)準(zhǔn)平臺之一。
本書針對數(shù)據(jù)分析人員和Python編程學(xué)習(xí)者進(jìn)行內(nèi)容編排和章節(jié)講述,Python數(shù)據(jù)分析整個學(xué)習(xí)路線圖計劃分成16周,120天左右。本書主要內(nèi)容包括以下五大部分。
(1) Python工作環(huán)境及基礎(chǔ)語法知識: 認(rèn)識Python程序運行方式,使用Python 3.5開發(fā)集成環(huán)境與工具; 學(xué)習(xí)Python程序基本結(jié)構(gòu),理解Python的面向?qū)ο蠖x和類、對象的操作方法,以及Python異常處理機制。本部分為基礎(chǔ)內(nèi)容,建議學(xué)習(xí)時間為4周。
(2) Python數(shù)據(jù)分析相關(guān)知識: Python生態(tài)系統(tǒng)為數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家提供了各種程序庫,例如NumPy、SciPy、Pandas和Matplotlib,使其在數(shù)據(jù)分析領(lǐng)域也有廣泛的應(yīng)用。Python數(shù)據(jù)分析的學(xué)習(xí)主要是對相關(guān)庫的使用,例如數(shù)據(jù)整理需要用到NumPy庫,數(shù)據(jù)描述與分析則主要用到Pandas庫。由于有前面的學(xué)習(xí)基礎(chǔ),本部分學(xué)習(xí)時間建議為3周。
(3) Python數(shù)據(jù)可視化: Python數(shù)據(jù)可視化的過程就是學(xué)習(xí)Matplotlib庫的過程,Matplotlib庫包含豐富的數(shù)據(jù)可視化資源,地圖、3D等都有涉及,基于前面兩部分的學(xué)習(xí)經(jīng)驗,這部分內(nèi)容在兩周內(nèi)基本可以完成。
(4) Python機器學(xué)習(xí): Scikitlearn是本書所使用的核心程序庫,依托于上述幾種工具包,封裝了大量的經(jīng)典以及最新的機器學(xué)習(xí)模型。通過介紹有監(jiān)督和無監(jiān)督機器學(xué)習(xí)原理,學(xué)習(xí)有監(jiān)督學(xué)習(xí)的線性回歸、Logistic回歸、樸素貝葉斯、SVM、KNN和決策樹等幾個常用算法,以及無監(jiān)督學(xué)習(xí)的KMeans聚類算法。在前面三部分學(xué)習(xí)的基礎(chǔ)上,本部分內(nèi)容建議學(xué)習(xí)時間在4周左右。
(5) Python地理空間數(shù)據(jù)分析應(yīng)用: 向讀者介紹地理空間分析的基本概念和常用的地理空間數(shù)據(jù),然后介紹Python中與地理數(shù)據(jù)處理和地理分析相關(guān)的工具,最后以Python處理和分析矢量數(shù)據(jù)與柵格數(shù)據(jù)的方法,對浙江省實施的五水共治行動中劣五類水體在地理空間模型上分布的衛(wèi)星圖像數(shù)據(jù)進(jìn)行可視化數(shù)據(jù)分析的綜合應(yīng)用,本部分內(nèi)容建議學(xué)習(xí)時間為3周。
本書編寫人員具有豐富的Python數(shù)據(jù)分析實踐經(jīng)驗和多年的信息管理教學(xué)能力,第1~3章由沈陽工業(yè)大學(xué)李藝?yán)蠋熅帉懀?第4~7、10章由杭州電子科技大學(xué)柳毅老師編寫; 第8、9、11、12章由杭州電子科技大學(xué)毛峰老師編寫; 王健、陸佳渙等碩士研究生參與了本書相關(guān)章節(jié)內(nèi)容和程序代碼的完善工作; 浙江工業(yè)大學(xué)計算機科學(xué)與技術(shù)學(xué)院院長、國家教學(xué)名師王萬良教授對本書進(jìn)行了認(rèn)真的審閱,并提出許多寶貴的建設(shè)性意見,使本書內(nèi)容日臻完善,在此對他們所付出的辛勤勞動表示誠摯的感謝。
本書結(jié)合大數(shù)據(jù)管理與應(yīng)用的最新發(fā)展,針對計算機科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、電子商務(wù)等經(jīng)管類本科教學(xué)特點進(jìn)行撰寫。本書提供教學(xué)課件、教學(xué)大綱、電子教案、習(xí)題答案和程序源碼,讀者可以掃描封底的課件二維碼下載。本書還提供400分鐘的視頻講解,掃描書中的二維碼,可以在線觀看。
由于編者水平所限,書中難免有疏漏之處,敬請讀者批評指正。
編者2019年3月
目錄
第1章Python簡介
1.1Python語言的發(fā)展史
1.1.1Python語言的特點
1.1.2Python 2與Python 3的區(qū)別
1.2Python的環(huán)境搭建
1.3開始使用Python IDLE
1.3.1交互方式
1.3.2Python的集成開發(fā)環(huán)境
1.4Eclipse PyDev的安裝
1.5代碼風(fēng)格
1.6使用幫助
本章小結(jié)
習(xí)題
第2章Python語言基礎(chǔ)知識
2.1標(biāo)識符與變量
2.1.1標(biāo)識符
2.1.2變量
2.2數(shù)據(jù)類型及運算
2.2.1數(shù)據(jù)類型
2.2.2運算符和表達(dá)式
2.3分支結(jié)構(gòu)控制語句
2.3.1if語句
2.3.2ifelse語句
2.3.3ifelifelse語句
2.4循環(huán)語句
2.4.1循環(huán)結(jié)構(gòu)控制語句
2.4.2循環(huán)嵌套控制語句
2.4.3break語句和continue語句
2.4.4range()函數(shù)
2.5常見的Python函數(shù)
本章小結(jié)
習(xí)題
第3章數(shù)據(jù)結(jié)構(gòu)與函數(shù)設(shè)計
3.1序列
3.1.1列表
3.1.2元組
3.1.3字符串
3.1.4列表與元組之間的轉(zhuǎn)換
3.2字典
3.2.1創(chuàng)建字典
3.2.2字典的方法
3.2.3列表、元組與字典之間的轉(zhuǎn)換
3.3集合
3.3.1集合的創(chuàng)建
3.3.2集合的運算
3.3.3集合的方法
3.4函數(shù)的定義
3.4.1函數(shù)的調(diào)用
3.4.2形參與實參
3.4.3函數(shù)的返回
3.4.4位置參數(shù)
3.4.5默認(rèn)參數(shù)與關(guān)鍵字參數(shù)
3.4.6可變長度參數(shù)
本章小結(jié)
習(xí)題
第4章類與對象
4.1面向?qū)ο?br />
4.1.1面向?qū)ο缶幊?br />
4.1.2類的抽象與封裝
4.2認(rèn)識Python中的類、對象和方法
4.2.1類的定義與創(chuàng)建
4.2.2構(gòu)造函數(shù)
4.3類的屬性
4.3.1類屬性和實例屬性
4.3.2公有屬性和私有屬性
4.4類的方法
4.4.1類方法的調(diào)用
4.4.2類方法的分類
4.4.3析構(gòu)函數(shù)
4.5類的繼承
4.5.1父類與子類
4.5.2繼承的語法
4.5.3多重繼承
4.5.4運算符的重載
4.6類的組合
4.7類的異常處理
4.7.1異常
4.7.2Python中的異常類
4.7.3捕獲與處理異常
4.7.4自定義異常類
4.7.5with語句
4.7.6斷言
本章小結(jié)
習(xí)題
案例
第5章Python數(shù)據(jù)分析基礎(chǔ)庫
5.1NumPy
5.1.1ndarray的數(shù)據(jù)類型
5.1.2數(shù)組和標(biāo)量之間的運算
5.1.3索引和切片
5.1.4數(shù)組轉(zhuǎn)置和軸對換
5.1.5利用數(shù)組進(jìn)行數(shù)據(jù)處理
5.1.6數(shù)學(xué)和統(tǒng)計方法
5.2Pandas
5.2.1Pandas數(shù)據(jù)結(jié)構(gòu)
5.2.2Pandas文件操作
5.2.3數(shù)據(jù)處理
5.2.4層次化索引
5.2.5分級順序
5.2.6使用DataFrame的列
5.3Matplotlib
5.3.1figure和subplot
5.3.2調(diào)整subplot周圍的間距
5.3.3顏色、標(biāo)記和線型
5.3.4刻度標(biāo)簽和圖例
5.3.5添加圖例
5.3.6將圖表保存到文件
5.4SciPy
5.5Scikitlearn
本章小結(jié)
習(xí)題
第6章網(wǎng)絡(luò)數(shù)據(jù)的獲取
6.1網(wǎng)頁數(shù)據(jù)的組織形式
6.1.1HTML
6.1.2HTML元素
6.1.3HTML屬性
6.2XML
6.2.1XML的結(jié)構(gòu)和語法
6.2.2XML元素和屬性
6.3利用urllib處理HTTP
6.4利用BeautifulSoup4解析HTML文檔
6.4.1BeautifulSoup4中的對象
6.4.2遍歷文檔樹
6.4.3搜索文檔樹
本章小結(jié)
習(xí)題
第7章文件操作
7.1文件的打開和關(guān)閉
7.1.1打開文件
7.1.2關(guān)閉文件
7.2讀寫文件
7.2.1從文件讀取數(shù)據(jù)
7.2.2向文件寫入數(shù)據(jù)
7.3文件對話框
7.3.1基于win32ui構(gòu)建文件對話框
7.3.2基于tkFileDialog構(gòu)建文件對話框
7.4應(yīng)用實例: 文本文件的操作
本章小結(jié)
習(xí)題
第8章Python數(shù)據(jù)可視化
8.1數(shù)據(jù)可視化概念框架
8.1.1數(shù)據(jù)可視化簡介
8.1.2數(shù)據(jù)可視化常用圖表
8.1.3Python數(shù)據(jù)可視化環(huán)境準(zhǔn)備
8.2繪制圖表
8.2.1Matplotlib API入門
8.2.2創(chuàng)建圖表
8.2.3圖表定制
8.2.4保存圖表
8.3更多高級圖表及定制
8.3.1樣式
8.3.2subplot子區(qū)
8.3.3圖表顏色和填充
8.3.4動畫
本章小結(jié)
習(xí)題
第9章數(shù)據(jù)庫應(yīng)用開發(fā)
9.1Python與數(shù)據(jù)庫
9.1.1數(shù)據(jù)庫簡介
9.1.2Python數(shù)據(jù)庫工作環(huán)境
9.2本地數(shù)據(jù)庫SQLite
9.2.1SQLite簡介
9.2.2Python內(nèi)置的sqlite3模塊
9.3關(guān)系型數(shù)據(jù)庫
9.3.1關(guān)系型數(shù)據(jù)庫基本操作與SQL
9.3.2操作MySQL
9.4非關(guān)系型數(shù)據(jù)庫
9.4.1NoSQL介紹
9.4.2MongoDB
9.4.3PyMongo: MongoDB和Python
習(xí)題
第10章機器學(xué)習(xí)有監(jiān)督學(xué)習(xí)
10.1機器學(xué)習(xí)簡介
10.2Python機器學(xué)習(xí)庫Scikitlearn
10.3有監(jiān)督學(xué)習(xí)
10.3.1線性回歸
10.3.2Logistic回歸分類器
10.3.3樸素貝葉斯分類器
10.3.4支持向量機
10.3.5KNN算法
10.3.6決策樹
本章小結(jié)
習(xí)題
第11章機器學(xué)習(xí)無監(jiān)督學(xué)習(xí)
11.1無監(jiān)督學(xué)習(xí)
11.2聚類
11.2.1相異度
11.2.2KMeans算法
11.2.3DBSCAN算法
11.3關(guān)聯(lián)規(guī)則
11.3.1關(guān)聯(lián)分析
11.3.2Apriori算法
11.3.3FPgrowth算法
本章小結(jié)
習(xí)題
第12章Python地理空間分析
12.1地理空間分析簡介
12.1.1地理空間分析的基本概念
12.1.2地理空間分析與Python
12.2地理空間數(shù)據(jù)
12.2.1數(shù)據(jù)格式概覽
12.2.2數(shù)據(jù)特征
12.2.3矢量數(shù)據(jù)
12.2.4柵格數(shù)據(jù)
12.3Python地理空間分析工具
12.3.1GeoJSON
12.3.2GDAL和OGR
12.3.3PyShp
12.3.4PIL
12.3.5GeoPandas
12.4Python分析矢量數(shù)據(jù)
12.4.1訪問矢量數(shù)據(jù)
12.4.2Shapefile文件操作
12.4.3空間查詢
12.4.4疊加分析
12.5Python與遙感
12.5.1訪問影像文件
12.5.2影像裁剪
12.5.3重采樣
12.5.4影像分類
12.6五水共治資源地理空間分析綜合應(yīng)用
本章小結(jié)
習(xí)題