大數(shù)據(jù)分析與挖掘?qū)嶒?yàn)教程
定 價(jià):46 元
- 作者:萬(wàn)欣
- 出版時(shí)間:2023/6/1
- ISBN:9787121456909
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁(yè)碼:160
- 紙張:
- 版次:01
- 開本:16開
本書是一本面向數(shù)據(jù)科學(xué)初學(xué)者的實(shí)驗(yàn)教材。本書旨在通過(guò)實(shí)驗(yàn)的方式,幫助學(xué)生掌握數(shù)據(jù)分析和挖掘的基本概念、方法和技術(shù),并學(xué)會(huì)使用Python等工具進(jìn)行實(shí)際操作。本書的實(shí)驗(yàn)設(shè)計(jì)涵蓋了數(shù)據(jù)預(yù)處理、數(shù)據(jù)可視化、分類與預(yù)測(cè)、聚類與關(guān)聯(lián)規(guī)則挖掘、文本挖掘、網(wǎng)絡(luò)分析、時(shí)間序列分析、情感分析和主題模型等多個(gè)方面,旨在培養(yǎng)學(xué)生的數(shù)據(jù)思維和實(shí)際操作能力,為學(xué)生日后從事數(shù)據(jù)科學(xué)工作打下堅(jiān)實(shí)的基礎(chǔ)。本書的實(shí)驗(yàn)設(shè)計(jì)遵循理論與實(shí)踐相結(jié)合的原則,每個(gè)實(shí)驗(yàn)都提供了詳細(xì)的理論知識(shí)和實(shí)驗(yàn)步驟,以及實(shí)驗(yàn)數(shù)據(jù)和代碼。通過(guò)實(shí)驗(yàn),學(xué)生可以熟悉數(shù)據(jù)分析與挖掘的實(shí)際操作流程,了解各種數(shù)據(jù)分析與挖掘方法的優(yōu)缺點(diǎn)以及應(yīng)用場(chǎng)景。同時(shí),本書還鼓勵(lì)學(xué)生進(jìn)行自主思考和創(chuàng)新,通過(guò)實(shí)驗(yàn)提高學(xué)生解決問(wèn)題的能力和創(chuàng)新能力。
萬(wàn)欣,武漢紡織大學(xué)管理學(xué)院副教授,碩士生導(dǎo)師,武漢紡織大學(xué)大數(shù)據(jù)與效益制造中心主任,湖北省一流課程“商務(wù)智能”負(fù)責(zé)人;畢業(yè)于日本電氣通信大學(xué),工學(xué)博士(社會(huì)智能信息學(xué)),主要研究方向有商務(wù)智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等;曾就職于國(guó)內(nèi)外多家上市公司,從事技術(shù)研發(fā)、軟件開發(fā)工作;在大數(shù)據(jù)分析與挖掘領(lǐng)域教學(xué)經(jīng)驗(yàn)豐富。
第一章 數(shù)據(jù)預(yù)處理 1
第一節(jié) 數(shù)據(jù)清洗 2
第二節(jié) 數(shù)據(jù)集成 3
第三節(jié) 數(shù)據(jù)變換 5
第四節(jié) 數(shù)據(jù)規(guī)約 7
第五節(jié) Python中的數(shù)據(jù)預(yù)處理工具 8
小結(jié) 14
第二章 數(shù)據(jù)可視化 15
第一節(jié) 理解數(shù)據(jù)可視化的概念和重要性 16
第二節(jié) 使用Python的matplotlib和seaborn庫(kù)繪制基本圖形 17
第三節(jié) 繪制柱狀圖、折線圖、散點(diǎn)圖、箱線圖等常見圖形 21
第四節(jié) 利用圖形展示數(shù)據(jù)的關(guān)系和趨勢(shì)、數(shù)據(jù)的分析 24
第五節(jié) 利用交互式可視化工具進(jìn)行高級(jí)數(shù)據(jù)可視化 29
小結(jié) 33
第三章 分類與預(yù)測(cè) 34
第一節(jié) 理解分類與預(yù)測(cè)的概念和應(yīng)用場(chǎng)景 35
第二節(jié) 理解機(jī)器學(xué)習(xí)分類算法的基本原理 36
第三節(jié) 利用Python的scikit-learn庫(kù)進(jìn)行分類算法的實(shí)現(xiàn) 43
第四節(jié) 利用交叉驗(yàn)證、網(wǎng)格搜索等方法對(duì)分類算法進(jìn)行優(yōu)化 47
小結(jié) 51
第四章 聚類與關(guān)聯(lián)規(guī)則挖掘 52
第一節(jié) 理解聚類與關(guān)聯(lián)規(guī)則挖掘的概念和應(yīng)用場(chǎng)景 53
第二節(jié) 理解聚類算法的基本原理 54
第三節(jié) 利用Python的scikit-learn庫(kù)進(jìn)行聚類算法的實(shí)現(xiàn) 55
第四節(jié) 理解關(guān)聯(lián)規(guī)則挖掘的基本原理:Apriori算法 60
第五節(jié) 利用Python的mlxtend庫(kù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘的實(shí)現(xiàn) 64
小結(jié) 66
第五章 文本挖掘 67
第一節(jié) 理解文本挖掘的概念和應(yīng)用場(chǎng)景 68
第二節(jié) 理解自然語(yǔ)言處理的基本概念及技術(shù) 69
第三節(jié) 利用Python的NLTK和jieba庫(kù)進(jìn)行文本預(yù)處理 71
第四節(jié) 理解文本分類的基本原理和算法 79
第五節(jié) 利用Python的scikit-learn和keras庫(kù)進(jìn)行文本分類的實(shí)現(xiàn) 83
小結(jié) 88
第六章 網(wǎng)絡(luò)分析 89
第一節(jié) 理解網(wǎng)絡(luò)分析的概念、應(yīng)用場(chǎng)景和工具 90
第二節(jié) 理解網(wǎng)絡(luò)的基本概念 93
第三節(jié) 利用Python的NetworkX庫(kù)進(jìn)行網(wǎng)絡(luò)構(gòu)建和分析 95
第四節(jié) 理解社交網(wǎng)絡(luò)分析的基本原理和方法 98
第五節(jié) 利用Python的igraph庫(kù)進(jìn)行社交網(wǎng)絡(luò)分析的實(shí)現(xiàn) 101
小結(jié) 104
第七章 時(shí)間序列分析 105
第一節(jié) 理解時(shí)間序列分析的概念和應(yīng)用場(chǎng)景 106
第二節(jié) 理解時(shí)間序列的基本概念 106
第三節(jié) 利用Python的pandas庫(kù)進(jìn)行時(shí)間序列數(shù)據(jù)的處理和分析 107
第四節(jié) 理解時(shí)間序列預(yù)測(cè)的基本原理和方法 109
第五節(jié) 利用Python的statsmodels庫(kù)進(jìn)行時(shí)間序列預(yù)測(cè)的實(shí)現(xiàn) 111
小結(jié) 113
第八章 情感分析 115
第一節(jié) 理解情感分析的概念和應(yīng)用場(chǎng)景 116
第二節(jié) 理解自然語(yǔ)言處理中的情感分析基本原理和方法 117
第三節(jié) 利用Python的NLTK和SnowNLP庫(kù)進(jìn)行情感分析的實(shí)現(xiàn) 118
第四節(jié) 理解深度學(xué)習(xí)在情感分析中的應(yīng)用 121
第五節(jié) 利用Python的keras和tensorflow庫(kù)進(jìn)行深度學(xué)習(xí)情感分析
的實(shí)現(xiàn) 124
小結(jié) 127
第九章 主題模型 129
第一節(jié) 理解主題模型的概念和應(yīng)用場(chǎng)景 130
第二節(jié) 理解主題模型的基本原理和方法 131
第三節(jié) 利用Python的gensim和scikit-learn庫(kù)進(jìn)行主題模型的實(shí)現(xiàn) 133
第四節(jié) 理解主題模型在文本分析、信息檢索和推薦系統(tǒng)中的應(yīng)用 141
第五節(jié) 利用主題模型進(jìn)行文本主題分析和推薦系統(tǒng)的 實(shí)現(xiàn) 142
小結(jié) 145
附錄A 實(shí)驗(yàn)環(huán)境搭建 146
后記 148