大數(shù)據(jù)挖掘?qū)嶒?yàn)教程
定 價(jià):49.8 元
叢書(shū)名:大數(shù)據(jù)技術(shù)及人工智能專業(yè)應(yīng)用型教材
- 作者:趙志升 梁俊花/主編
- 出版時(shí)間:2020/8/1
- ISBN:9787303260997
- 出 版 社:北京師范大學(xué)出版社
- 中圖法分類:TP274
- 頁(yè)碼:320
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16K
1、本書(shū)通過(guò)典型案例的R語(yǔ)言實(shí)現(xiàn),清晰解讀教材中晦澀難懂的理論闡述與算法推導(dǎo),讓抽象的大數(shù)據(jù)落地到具體行業(yè)上,理論聯(lián)系實(shí)際,實(shí)用性強(qiáng)。 2、實(shí)驗(yàn)指導(dǎo)書(shū)中所有案例均來(lái)自醫(yī)療大數(shù)據(jù)研究室項(xiàng)目和培訓(xùn)積累,并且結(jié)合課堂體驗(yàn)和學(xué)習(xí)效果,從中精挑細(xì)選的典型案例。 3、適合不同層次的讀者。不僅適合高等院校的各相關(guān)專業(yè)的本?粕、研究生,也適合零編程基礎(chǔ)的科研人員以及對(duì)大數(shù)據(jù)分析技術(shù)感興趣的人士閱讀。
內(nèi)容系統(tǒng)、全面、規(guī)范
如今,大數(shù)據(jù)的發(fā)展已經(jīng)成為我國(guó)經(jīng)濟(jì)發(fā)展的新引擎,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)及課程也已在高校陸續(xù)開(kāi)設(shè)。從大數(shù)據(jù)元年發(fā)展至今,市面上出現(xiàn)了大量大數(shù)據(jù)技術(shù)相關(guān)書(shū)籍,但大部分書(shū)籍偏重于技術(shù)和算法的理論介紹,實(shí)用性和操作性強(qiáng)的教材很少,導(dǎo)致學(xué)生在學(xué)習(xí)過(guò)程中閱讀興趣度會(huì)逐漸降低,以致半途而廢,而商業(yè)實(shí)踐的書(shū)籍又過(guò)多偏重于工程,即使有案例操作,也缺乏系統(tǒng)性,不適合作為教材講授。本書(shū)從理論與實(shí)踐相結(jié)合的角度出發(fā),在大數(shù)據(jù)挖掘理論的基礎(chǔ)上編寫(xiě)而成。每個(gè)知識(shí)點(diǎn)都有對(duì)應(yīng)的實(shí)驗(yàn),以簡(jiǎn)潔實(shí)驗(yàn)的舉例取代晦澀難懂的算法推導(dǎo)。實(shí)驗(yàn)例題背景介紹、步驟解析明確,讀者可直接參考實(shí)驗(yàn)流程,獨(dú)立完成程序運(yùn)行。
本書(shū)主要從基礎(chǔ)、建模、案例三部分展開(kāi)對(duì)大數(shù)據(jù)挖掘的分析應(yīng)用。基礎(chǔ)部分介紹了實(shí)驗(yàn)工具R、Python語(yǔ)言的使用,數(shù)據(jù)采集、質(zhì)量分析、統(tǒng)計(jì)、可視化等數(shù)據(jù)準(zhǔn)備,以及數(shù)據(jù)清洗、集成、變換、規(guī)約等預(yù)處理操作。建模部分介紹了大數(shù)據(jù)挖掘常用的分類模型和算法,涵蓋了回歸方法、分類方法、關(guān)聯(lián)規(guī)則、聚類分析、預(yù)測(cè)方法、離群點(diǎn)診斷和時(shí)間序列分析方法,在每一類方法中包括了基本的方法介紹、實(shí)驗(yàn)解析及完整的代碼。案例部分精選了2個(gè)大數(shù)據(jù)挖掘綜合應(yīng)用案例。
本書(shū)編寫(xiě)分工為:通旭明撰寫(xiě)第1、第3、第4章,趙志升撰寫(xiě)第2章,梁俊花撰寫(xiě)第5、第9、第10、第11章,李靜撰寫(xiě)第6章,劉洋撰寫(xiě)第7和第8章。全書(shū)由趙志升、梁俊花統(tǒng)稿和校對(duì)。本書(shū)在編寫(xiě)過(guò)程中,還得到了王春艷、袁艷紅等老師的幫助,在此表示感謝;同時(shí),感謝河北北方學(xué)院大數(shù)據(jù)分析項(xiàng)目團(tuán)隊(duì)成員郭明磊、傅軒昂、劉石、袁博、張貴軒、姜連勛、武美璇、武麗媛參與本書(shū)的寫(xiě)作和實(shí)驗(yàn)代碼的調(diào)試校驗(yàn);感謝教育部“2018產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目——江蘇知途教育科技有限公司教學(xué)內(nèi)容和課程體系改革項(xiàng)目”對(duì)本書(shū)的支持。
由于編者水平有限,加之時(shí)間倉(cāng)促,書(shū)中難免存在不當(dāng)之處,歡迎讀者提出寶貴意見(jiàn)和建議,以便再版時(shí)修正。讀者的意見(jiàn)和建議請(qǐng)發(fā)至郵箱zzsbigdata@sina.com。
趙志升,女,河北北方學(xué)院,教授,教齡35年,長(zhǎng)期從事大數(shù)據(jù)分析、計(jì)算機(jī)應(yīng)用相關(guān)的教學(xué)與研究,發(fā)表相關(guān)論文50余篇,專著1部,主編教材8部,先后主持省廳級(jí)項(xiàng)目15項(xiàng),獲國(guó)家軟件著作權(quán)20余項(xiàng),獲河北省醫(yī)學(xué)科技一等獎(jiǎng)1項(xiàng),獲河北省科學(xué)技術(shù)進(jìn)步三等獎(jiǎng)1項(xiàng),講授的課程包括:《數(shù)據(jù)庫(kù)原理與應(yīng)用》《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘》《大數(shù)據(jù)分析基礎(chǔ)》《信息系統(tǒng)分析與設(shè)計(jì)》等。
第1章實(shí)驗(yàn)工具的選擇1
11實(shí)驗(yàn)工具選擇1
12R語(yǔ)言3
13Python語(yǔ)言15
第2章數(shù)據(jù)的準(zhǔn)備34
21數(shù)據(jù)采集34
22數(shù)據(jù)抽樣51
23數(shù)據(jù)質(zhì)量分析55
第3章數(shù)據(jù)預(yù)處理方法77
31數(shù)據(jù)清洗77
32數(shù)據(jù)集成85
33數(shù)據(jù)變換90
34數(shù)據(jù)規(guī)約97
35數(shù)據(jù)降維106
第4章回歸方法110
41多元線性回歸110
42邏輯回歸120
43線性判別分析126
第5章分類方法131
51K近鄰分類131
52貝葉斯分類139
53神經(jīng)網(wǎng)絡(luò)146
54決策樹(shù)153
55隨機(jī)森林160
56支持向量機(jī)164
57分類的評(píng)價(jià)175
第6章關(guān)聯(lián)規(guī)則192
61關(guān)聯(lián)規(guī)則概要192
62Apriori算法193
63FPGrowth算法200
第7章聚類分析207
71聚類方法概要207
72Kmeans聚類算法209
73K中心點(diǎn)聚類算法216
74密度聚類算法220
75層次聚類算法225
76期望最大化聚類算法228
77神經(jīng)網(wǎng)絡(luò)聚類算法232
78模糊C均值聚類算法235
79高斯混合聚類算法238
第8章預(yù)測(cè)方法241
81預(yù)測(cè)方法概要241
82灰色預(yù)測(cè)241
83馬爾科夫預(yù)測(cè)247
第9章離群點(diǎn)診斷251
91單變量的離群點(diǎn)診斷251
92基于回歸的離群點(diǎn)診斷
254
93基于聚類的離群點(diǎn)診斷
259
94局部離群點(diǎn)因子檢測(cè)263
第10章時(shí)間序列分析方法267
101季節(jié)指數(shù)預(yù)測(cè)法267
102解讀自回歸時(shí)間序列模型
272
103時(shí)間序列分解280
第11章綜合案例286
111員工離職預(yù)測(cè)分析286
112北京二手房房?jī)r(jià)分析299