定 價(jià):49.8 元
叢書名:普通高等教育人工智能與大數(shù)據(jù)系列教材
- 作者:葛東旭
- 出版時(shí)間:2020/4/1
- ISBN:9787111646396
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:320
- 紙張:
- 版次:
- 開本:16開
本書以數(shù)據(jù)挖掘項(xiàng)目的典型開發(fā)過程為線索,對(duì)數(shù)據(jù)挖掘的生命周期中的各個(gè)環(huán)節(jié),以及其中所涉及的概念、方法、技術(shù)和過程模型進(jìn)行了全面細(xì)致的介紹。對(duì)于數(shù)據(jù)挖掘核心部分的典型基礎(chǔ)算法,通過細(xì)致的闡述、詳盡的示例和充分的討論,深入地展示了數(shù)據(jù)挖掘算法的內(nèi)涵,以便讀者認(rèn)知、學(xué)習(xí)和掌握。
本書系統(tǒng)地介紹了數(shù)據(jù)挖掘原理、算法和應(yīng)用的相關(guān)知識(shí),內(nèi)容覆蓋數(shù)據(jù)挖掘的整個(gè)過程:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分類分析、數(shù)據(jù)聚類分析、數(shù)據(jù)關(guān)聯(lián)分析和數(shù)據(jù)挖掘系統(tǒng)的應(yīng)用等。在內(nèi)容安排上通過數(shù)據(jù)挖掘的典型應(yīng)用方法,將理論知識(shí)和工程技術(shù)應(yīng)用有機(jī)地結(jié)合,淺顯易懂且實(shí)踐性強(qiáng)。
本書可以作為高等院校計(jì)算機(jī)科學(xué)與技術(shù)、信息管理、數(shù)據(jù)分析等專業(yè)的教科書,也可作為企業(yè)管理、信息分析人員的技術(shù)參考書籍。
本書配有電子課件,及與書中例題、作業(yè)題配套的數(shù)據(jù)素材,歡迎選用本書作教材的老師發(fā)郵件到j(luò)inacmp@163.com索取,或登錄www.cmpedu.com注冊下載。
目 錄
前 言
第1章 緒論1
1.1 信息爆炸與大數(shù)據(jù)1
1.2 什么是數(shù)據(jù)挖掘5
1.3 數(shù)據(jù)挖掘的任務(wù)6
1.4 數(shù)據(jù)挖掘的應(yīng)用7
1.5 數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)9
1.6 數(shù)據(jù)挖掘面臨的挑戰(zhàn)9
1.7 數(shù)據(jù)挖掘樣例數(shù)據(jù)和相關(guān)資料10
思考與練習(xí)13
參考文獻(xiàn)13
第2章 數(shù)據(jù)挖掘的過程14
2.1 數(shù)據(jù)分析能力14
2.2 數(shù)據(jù)挖掘的過程16
2.3 三階段過程模型17
2.4 SEMMA方法19
2.5 CRISP-DM過程模型21
2.6 5A模型25
2.7 模型融合26
本章小結(jié)26
思考與練習(xí)27
參考文獻(xiàn)27
第3章 數(shù)據(jù)準(zhǔn)備28
3.1 數(shù)據(jù)收集28
3.2 數(shù)據(jù)抽樣29
3.3 數(shù)據(jù)集成32
3.4 數(shù)據(jù)清理39
3.5 數(shù)據(jù)歸約43
3.6 數(shù)據(jù)變換48
本章小結(jié)50
思考與練習(xí)51
參考文獻(xiàn)51
第4章 數(shù)據(jù)探索52
4.1 數(shù)據(jù)探索的作用52
4.2 數(shù)據(jù)可視化54
4.3 數(shù)據(jù)統(tǒng)計(jì)分析70
4.4 加載Excel插件78
本章小結(jié)79
思考與練習(xí)79
參考文獻(xiàn)79
第5章 關(guān)聯(lián)分析81
5.1 關(guān)聯(lián)分析原理81
5.2 由候選項(xiàng)集產(chǎn)生頻繁項(xiàng)集84
5.3 計(jì)算支持度計(jì)數(shù)94
5.4 FP-Growth算法98
5.5 產(chǎn)生頻繁項(xiàng)集算法復(fù)雜度105
5.6 生成規(guī)則106
5.7 關(guān)聯(lián)規(guī)則的評(píng)估111
本章小結(jié)116
思考與練習(xí)116
參考文獻(xiàn)118
第6章 分類預(yù)測119
6.1 分類的原理119
6.2 決策樹分類122
6.3 基于規(guī)則的分類器151
6.4 貝葉斯分類器156
6.5 人工神經(jīng)網(wǎng)絡(luò)173
6.6 支持向量機(jī)186
6.7 模型評(píng)估192
本章小結(jié)197
思考與練習(xí)197
參考文獻(xiàn)198
第7章 聚類分析199
7.1 聚類的基本概念200
7.2 K均值(K-means)聚類方法208
7.3 K中心點(diǎn)(K-medoids)算法215
7.4 層次聚類216
7.5 DBSCAN聚類222
7.6 聚類算法評(píng)估228
本章小結(jié)232
思考與練習(xí)232
參考文獻(xiàn)233
第8章 回歸分析234
8.1 回歸分析的概念234
8.2 回歸算法235
8.3 回歸的評(píng)估與檢驗(yàn)244
本章小結(jié)249
思考與練習(xí)249
參考文獻(xiàn)251
第9章 數(shù)據(jù)挖掘的工具252
9.1 MATLAB252
9.2 SPSS Modeler253
9.3 SAS Enterprise Miner254
9.4 WEKA255
9.5 R256
本章小結(jié)256
參考文獻(xiàn)257
第10章 WEKA數(shù)據(jù)挖掘應(yīng)用258
10.1 WEKA簡介258
10.2 Explorer261
10.3 Experimenter302
10.4 KnowledgeFlow304
10.5 WEKA API310
10.6 WEKA的設(shè)置和使用311
本章小結(jié)313
思考與練習(xí)313
參考文獻(xiàn)313