熊贇、朱揚勇、陳志淵編*的這本《大數(shù)據挖掘》系統(tǒng)介紹了大數(shù)據挖掘的概念、原理、技術和應用,具體內容包括:認識和理解大數(shù)據;大數(shù)據挖掘需要的相關技術(大數(shù)據獲取技術、大數(shù)據存儲管理技術和大數(shù)據可視化技術等);大數(shù)據計算框架;大數(shù)據挖掘任務(關聯(lián)分析、聚類分析、分類分析、異常分析、特異群組挖掘和演變分析);大數(shù)據應用實現(xiàn)。
本書對大數(shù)據挖掘技術進行了全面而細致的定義和歸納,并向讀者展現(xiàn)了該領域*新研究熱點和技術。
本書可供數(shù)據科學專業(yè)的高等學校學生及教師,從事數(shù)據領域工作的研究人員、技術人員、管理人員和決策人員參考閱讀。
第1章 緒論
.1.1 理解大數(shù)據挖掘
1.1.1 大數(shù)據挖掘的定義
1.1.2 大數(shù)據挖掘的任務
1.1.3 大數(shù)據挖掘的特點
1.1.4 大數(shù)據挖掘與相關技術的差異
.1.2 大數(shù)據挖掘的相關技術
1.2.1 大數(shù)據獲取
1.2.2 大數(shù)據存儲與管理
1.2.3 大數(shù)據可視化
.1.3 小結
參考文獻
第2章 大數(shù)據計算框架
.2.1 HDFS
.2.2 MapReduce
2.2.1 MapReduce框架及范例
2.2.2 MapReduce存在的問題和解決方法
.2.3 NoSQL(非關系型)數(shù)據庫
2.3.1 NoSQL數(shù)據庫的分類
2.3.2 NoSQL數(shù)據庫實例
.2.4 SQL(關系型)數(shù)據庫
2.4.1 Apache HIVE
2.4.2 其他SQL數(shù)據庫
.2.5 小結
參考文獻
第3章關聯(lián)分析
.3.1 關聯(lián)分析的基本概念
3.1.1 關聯(lián)分析的定義
3.1.2 關聯(lián)規(guī)則的定義
3.1.3 關聯(lián)規(guī)則的分類
.3.2 關聯(lián)規(guī)則挖掘的原理
3.2.1 挖掘簡單關聯(lián)規(guī)則
3.2.2 挖掘量化關聯(lián)規(guī)則
3.2.3 挖掘多層關聯(lián)規(guī)則
3.2.4 挖掘多維關聯(lián)規(guī)則
.3.3 關聯(lián)規(guī)則挖掘的基礎算法
3,3.1 Apriori算法
3.3.2 Apriori算法的優(yōu)化
3.3.3 FP-Growth算法
3.3.4 序列模式挖掘算法
.3.4 挖掘算法的進階方法
3.4.1 USpan:高效用序列模式挖掘算法
3.4.2 HulsMaR:基于MapReduCC的序列模式挖掘算法
.3.5 小結
參考文獻
第4章 聚類分析
.4.1 聚類分析的基本概念
4.1.1 簇與聚類
4.1.2 相似性度量和聚類原理
.4.2 聚類分析的基礎算法
4.1.1 層次的方法——單連接算法、BIRCH算法
4.2.2 劃分的方法——κ-means和κ-medoids算法
4.2.3 基于密度的方法——OPTICS算法
.4.3 聚類分析的進階方法
4.3.1 Density Peaks算法(AA算法)
4.3.2 κ-means:真基于MapReduce的κ-means算法
.4.4 小結
參考文獻
第5章 分類分析
.5.1 分類分析的基本概念
.5.2 分類模型
.5.3 分類分析的原理
5.3.1 決策樹
5.3.2 基于統(tǒng)計的方法
5.3.3 基于神經網絡的方法
.5.4 分類分析的基礎算法
5.4.I ID3和C4.5算法:基于決策樹的分類算法
5.4.2 SLIQ:一種高速可伸縮的基于決策樹的分類算法
5.4.3 后向傳播算法BP算法:基于神經網絡的分類算法
.5.5 分類分析的進階方法
.5.6 小結
參考文獻
第6章 異常分析
.6.1 異常分析的基本概念
6.1.1 異常
6.1.2 異常分析
.6.2 異常分析的原理
6.2.1 基于統(tǒng)計的異常分析方法
6 2.2 基于偏差的異常分析方法
6.2.3 基于距離的異常分析方法
6.2.4 基于密度的異常分析方法
.6.3 異常分析的主要算法
6.3.1 基于距離的異常分析算法
6.3.2 基于密度的異常分析算法
.6.4 小結
參考文獻
第7章 特異群組挖掘
.7.1 特異群組挖掘的基本概念
.7.2 特異群組挖掘與聚類和異常檢測的關系
.7.3 特異群組挖掘形式化描述
.7.4 特異群組挖掘框架算法
.7.5 特異群組挖掘應用
.7.6 小結
參考文獻
第8章 演變分析
.8.1 演變分析的基本概念
.8.2 演變分析的原理
.8.3 演變分析的基礎算法
.8.4 演變分析的進階算法
8.4.1 時間序列隨機偏移符號化表示算法
8.4.2 多維溫度序列協(xié)同異常事件挖掘算法
.8.5 小結
參考文獻
第9章 異質數(shù)據網絡挖掘
.9.1 異質數(shù)據網絡
.9.2 異質數(shù)據網絡挖掘研究現(xiàn)狀
.9.3 數(shù)據網絡上的相似性度量的研究
.9.4 異質數(shù)據網絡挖掘研究內容
.9.5 小結
參考文獻
第10章 大數(shù)據挖掘應用之推薦系統(tǒng)
.1..1 推薦系統(tǒng)研究階段
.1..2 推薦系統(tǒng)算法
10.2.1 推薦系統(tǒng)定義
10.2 推薦算法分類
10.2.3 比較與分析
.10.3 推薦系統(tǒng)的評測
.10.4 小結
參考文獻
第11章 大數(shù)據中的隱私問題
.11.1 隱私的重要性
.11.2 隱私保護技術
11.2.1 直接攻擊的應對方法
11.2.2 間接攻擊的應對方法
.11.3 小結
參考文獻