全書共分為五大部分,*部分介紹了實時數(shù)據(jù)流和聚類方法的背景,包括實時數(shù)據(jù)流的特點、進行數(shù)據(jù)分析的技術以及研究現(xiàn)狀。第二部分詳細講解了聚類方法中的簡單聚類,包括基于衰減窗口與剪枝維度樹的數(shù)據(jù)流聚類和實時數(shù)據(jù)流動態(tài)模式發(fā)現(xiàn)與跟蹤方法,以及相關實驗證明等內(nèi)容。第三部分詳細闡述了增量聚類技術,包括什么是增量聚類、網(wǎng)格劃分策略,以及兩個特點不同的增量聚類算法等內(nèi)容。第四部分介紹了聚類算法的一個應用,邊界技術檢測,這是除了聚類方法除了模式發(fā)現(xiàn)之外的另一個應用之處。第五部分以實時數(shù)據(jù)流在某鋼鐵廠的實際應用為案例,剖析了實時數(shù)據(jù)流在實際生產(chǎn)中的應用過程和方法,以及通過實時數(shù)據(jù)流對企業(yè)生產(chǎn)過程的分析,*后還將聚類方法應用與該案例中,做到對結果進行可視化分析,幫助讀者將理論知識貫穿于實踐中
更多科學出版社服務,請掃碼獲取。
目錄
第1章 實時數(shù)據(jù)流和聚類方法的背景 1
1.1 實時數(shù)據(jù)流 1
1.1.1 實時數(shù)據(jù)流的定義 1
1.1.2 實時數(shù)據(jù)流的研究現(xiàn)狀 3
1.2 實時數(shù)據(jù)流聚類 5
1.3 實時數(shù)據(jù)流分類 6
1.3.1 Hoeffding樹算法 7
1.3.2 快速決策樹 8
1.3.3 概念自適應快速決策樹 8
1.3.4 分類器系綜 9
1.4 實時數(shù)據(jù)流頻繁模式挖掘 9
1.4.1 基于概率誤差區(qū)間 10
1.4.2 基于確定誤差區(qū)間 11
1.4.3 其他高效的挖掘算法 11
1.5 實時數(shù)據(jù)流關聯(lián)規(guī)則分析 11
1.5.1 多數(shù)據(jù)流的關聯(lián)度計算 12
1.5.2 多數(shù)據(jù)流的主分量計算 12
1.6 數(shù)據(jù)流挖掘應用系統(tǒng)研究 12
第2章 基于衰減窗口與剪枝維度樹的數(shù)據(jù)流聚類 14
2.1 聚類技術簡介 14
2.1.1 數(shù)據(jù)流聚類常用技術 14
2.1.2 衰減窗口模型及衰減因子 16
2.1.3 基本概念與定義 17
2.2 算法整體描述 77
2.3 周期性剪枝策略 25
2.4 實時數(shù)據(jù)流在線聚類 27
2.5 實驗結果與分析 27
2.5.1 基于二維人工實時數(shù)據(jù)流的聚類分析 28
2.5.2 二維人工實時數(shù)據(jù)流的演化 30
2.5.3 基于高維真實實時數(shù)據(jù)流的聚類分析 32
2.5.4 周期性剪枝效果分析 35
第3章 實時數(shù)據(jù)流動態(tài)模式發(fā)現(xiàn)與跟蹤方法 38
3.1 數(shù)據(jù)流模式簡介 38
3.1.1 實時數(shù)據(jù)流模式演化分析 38
3.1.2 基本的概念與定義 40
3.2 算法框架 43
3.3 模式存儲結構與模式快照策略 45
3.3.1 模式存儲結構 45
3.3.2 模式快照策略 47
3.4 模式發(fā)現(xiàn)與跟蹤算法 48
3.5 實驗結果與分析 51
3.5.1 基于二維人l:數(shù)據(jù)集的模式發(fā)現(xiàn)與跟蹤 51
3.5.2 真實數(shù)據(jù)集的模式發(fā)現(xiàn)跟蹤 53
3.5.3 實驗相關參數(shù)選擇 55
第4章 增量式聚類方法與網(wǎng)格劃分策略 57
4.1 增量式聚類方法 58
4.2 網(wǎng)格劃分策略 59
4.2.1 不均勻網(wǎng)格劃分 59
4.2.2 均勻網(wǎng)格劃分 60
第5章 基于網(wǎng)格和密度維度樹的增量聚類算法IGDStream 61
5.1 IGDStream算法主要思想 61
5.2 預測下一次聚類的時刻 62
5.3 聚類簇的變化 63
5.4 IGDStream算法整體框架 65
5.5 實驗結果與效率分析 66
5.5.1 實驗結果比較與分析 66
5.5.2 算法時問性能分析 71
5.5.3 實驗小結 72
第6章 基于密度維度樹的增量式網(wǎng)格聚類算法IGDDT 73
6.1 問題的提出 73
6.2 算法的基本思想 74
6.3 網(wǎng)格二次劃分與網(wǎng)格類型的確定 75
6.3.1 網(wǎng)格二次劃分 75
6.3.2 網(wǎng)格類型的確定 77
6.4 相鄰可聚類區(qū)域的判斷算法 78
6.5 IGDDT算法整體框架 79
6.5.1 初始聚類子算法 80
6.5.2 更新聚類的算法 81
6.6 實驗結果與分析 82
6.6.1 人工實時數(shù)據(jù)流聚類演化過程分析 82
6.6.2 二維仿真數(shù)據(jù)集聚類準確率比較 85
6.6.3 不同規(guī)模的數(shù)據(jù)集聚類速度比較 85
6.6.4 多維真實數(shù)據(jù)流的聚類結果比較 86
第7章 基于距離和密度的實時數(shù)據(jù)流聚類及其邊界檢測技術的研究 88
7.1 實時數(shù)據(jù)流聚類的基本概念與定義 88
7.2 算法框架 93
7.3 實時數(shù)據(jù)流中數(shù)據(jù)信息的存儲和更新 96
7.4 基于網(wǎng)格方法的實時數(shù)據(jù)流聚類 99
7.5 實時數(shù)據(jù)流的聚類邊界檢測 100
7.6 實驗結果與效率分析 101
7.6.1 實驗結果比較與分析 102
7.6.2 算法時問性能分析 107
7.6.3 實驗小結 107
第8章 實時數(shù)據(jù)流在鋼鐵質(zhì)量監(jiān)控中的應用 109
8.1 實時數(shù)據(jù)庫 110
8.1.1 實時數(shù)據(jù)庫的定義 110
8.1.2 PI系統(tǒng) 111
8.1.3 實時數(shù)據(jù)庫的應用 112
8.2 鋼鐵產(chǎn)品生產(chǎn)過程實時監(jiān)控系統(tǒng)架構 113
8.2.1 系統(tǒng)架構 113
8.2.2 功能模塊 113
8.3 實時數(shù)據(jù)的采集 114
8.4 系統(tǒng)數(shù)據(jù)處理模塊的實現(xiàn) 115
8.4.1 PIBatch數(shù)據(jù)定時計算并導出 115
8.4.2 鋼卷PDI數(shù)據(jù)解包 115
8.5 實時數(shù)據(jù)流分析 116
8.5.1 工藝在線監(jiān)控及報警 116
8.5.2 實時數(shù)據(jù)流預處理 118
8.5.3 產(chǎn)品離線質(zhì)量分析 120
8.5.4 產(chǎn)品在線質(zhì)量判定 123
8.6 實時數(shù)據(jù)流聚類方法的應用 126
8.6.1 數(shù)據(jù)預處理 126
8.6.2 不同鋼種質(zhì)量分析 127
8.6.3 鋼卷關鍵工藝點的相互影響 128
8.6.4 班組對產(chǎn)品質(zhì)量的影響 129
8.6.5 單個鋼卷質(zhì)量分析 129
參考文獻 131
后記 138