非結(jié)構(gòu)化數(shù)據(jù)處理技術及應用
定 價:132 元
叢書名:普通高等教育“十三五”規(guī)劃教材普通高等院校工程實踐系列規(guī)劃教材
- 作者:陳燕,李桃迎,張金松編著
- 出版時間:2017/12/1
- ISBN:9787030531889
- 出 版 社:科學出版社
- 中圖法分類:TP274
- 頁碼:
- 紙張:膠版紙
- 版次:1
- 開本:16K
《非結(jié)構(gòu)化數(shù)據(jù)處理技術及應用》系統(tǒng)詳細地闡述了非結(jié)構(gòu)化數(shù)據(jù)的處理方法與技術。通過對非結(jié)構(gòu)化數(shù)據(jù)特點的分析,從非結(jié)構(gòu)化數(shù)據(jù)的基礎知識和理論、開源工具及應用舉例、數(shù)據(jù)預處理、預測模型研究、網(wǎng)頁數(shù)據(jù)的采集、非關系型數(shù)據(jù)庫存儲、結(jié)構(gòu)化大數(shù)據(jù)分析平臺、電商個性化推薦系統(tǒng)的應用、網(wǎng)購評語情感挖掘、全文檢索技術、基于主題的檢索系統(tǒng)等不同角度給出了結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的分析、挖掘與應用內(nèi)容。
更多科學出版社服務,請掃碼獲取。
目錄
基礎知識篇
第1章 非結(jié)構(gòu)化數(shù)據(jù)的基礎知識 3
1.1 大數(shù)據(jù)的基本概念 3
1.2 非結(jié)構(gòu)化數(shù)據(jù)的基本概念 11
1.3 非結(jié)構(gòu)化數(shù)據(jù)研究的必要性 12
1.4 非結(jié)構(gòu)化數(shù)據(jù)挖掘的研究領域 13
第2章 非結(jié)構(gòu)化數(shù)據(jù)挖掘的基礎理論 18
2.1 數(shù)據(jù)挖掘 18
2.2 數(shù)據(jù)挖掘與其他技術的關系 29
2.3 圖像挖掘 33
2.4 視頻挖掘 34
第3章 非結(jié)構(gòu)化數(shù)據(jù)挖掘的開源工具及應用舉例 37
3.1 WEKA 37
3.2 R語言簡介 49
結(jié)構(gòu)化數(shù)據(jù)挖掘技術篇
第4章 數(shù)據(jù)預處理技術 61
4.1 數(shù)據(jù)預處理 62
4.2 數(shù)據(jù)清理 63
4.3 數(shù)據(jù)集成和融合 66
4.4 數(shù)據(jù)變換 67
4.5 數(shù)據(jù)歸約 70
第5章 預測模型研究與應用 75
5.1 預測模型的基礎理論 75
5.2 回歸分析預測模型 77
5.3 趨勢外推預測模型 92
5.4 時間序列預測模型 99
5.5 基于神經(jīng)網(wǎng)絡的預測模型 111
5.6 馬爾可夫預測模型 124
第6章 網(wǎng)頁數(shù)據(jù)的采集技術 129
6.1 網(wǎng)站信息采集相關技術研究 129
6.2 基于爬蟲的網(wǎng)站信息采集技術整合設計 138
6.3 基于爬蟲的網(wǎng)站信息采集技術整合實現(xiàn) 155
第7章 非關系型數(shù)據(jù)庫存儲技術 168
7.1 非關系型數(shù)據(jù)庫系統(tǒng)發(fā)展的必然性 168
7.2 非關系型數(shù)據(jù)庫理論 174
7.3 非關系型數(shù)據(jù)庫的使用范例 180
非結(jié)構(gòu)化數(shù)據(jù)挖掘方法及應用篇
第8章 非結(jié)構(gòu)化大數(shù)據(jù)的分析平臺 193
8.1 HDFS海量存儲 195
8.2 Map Reduce 200
8.3 Spark 207
第9章 電商個性化推薦系統(tǒng)的應用 211
9.1 國內(nèi)外研究現(xiàn)狀 211
9.2 電子商務個性化推薦系統(tǒng)理論與技術介紹 212
9.3 基于協(xié)同過濾的個性化推薦算法研究與優(yōu)化 226
9.4 基于移動平臺的電商個性化推薦系統(tǒng)設計與實現(xiàn) 243
第10章 網(wǎng)購評語情感挖掘的應用 272
10.1 國內(nèi)外研究現(xiàn)狀 272
10.2 情感挖掘理論知識基礎 275
10.3 改進情感傾向模型的建立 291
10.4 改進情感傾向模型的應用驗證 300
10.5 基于情感挖掘的預測分析應用 315
參考文獻 329
附錄一 肯定性和否定性參考詞組問卷調(diào)查 340
附錄二 特殊程度詞的影響程度問卷調(diào)查 341