數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫?/p>
定 價:69 元
- 作者:陳封能 ,斯坦巴赫 ,庫瑪爾 著 范明 譯
- 出版時間:2011/1/1
- ISBN:9787115241009
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.13
- 頁碼:463
- 紙張:膠版紙
- 版次:2
- 開本:16開
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫啡娼榻B了數(shù)據(jù)挖掘的理論和方法,旨在為讀者提供將數(shù)據(jù)挖掘應(yīng)用于實際問題所必需的知識!稊(shù)據(jù)挖掘?qū)д摚ㄍ暾妫泛w五個主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都包含兩章:前面一章講述基本概念、代表性算法和評估技術(shù),后面一章較深入地討論高級概念和算法。目的是使讀者在透徹地理解數(shù)據(jù)挖掘基礎(chǔ)的同時,還能了解更多重要的高級主題。此外,書中還提供了大量示例、圖表和習題。
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫愤m合作為相關(guān)專業(yè)高年級本科生和研究生數(shù)據(jù)挖掘課程的教材,同時也可作為數(shù)據(jù)挖掘研究和應(yīng)用開發(fā)人員的參考書。
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫啡娼榻B了數(shù)據(jù)挖掘,涵蓋了五個主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章。前一章涵蓋基本概念、代表性算法和評估技術(shù),而后一章討論高級概念和算法。這樣讀者在透徹地理解數(shù)據(jù)挖掘的基礎(chǔ)的同時,還能夠了解更多重要的高級主題!稊(shù)據(jù)挖掘?qū)д摚ㄍ暾妫肥敲髂崽K達大學和密歇根州立大學數(shù)據(jù)挖掘課程的教材,由于獨具特色,正式出版之前就已經(jīng)被斯坦福大學、得克薩斯大學奧斯汀分校等眾多名校采用。《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫诽厣c許多其他同類圖書不同,《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫穼⒅攸c放在如何用數(shù)據(jù)挖掘知識解決各種實際問題。 只要求具備很少的預備知識——不需要數(shù)據(jù)庫背景,只需要很少的統(tǒng)計學或數(shù)學背景知識。 書中包含大量的圖表、綜合示例和豐富的習題,并且使用示例、關(guān)鍵算法的簡潔描述和習題,盡可能直接聚焦于數(shù)據(jù)挖掘的主要概念。 教輔內(nèi)容極為豐富,包括課程幻燈片、學生課題建議、數(shù)據(jù)挖掘資源(如數(shù)據(jù)挖掘算法和數(shù)據(jù)集)、聯(lián)機指南(使用實際的數(shù)據(jù)集和數(shù)據(jù)分析軟件,《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫方榻B的部分數(shù)據(jù)挖掘技術(shù)提供例子講解)。
陳封能(Pang-Ning Tan)現(xiàn)為密歇根州立大學計算機與工程系助理教授,主要教授數(shù)據(jù)挖掘、數(shù)據(jù)庫系統(tǒng)等課程。此前,他曾是明尼蘇達大學美國陸軍高性能計算研究中心副研究員(2002-2003)。 斯坦巴赫(Michael Steinbach)明尼蘇達大學計算機與工程系研究員,在讀博士。 庫瑪爾(Vipin Kumar)明尼蘇達大學計算機科學與工程系主任,曾任美國陸軍高性能計算研究中心主任。他擁有馬里蘭大學博士學位,是數(shù)據(jù)挖掘和高性能計算方面的國際權(quán)威,IEEE會士。 范明,鄭州大學信息工程學院教授,中國計算機學會數(shù)據(jù)庫專業(yè)委員會委員、人工智能與模式識別專業(yè)委員會委員,長期從事計算機軟件與理論教學和研究。先后發(fā)表論史40余篇。 范宏建 澳大利亞墨爾本大學計算機科學博士。先后在WWW、PAKDD、RSFDGrC、IEEE GrC和Australian AI等國際學術(shù)會議和IEEE Transactions on Knowledge and Data Engineering發(fā)表論文10余篇。目前是澳大利亞AUSTRAC的高級分析師。
第1章 緒論
1.1 什么是數(shù)據(jù)挖掘
1.2 數(shù)據(jù)挖掘要解決的問題
1.3 數(shù)據(jù)挖掘的起源
1.4 數(shù)據(jù)挖掘任務(wù)
1.5 本書的內(nèi)容與組織
文獻注釋
參考文獻
習題
第2章 數(shù)據(jù)
2.1 數(shù)據(jù)類型
2.1.1 屬性與度量
2.1.2 數(shù)據(jù)集的類型
2.2 數(shù)據(jù)質(zhì)量
2.2.1 測量和數(shù)據(jù)收集問題
2.2.2 關(guān)于應(yīng)用的問題
2.3 數(shù)據(jù)預處理
2.3.1 聚集
2.3.2 抽樣
2.3.3 維歸約
2.3.4 特征子集選擇
2.3.5 特征創(chuàng)建
2.3.6 離散化和二元化
2.3.7 變量變換
2.4 相似性和相異性的度量
2.4.1 基礎(chǔ)
2.4.2 簡單屬性之間的相似度和相異度
2.4.3 數(shù)據(jù)對象之間的相異度
2.4.4 數(shù)據(jù)對象之間的相似度
2.4.5 鄰近性度量的例子
2.4.6 鄰近度計算問題
2.4.7 選取正確的鄰近性度量
文獻注釋
參考文獻
習題
第3章 探索數(shù)據(jù)
第4章 分類:基本概念、決策樹與模型評估
第5章 分類:其他技術(shù)
第6章 關(guān)聯(lián)分析:基本概念和算法
第7章 關(guān)聯(lián)分析:高級概念
第8章 聚類分析:基本概念和算法
第9章 聚類分析:其他問題與算法
第10章 異常檢測
文獻注釋
參考文獻
習題
附錄a 線性代數(shù)
附錄b 維歸約
附錄c 概率統(tǒng)計
附錄d 回歸
附錄e 優(yōu)化