R語言數(shù)據(jù)挖掘(第2版)(21世紀統(tǒng)計學系列教材)
定 價:55 元
叢書名:21世紀統(tǒng)計學系列教材
- 作者:薛薇
- 出版時間:2018/7/1
- ISBN:9787300258256
- 出 版 社:中國人民大學出版社
- 中圖法分類:TP312R
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:128開
數(shù)據(jù)挖掘,繼承和發(fā)展經(jīng)典統(tǒng)計分析的理論成果,結合現(xiàn)代機器學習方法,借助大規(guī)模高性能計算不斷逼近大數(shù)據(jù)規(guī)律真相,突破了傳統(tǒng)數(shù)據(jù)分析方法的大數(shù)據(jù)應用局限;R語言,以其開源性、易用性、全面性、前沿性和可擴充性,是實現(xiàn)大數(shù)據(jù)分析實踐的有效工具!禦語言數(shù)據(jù)挖掘》努力堅持:講明白理論原理,講明白案例問題,講明白實現(xiàn)步驟,講明白結果含義的寫作風格,圍繞大數(shù)據(jù)分析的四大核心問題:建立數(shù)據(jù)預測模型,揭示數(shù)據(jù)內在結構,探究數(shù)據(jù)關聯(lián)性,診斷異常數(shù)據(jù),以應用案例為線索,深入淺出地討論了眾多經(jīng)典數(shù)據(jù)挖掘方法原理,完整詳細地講解了R語言實現(xiàn)過程。本書可作為高等院校統(tǒng)計學、數(shù)據(jù)科學和大數(shù)據(jù)技術、大數(shù)據(jù)管理等相關專業(yè)本科生和研究生數(shù)據(jù)挖掘、機器學習和其他數(shù)據(jù)分析課程的教材,也可作為科研機構、政府和企業(yè)經(jīng)營管理部門等研究人員參考用書。
薛薇,中國人民大學應用統(tǒng)計中心副主任,中國人民大學統(tǒng)計學院副教授。主要研究領域:數(shù)據(jù)挖掘、文本挖掘、復雜網(wǎng)絡建模。關注統(tǒng)計和數(shù)據(jù)挖掘算法及軟件應用,統(tǒng)計數(shù)據(jù)庫系統(tǒng)研發(fā)等方面。涉足交通、金融、貿易等復雜網(wǎng)絡動態(tài)建模,電商數(shù)據(jù)分析,網(wǎng)絡新媒體輿論傳播、熱點事件主題跟蹤和預測建模,政府和官方微博、學科學術熱點跟蹤等文本挖掘,以及社會網(wǎng)絡分析和以數(shù)據(jù)挖掘為依托的客戶關系管理等領域。
第1章數(shù)據(jù)挖掘與R語言概述
1.1什么是數(shù)據(jù)挖掘
1.2數(shù)據(jù)挖掘的結果
1.3數(shù)據(jù)挖掘能做什么
1.4數(shù)據(jù)挖掘方法的特點
1.5數(shù)據(jù)挖掘的典型應用
1.6R語言入門必備
1.7RStudio簡介
1.8本章函數(shù)列表
第2章R的數(shù)據(jù)組織和整理
2.1R的數(shù)據(jù)對象
2.2向量的創(chuàng)建和訪問
2.3矩陣的創(chuàng)建和訪問
2.4數(shù)據(jù)框的創(chuàng)建和訪問
2.5數(shù)組和列表的創(chuàng)建和訪問
2.6數(shù)據(jù)對象的相互轉換
2.7導入外部數(shù)據(jù)和保存數(shù)據(jù)
2.8R語言程序設計基礎
2.9R語言數(shù)據(jù)整理和程序設計綜合應用
2.10本章函數(shù)列表
第3章R的數(shù)據(jù)可視化
3.1繪圖基礎
3.2單變量分布特征的可視化
3.3多變量聯(lián)合分布特征的可視化
3.4變量間相關性的可視化
3.5GIS數(shù)據(jù)的可視化
3.6文本詞頻數(shù)據(jù)的可視化
3.7本章函數(shù)列表
第4章R的近鄰分析:數(shù)據(jù)預測
4.1近鄰分析:K近鄰法
4.2基于變量重要性的加權K近鄰法
4.3基于觀測相似性的加權K近鄰法
4.4本章函數(shù)列表
第5章R的決策樹:數(shù)據(jù)預測
5.1決策樹算法概述
5.2分類回歸樹的生長過程
5.3分類回歸樹的剪枝
5.4分類回歸樹的R函數(shù)和應用示例
5.5建立分類回歸樹的組合預測模型
5.6隨機森林
5.7本章函數(shù)列表
第6章R的人工神經(jīng)網(wǎng)絡:數(shù)據(jù)預測
6.1人工神經(jīng)網(wǎng)絡概述
6.2BP反向傳播網(wǎng)絡
6.3BP反向傳播網(wǎng)絡的R函數(shù)和應用示例
6.4本章函數(shù)列表
第7章R的支持向量機:數(shù)據(jù)預測
7.1支持向量分類概述
7.2線性可分問題下的支持向量分類
7.3廣義線性可分問題下的支持向量分類
7.4線性不可分問題下的支持向量分類
7.5多分類的支持向量分類
7.6支持向量回歸
7.7R的支持向量機及應用示例
7.8本章函數(shù)列表
第8章R的一般聚類:揭示數(shù)據(jù)內在結構
8.1聚類分析概述
8.2基于質心的聚類模型:KMeans聚類
8.3基于質心的聚類模型:PAM聚類
8.4基于聯(lián)通性的聚類模型:層次聚類
8.5基于統(tǒng)計分布的聚類模型:EM聚類
8.6本章函數(shù)列表
第9章R的特色聚類:揭示數(shù)據(jù)內在結構
9.1BIRCH聚類
9.2SOM網(wǎng)絡聚類
9.3基于密度的聚類模型:DBSCAN聚類
9.4本章函數(shù)列表
第10章R的關聯(lián)分析:揭示數(shù)據(jù)關聯(lián)性
10.1簡單關聯(lián)規(guī)則及其測度
10.2Apriori算法及應用示例
10.3Eclat算法及應用示例
10.4簡單關聯(lián)分析的應用示例
10.5序列關聯(lián)分析及SPADE算法
10.6本章函數(shù)列表
第11章R的模式甄別:診斷異常數(shù)據(jù)
11.1模式甄別方法和評價概述
11.2模式甄別的無監(jiān)督偵測方法及應用示例
11.3模式甄別的有監(jiān)督偵測方法及應用示例
11.4模式甄別的半監(jiān)督偵測方法及應用示例
11.5本章函數(shù)列表
第12章R的網(wǎng)絡分析初步
12.1網(wǎng)絡的定義、表示及構建
12.2網(wǎng)絡節(jié)點重要性的測度
12.3網(wǎng)絡子群構成特征研究
12.4網(wǎng)絡整體特征刻畫
12.5主要網(wǎng)絡類型及特點
12.6本章函數(shù)列表R語言數(shù)據(jù)挖掘