基于R的統(tǒng)計分析與數(shù)據(jù)挖掘
定 價:48 元
叢書名:統(tǒng)計數(shù)據(jù)分析與應用叢書
- 作者:薛薇
- 出版時間:2014/5/1
- ISBN:9787300190747
- 出 版 社:中國人民大學出版社
- 中圖法分類:C819
- 頁碼:
- 紙張:膠版紙
- 版次:1
- 開本:16開
薛薇博士編著的這本《基于R的統(tǒng)計分析與數(shù)據(jù) 挖掘》聚焦當今備受國內(nèi)外數(shù)據(jù)分析師和數(shù)據(jù)應用者 關(guān)注的R語言,關(guān)注如何借助R實現(xiàn)統(tǒng)計分析和數(shù)據(jù)挖 掘。它既不是僅側(cè)重理論講解的統(tǒng)計分析和數(shù)據(jù)挖掘 教科書,也不是僅側(cè)重R編程操作的使用手冊,而是 以數(shù)據(jù)分析貫穿全書的兩者的有機結(jié)合。
本書特色在于:以數(shù)據(jù)模擬的直觀方式論述方法 原理的同時,通過案例強化R的操作實踐性;在以解 決應用問題為目標討論R操作的同時,通過原理論述 強化模型結(jié)果的解讀理解。
《基于R的統(tǒng)計分析與數(shù)據(jù)挖掘》定位于統(tǒng)計分 析和數(shù)據(jù)挖掘的學習者、實踐者和研究者,旨在使讀 者理解統(tǒng)計分析原理,熟練操控R軟件,拓展數(shù)據(jù)應 用,提升研究水平。
本書配套數(shù)據(jù)文件 前往中國人民大學出版社 http://www.crup.com.cn/Item/123831.aspx 進行注冊下載(本資源為開放資源,網(wǎng)站注冊會員即可下載)薛薇博士編著的這本《基于R的統(tǒng)計分析與數(shù)據(jù)挖掘》聚焦當今備受國內(nèi)外數(shù)據(jù)分析師和數(shù)據(jù)應用者關(guān)注的R語言,企圖借助R實現(xiàn)統(tǒng)計分析和數(shù)據(jù)挖掘。理由很簡單:R不僅囊括了幾乎所有的經(jīng)典統(tǒng)計方法,而且擁有眾多前沿的現(xiàn)代統(tǒng)計模型、數(shù)據(jù)挖掘算法以及頂尖的繪圖功能;不僅可以解決數(shù)據(jù)分析的共性問題,而且能夠服務于電商、金融、醫(yī)學、生物、地理、環(huán)境、傳媒等領(lǐng)域的特色數(shù)據(jù)應用;不僅適合統(tǒng)計分析的學習者、學術(shù)研究的探索者,而且適合致力數(shù)據(jù)應用開發(fā)的實踐者和掘金者。
薛薇,工學碩士、經(jīng)濟學博士,中國人民大學統(tǒng)計學院副教授,教育部人文社會科學重點研究基地:中國人民大學應用統(tǒng)計學科研究中心副主任。關(guān)注數(shù)據(jù)挖掘及統(tǒng)計分析方法,統(tǒng)計和數(shù)據(jù)挖掘軟件應用,統(tǒng)計數(shù)據(jù)庫系統(tǒng)研發(fā)等方面,涉足網(wǎng)絡(luò)新媒體傳播和互動模式建模、政府和官方微博分析、學科學術(shù)熱點跟蹤等文本挖掘和統(tǒng)計應用領(lǐng)域,以及以數(shù)據(jù)挖掘為依托的客戶關(guān)系管理等。主要代表作:《SPSS統(tǒng)計分析方法及應用》、《Clementine數(shù)據(jù)挖掘方法及應用》、《基于信息技術(shù)的統(tǒng)計信息系統(tǒng)》。
第1章 關(guān)于R 1.1 為什么選擇R 1.2 如何學習R 1.3 R入門必備 1.4 小結(jié)第2章 R的數(shù)據(jù)組織 2.1 R的數(shù)據(jù)對象 2.2 創(chuàng)建和訪問R的數(shù)據(jù)對象 2.3 從文 第1章 關(guān)于R 1.1 為什么選擇R 1.2 如何學習R 1.3 R入門必備 1.4 小結(jié)第2章 R的數(shù)據(jù)組織 2.1 R的數(shù)據(jù)對象 2.2 創(chuàng)建和訪問R的數(shù)據(jù)對象 2.3 從文本文件讀數(shù)據(jù) 2.4 外部數(shù)據(jù)的導入 2.5 R數(shù)據(jù)組織的其他問題 2.6 小結(jié)第3章 R的數(shù)據(jù)管理 3.1 數(shù)據(jù)合并 3.2 數(shù)據(jù)排序 3.3 缺失數(shù)據(jù)報告 3.4 變量計算 3.5 變量值的重編碼 3.6 數(shù)據(jù)篩選 3.7 數(shù)據(jù)保存 3.8 數(shù)據(jù)管理中控制流程 3.9 小結(jié)第4章 R的基本數(shù)據(jù)分析:描述和相關(guān) 4.1 數(shù)值型單變量的描述 4.2 分類型單變量的描述 4.3 兩數(shù)值型變量相關(guān)性的分析 4.4 兩分類型變量相關(guān)性的分析 4.5 小結(jié)第5章 R的基本數(shù)據(jù)分析:可視化 5.1 繪圖基礎(chǔ) 5.2 數(shù)值型單變量分布的可視化 5.3 分類型變量分布和相關(guān)性的可視化 5.4 兩數(shù)值型變量相關(guān)性的可視化 5.5 lattice繪圖 5.6 小結(jié)第6章 R的兩均值比較檢驗 6.1 兩獨立樣本的均值檢驗 6.2 兩配對樣本的均值檢驗 6.3 樣本均值檢驗的功效分析 6.4 兩總體分布差異的非參數(shù)檢驗 6.5 兩樣本均值差的置換檢驗 6.6 兩樣本均值差的自舉法檢驗 6.7 小結(jié)第7章 R的方差分析 7.1 單因素方差分析 7.2 單因素協(xié)方差分析 7.3 多因素方差分析 7.4 小結(jié)第8章 R的回歸分析:一般線性模型 8.1 回歸分析概述 8.2 建立線性回歸模型 8.3 線性回歸方程的檢驗 8.4 回歸診斷:誤差項是否滿足高斯馬爾科夫假定 8.5 回歸診斷:診斷數(shù)據(jù)中的異常觀測點 8.6 回歸診斷:多重共線性的診斷 8.7 回歸建模策略 8.8 回歸模型驗證 8.9 帶虛擬變量的線性回歸分析 8.10 小結(jié)第9章 R的回歸分析:廣義線性模型 9.1 廣義線性模型概述 9.2 logistic回歸分析:連接函數(shù)和參數(shù)估計 9.3 logistic回歸分析:解讀模型和模型檢驗 9.4 logistic回歸分析:R函數(shù)和示例 9.5 logistic回歸分析:回歸診斷 9.6 泊松回歸分析 9.7 廣義線性模型的交叉驗證 9.8 小結(jié)第10章 R的聚類分析 10.1 聚類分析概述 10.2 K-Means聚類 10.3 層次聚類 10.4 兩步聚類 10.5 小結(jié)第11章 R的因子分析:變量降維 11.1 因子分析概述 11.2 構(gòu)造因子變量:基于主成分分析法 11.3 構(gòu)造因子變量:基于主軸因子法 11.4 因子變量的命名 11.5 計算因子得分 11.6 小結(jié)第12章 R的線性判別分析:分類模型 12.1 距離判別 12.2 Fisher判別 12.3 小結(jié)第13章 R的決策樹:預測模型 13.1 決策樹算法概述 13.2 分類回歸樹的生長過程 13.3 分類回歸樹的剪枝 13.4 建立分類回歸樹的R函數(shù)和示例 13.5 建立分類回歸樹的組合預測模型 13.6 隨機森林 13.7 小結(jié)第14章 R的人工神經(jīng)網(wǎng)絡(luò):預測和聚類 14.1 人工神經(jīng)網(wǎng)絡(luò)概述 14.2 B-P反向傳播網(wǎng)絡(luò) 14.3 B-P反向傳播網(wǎng)絡(luò)的R函數(shù)和示例 14.4 SOM自組織映射網(wǎng)絡(luò) 14.5 小結(jié)