本書是為那些立志成為數(shù)據(jù)科學家的讀者準備的,深入淺出地講解了R語言的安裝、RStudio的操作和基礎(chǔ)知識,以及數(shù)據(jù)分析方法等工作中需要用到的重點內(nèi)容。從R數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)開始介紹語法技術(shù),包括對數(shù)據(jù)有作用的代碼和函數(shù)群,向量、矩陣、排列、數(shù)據(jù)幀等內(nèi)容,350個統(tǒng)計分析的實際運用方法。
R語言開源、免費,作為專門為統(tǒng)計和數(shù)據(jù)開發(fā)而開發(fā)的語言,功能齊全,比較穩(wěn)定成熟。機器學習、數(shù)據(jù)挖掘領(lǐng)域面臨著一些抽象自大量現(xiàn)實生活的問題,比如關(guān)聯(lián)規(guī)則挖掘、聚類、分類這三大問題。作為一個完備的工程計算包,R毫無疑問對它們都提供了足夠的支持。對于數(shù)據(jù)挖掘人員來說,R語言是技能。
第1章 配置R開發(fā)環(huán)境和R語言編程基礎(chǔ)
1-1 配置R語言開發(fā)環(huán)境
1-2 執(zhí)行R語言程序
1-3 項目實踐
第2章 數(shù)據(jù)操作的秘訣
2-1 向量和數(shù)據(jù)類型
2-2 向量的生成和操作
2-3 因子
2-4 將向量轉(zhuǎn)換為矩陣/數(shù)組
2-5 字符串向量
2-6 列表
2-7 矩陣
2-8 數(shù)據(jù)轉(zhuǎn)換
2-9 日期
第3章 文件操作的秘訣
3-1 操作文本文件
3-2 讀取Excel數(shù)據(jù)
第4章 基本編程的秘訣
4-1 程序的控制
4-2 創(chuàng)建函數(shù)
第5章 基本的描述統(tǒng)計學
5-1 描述統(tǒng)計量
5-2 順序統(tǒng)計量
5-3 多列的計算
5-4 直方圖
第6章 正態(tài)分布
6-1 標準正態(tài)分布和一般正態(tài)分布
第7章 統(tǒng)計估計
7-1 點估計
7-2 區(qū)間估計
第8章 統(tǒng)計假設(shè)檢驗
8-1 2檢驗
8-2 方差分析
第9章 回歸分析
9-1 相關(guān)分析
9-2 線性單回歸分析
9-3 線性多元回歸分析
9-4 非線性回歸分析
第10章 多變量分析
10-1聚類分析
10-2判別分析
10-3主成分分析
10-4因子分析
第11章 時間序列分析
11-1時間序列對象
11-2 AR模型
第12章 繪圖
12-1繪圖的基礎(chǔ)
12-2繪制多個組
12-3創(chuàng)建條形圖
12-4直方圖、正態(tài)QQ圖