R語言:從數(shù)據(jù)思維到數(shù)據(jù)實戰(zhàn)
如何從數(shù)據(jù)中挖掘價值?一是要鍛煉數(shù)據(jù)思維;二是需要選擇一個便利快捷的工具。R語言在數(shù)據(jù)分析方面有著靈活、高效的優(yōu)勢。本書以R語言為基礎(chǔ),深度講解從數(shù)據(jù)思維到實戰(zhàn)的全過程。在章節(jié)組織上,本從R語言簡介及優(yōu)勢入手,再到數(shù)據(jù)讀取、清洗、描述、建模等數(shù)據(jù)分析的各個環(huán)節(jié),由淺入深逐個講解,是一本實務(wù)分析中的“R語言指南”。同時,本書采用大量實際案例輔以說明,既有助于上手分析,也可用于教學(xué)使用。
本書所有代碼、數(shù)據(jù)可在狗熊會官網(wǎng)(http://www.xiong99.com.cn/create.php)免費下載。同時,關(guān)注狗熊會微信公眾號,可獲取更多擴(kuò)展資源。
朱雪寧 復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院助理教授。博士畢業(yè)于北京大學(xué)光華管理學(xué)院商務(wù)統(tǒng)計系,后于賓州州立大學(xué)(Pennsylvania State University)從事博士后研究工作。狗熊會創(chuàng)始團(tuán)隊成員、《R語千尋》專欄負(fù)責(zé)人;統(tǒng)計之都核心成員、編輯部主編。研究上關(guān)注社交網(wǎng)絡(luò)數(shù)據(jù)分析、高維數(shù)據(jù)分析等問題。
第1章初識R語言
1.1初識R語言
1.2安裝R語言
1.3獲取R幫助文檔
第2章R語言數(shù)據(jù)操作
2.1R中的數(shù)據(jù)類型
2.2數(shù)據(jù)讀入
第3章R語言與統(tǒng)計分析
3.1描述分析及可視化
3.2統(tǒng)計檢驗
3.3回歸分析
3.4代碼規(guī)范與文檔撰寫
第4章R語言與非結(jié)構(gòu)化數(shù)據(jù)分析
4.1文本分析
4.2圖像分析
第5章R語言與機(jī)器學(xué)習(xí)
5.1機(jī)器學(xué)習(xí)概述
5.2數(shù)據(jù)預(yù)處理
5.3模型訓(xùn)練與調(diào)參
5.4模型訓(xùn)練與集成
第6章R語言爬蟲初介
6.1HTML基礎(chǔ)與R語言解析
6.2XML與XPath表達(dá)式以及R爬蟲應(yīng)用
6.3HTTP協(xié)議
6.4AJAX與網(wǎng)頁動態(tài)加載
6.5正則表達(dá)式與字符串處理函數(shù)
6.6R語言爬蟲實戰(zhàn)