數(shù)據(jù)科學統(tǒng)計基礎(chǔ)(數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)叢書)
定 價:49 元
叢書名:數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)叢書
- 作者:呂曉玲 黃丹陽
- 出版時間:2021/1/1
- ISBN:9787300286921
- 出 版 社:中國人民大學出版社
- 中圖法分類:C8
- 頁碼:324
- 紙張:
- 版次:1
- 開本:16
在數(shù)據(jù)科學的時代背景下,統(tǒng)計學作為一門學科基礎(chǔ)課和方法論課程,更強調(diào)的是統(tǒng)計思想在數(shù)據(jù)科學中的應(yīng)用。編寫教材、組織教學都是圍繞著這個核心內(nèi)容來安排的。我們不再將傳統(tǒng)的正態(tài)分布下的抽樣分布、參數(shù)估計、假設(shè)檢驗的理論和方法作為重點講述內(nèi)容, 而是將其融入到具體例子中進行講授,突出統(tǒng)計思維在其中的應(yīng)用.
本書首先介紹統(tǒng)計量的概念及其性質(zhì),在此基礎(chǔ)上介紹經(jīng)典統(tǒng)計的兩個重要內(nèi)容,參數(shù)估計和假設(shè)檢驗,將其作為統(tǒng)計研究問題中的兩個例子, 介紹統(tǒng)計研究方法的重要思想。之后介紹統(tǒng)計決策與貝葉斯方法。最后介紹基于再抽樣和數(shù)據(jù)重利用的統(tǒng)計方法與理論。本書的每個小節(jié)后面都有批判性思考題目,目的是引起討論、啟發(fā)思考。每章的最后一節(jié)介紹了與本章知識點相關(guān)的R語言操作, 包括本書介紹的各種方法的計算機實現(xiàn), 以及使用統(tǒng)計模擬來輔助各種方法的更深入理解等.
呂曉玲 中國人民大學統(tǒng)計學院教授,博士生導(dǎo)師;數(shù)據(jù)科學與大數(shù)據(jù)統(tǒng)計系系主任;中國人民大學數(shù)據(jù)挖掘中心主任。本科與碩士畢業(yè)于南開大學數(shù)學系概率統(tǒng)計專業(yè),博士畢業(yè)于香港城市大學管理科學系。曾經(jīng)是奧地利約翰開普勒大學應(yīng)用統(tǒng)計系以及美國加州大學伯克利分校統(tǒng)計系訪問學者。一直從事統(tǒng)計機器學習、數(shù)據(jù)科學領(lǐng)域的研究。主持教育部人文社會科學研究項目以及中國國家自然科學基金項目。學術(shù)論文在Journal of American Statistical Association, Journal of Electronic Commerce Research等SSCI/SCI檢索的國際學術(shù)期刊發(fā)表。
第 1章 數(shù)據(jù)及其描述 :統(tǒng)計量
1.1數(shù)據(jù)和變量
1.1.1數(shù)據(jù)的例子
1.1.2變量的類型
批判性思考
習題1.1
1.2總體、樣本和統(tǒng)計量
1.2.1總體和分布
1.2.2樣本
1.2.3統(tǒng)計量
批判性思考
習題 1.2
1.3從樣本認識總體的圖表方法
1.3.1頻數(shù)頻率表與直方圖
1.3.2餅圖與條形圖
1.3.3樣本的經(jīng)驗分布函數(shù)
1.3.4高維數(shù)據(jù)的圖表展示方法
1.3.5數(shù)據(jù)變換
批判性思考
習題 1.3
1.4次序統(tǒng)計量
1.4.1次序統(tǒng)計量的概念
1.4.2樣本極差
1.4.3樣本中位數(shù)與樣本 p分位數(shù)
1.4.4箱線圖和 Q–Q圖
批判性思考
習題 1.4
1.5抽樣分布
1.5.1樣本均值的抽樣分布
1.5.2正態(tài)總體各統(tǒng)計量的分布
1.5.3次序統(tǒng)計量的分布
1.5.4用隨機模擬法尋找統(tǒng)計量的近似分布
批判性思考
習題 1.5
1.6充分統(tǒng)計量
1.6.1充分統(tǒng)計量的概念
1.6.2因子分解定理
批判性思考
習題 1.6
1.7常用的概率分布族
1.7.1常用概率分布族表
1.7.2伽瑪分布族
1.7.3貝塔分布族
1.7.4指數(shù)型分布族
批判性思考
習題 1.7
1.8與本章相關(guān)的 R語言操作
1.8.1基本統(tǒng)計量的計算
1.8.2圖表
1.8.3隨機模擬統(tǒng)計量的抽樣分布
附錄:定理證明
第 2章 參數(shù)估計
2.1點估計與無偏性
批判性思考
習題2.1
2.2矩估計與相合性
2.2.1矩估計
2.2.2相合性
批判性思考
習題2.2
2.3最大似然估計與漸近正態(tài)性
2.3.1最大似然估計
2.3.2最大似然估計的不變原理
2.3.3最大似然估計的漸近正態(tài)性
2.3.4 EN算法
批判性思考
習題2.3
2.4最小方差無偏估計
2.4.1無偏估計的有效性
2.4.2有偏估計的均方誤差準則
2.4.3一致最小方差無偏估計
2.4.4完備性及其應(yīng)用
批判性思考
習題2.4
2.5 C-R不等式
2.5.1 C-R不等式
2.5.2有效估計
批判性思考
習題2.5
2.6置信區(qū)間
2.6.1置信區(qū)間概念
2.6.2樞軸量法
2.6.3大樣本置信區(qū)間
批判性思考
習題2.6
2.7正態(tài)總體參數(shù)的置信區(qū)間
2.7.1正態(tài)總體參數(shù)的置信區(qū)間
2.7.2二維參數(shù) (μ, σ2)的置信域
2.7.3樣本量的確定
批判性思考
習題2.7
2.8與本章相關(guān)的R語言操作
2.8.1隨機變量序列分布的演示
2.8.2最大似然估計
2.8.3 EM算法模擬實例
2.8.4區(qū)間估計的模擬結(jié)果
2.8.5均值、方差的區(qū)間估計
第3章假設(shè)檢驗
3.1假設(shè)檢驗的概念與步驟
3.1.1假設(shè)檢驗問題
3.1.2假設(shè)檢驗的步驟
批判性思考
習題3.1
3.2正態(tài)總體參數(shù)和比率的檢驗
3.2.1正態(tài)均值μ的檢驗
3.2.2其他正態(tài)總體參數(shù)的檢驗
3.2.3成對數(shù)據(jù)的t檢驗
3.2.4比率的推斷
3.2.5幾個說明
批判性思考
習題3.2
3.3分布的檢驗
3.3.1離散分布的X2擬合優(yōu)度檢驗
3.3.2連續(xù)分布的檢驗
批判性思考
習題3.3
3.4大規(guī)模假設(shè)檢驗與FDR
3.4.1大規(guī)模假設(shè)檢驗
3.4.2 FDR方法介紹
批判性思考
習題3.4
3.5與本章相關(guān)的R語言操作
3.5.1正態(tài)總體的參數(shù)檢驗
3.5.2比率檢驗
3.5.3假設(shè)檢驗的一個人為例子
3.5.4 X2擬合優(yōu)度檢驗
3.5.5夏皮洛—威爾克檢驗
3.5.6柯莫哥洛夫—斯米爾諾夫檢驗
3.5.7 FDR例子
第4章統(tǒng)計決策與貝葉斯方法
4.1統(tǒng)計決策的基本概念
4.1.1統(tǒng)計決策問題的三要素
4.1.2統(tǒng)計決策函數(shù)與風險函數(shù)
批判性思考
習題 4.1
4.2貝葉斯點估計
4.2.1先驗分布與貝葉斯公式
4.2.2先驗分布
4.2.3貝葉斯風險與貝葉斯點估計
4.2.4兩個注釋
批判性思考
習題 4.2
4.3貝葉斯區(qū)間估計
4.3.1可信區(qū)間
4.3.2最大后驗密度 (HPD)可信區(qū)間
批判性思考
習題 4.3
4.4貝葉斯假設(shè)檢驗
批判性思考
習題 4.4
4.5與本章相關(guān)的 R語言操作
4.5.1不同先驗的對比
4.5.2貝葉斯區(qū)間估計
第 5章再抽樣方法
5.1自助法參數(shù)估計
5.1.1標準誤差的自助法估計
5.1.2偏差的自助法估計
5.1.3自助法的區(qū)間估計
5.1.4討論
批判性思考
習題 5.1
5.2 Jackknife
5.2.1 Jackknife方法介紹
5.2.2 Jackknife和自助法的聯(lián)系
批判性思考
習題 5.2
5.3再抽樣假設(shè)檢驗
5.3.1置換檢驗
5.3.2自助法假設(shè)檢驗
批判性思考
習題 5.3
5.4交叉驗證
5.4.1交叉驗證簡介
5.4.2進一步討論
批判性思考
習題 5.4
5.5數(shù)據(jù)科學中的 PCS準則
5.5.1 DSLC中的 PCS準則
5.5.2通過擾動分析進行 PCS推斷
批判性思考
習題 5.5
5.6與本章相關(guān)的 R語言操作
5.6.1自助法
5.6.2 Jackknife
5.6.3假設(shè)檢驗
5.6.4交叉驗證
5.6.5數(shù)據(jù)科學中的 PCS準則
附錄 R語言簡介
A.1 R軟件簡介
A.1.1 R軟件的簡單介紹
A.1.2 R軟件的安裝
A.2數(shù)據(jù)的類型結(jié)構(gòu)
A.2.1數(shù)據(jù)的類型
A.2.2數(shù)據(jù)的結(jié)構(gòu)
A.2.3缺失數(shù)據(jù)的處理
A.3 R的基本操作
A.3.1數(shù)據(jù)的輸入和輸出
A.3.2控制結(jié)構(gòu)
A.3.3自定義函數(shù)
A.3.4畫圖
A.4概率分布
參考文獻