當(dāng)今是一個(gè)大數(shù)據(jù)的時(shí)代,人們已經(jīng)生活在數(shù)據(jù)的海洋之中。本書嘗試了解學(xué)習(xí)者的想法和需要,強(qiáng)調(diào)統(tǒng)計(jì)學(xué)的基本概念,突出數(shù)據(jù),使用R軟件為讀者呈現(xiàn)可見即可得的統(tǒng)計(jì)分析過程,讓讀者能夠輕松、愉快地了解統(tǒng)計(jì)的基本思想和應(yīng)用價(jià)值。本書可讀性強(qiáng),語言輕松活潑,內(nèi)容通俗易懂。 本書可作為高等學(xué)校理、工、農(nóng)、醫(yī)、經(jīng)濟(jì)、管理、人文社會科學(xué)專業(yè)的統(tǒng)計(jì)學(xué)教材,也可以供從事商務(wù)活動和經(jīng)濟(jì)分析等實(shí)際工作的各類人員參考。
當(dāng)今是一個(gè)大數(shù)據(jù)的時(shí)代,大數(shù)據(jù)的概念已經(jīng)深入人心。毫不夸張地說,人們已經(jīng)生活在數(shù)據(jù)的海洋之中。各行各業(yè)、不同人群都聽說過大數(shù)據(jù),了解統(tǒng)計(jì)方法。而數(shù)據(jù)到信息、再到知識,需要用統(tǒng)計(jì)方法揭示出來。數(shù)據(jù)不僅限于數(shù)字,也可能是圖表或者文字、音樂、視頻等。統(tǒng)計(jì)學(xué)是數(shù)據(jù)的科學(xué)和藝術(shù),其所分析的對象就是數(shù)據(jù)。統(tǒng)計(jì)學(xué)與各個(gè)學(xué)科的數(shù)據(jù)都有聯(lián)系,幾乎應(yīng)用于所有領(lǐng)域。這就決定了大多數(shù)統(tǒng)計(jì)應(yīng)用不是由統(tǒng)計(jì)學(xué)家實(shí)施的,而是由實(shí)際工作者(包括目前正在學(xué)習(xí)統(tǒng)計(jì)學(xué)的本科生、研究生)完成的。作為一個(gè)數(shù)據(jù)接收者或者使用者,在日常生活和工作中,了解統(tǒng)計(jì)學(xué)的基本概念以及懂得如何用統(tǒng)計(jì)手段去解決問題是非常重要的。
根據(jù)作者多年的教學(xué)經(jīng)驗(yàn),一本好的教材要以人為本,不僅重視傳授統(tǒng)計(jì)學(xué)科的特點(diǎn),也要了解讀者學(xué)習(xí)統(tǒng)計(jì)的需求。因此,本書非常重視統(tǒng)計(jì)學(xué)的基本概念、公式和方法,這有助于讀者了解統(tǒng)計(jì)方法和思想的精髓。很多煩瑣的計(jì)算則交給統(tǒng)計(jì)軟件去完成,讓讀者結(jié)合數(shù)據(jù)理解相關(guān)統(tǒng)計(jì)方法,突出各種統(tǒng)計(jì)方法的介紹和使用。
本書的最大特色就是在干中學(xué),極大地方便了讀者的理解和學(xué)習(xí)。使用非常方便的R軟件使得統(tǒng)計(jì)技術(shù)不再枯燥,不僅為讀者呈現(xiàn)了可見即可得的數(shù)據(jù)分析過程,而且這種便捷性有助于讀者馬上動手實(shí)踐,能更好地體會不同類型和結(jié)構(gòu)的數(shù)據(jù)需要何種合適的統(tǒng)計(jì)方法,從而得到最大的啟發(fā),進(jìn)而有興趣掌握統(tǒng)計(jì)的基本概念和方法,在潛移默化中輕松、愉快地了解統(tǒng)計(jì)的基本思想。數(shù)據(jù)和方法的大量使用也使得本書內(nèi)容通俗易懂,語言輕松活潑,可讀性強(qiáng)。
本書可作為理、工、農(nóng)、醫(yī)、經(jīng)濟(jì)、管理、人文社會科學(xué)專業(yè)的統(tǒng)計(jì)學(xué)教材,也可以供從事商務(wù)活動和經(jīng)濟(jì)分析等實(shí)際工作的各類人員參考。本書相關(guān)的資料可以在https://pan.baidu.com/s/1hrDmvMO下載。
由于時(shí)間倉促,書中不妥之處在所難免,敬請讀者指正。希望本書能引起讀者對統(tǒng)計(jì)學(xué)和R語言的興趣,在大數(shù)據(jù)時(shí)代從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,改善我們的生活。
劉超2019年1月
劉超,中國人民大學(xué)統(tǒng)計(jì)學(xué)博士,清華大學(xué)應(yīng)用經(jīng)濟(jì)學(xué)博士后,現(xiàn)為北京航空航天大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院副教授、碩士生導(dǎo)師、副系主任。兼任全國工業(yè)統(tǒng)計(jì)學(xué)教學(xué)研究會理事,北京應(yīng)用統(tǒng)計(jì)學(xué)會理事,北京大數(shù)據(jù)協(xié)會理事等。近年來主持國家社科基金、教育部人文社科項(xiàng)目、國家稅務(wù)總局項(xiàng)目等多項(xiàng)課題,在國內(nèi)外刊物發(fā)表20余篇論文。獲得寶鋼優(yōu)秀教師獎(jiǎng),北京航空航天大學(xué)藍(lán)天新星等10余項(xiàng)教學(xué)科研獎(jiǎng)勵(lì)。出版教材和譯著10余本。
第1章緒論
1.1什么是統(tǒng)計(jì)學(xué)
1.1.1基本定義
1.1.2基本類型
1.2數(shù)據(jù)和變量
1.2.1變量
1.2.2數(shù)據(jù)
1.3統(tǒng)計(jì)軟件
1.3.1R軟件
1.3.2其他常用統(tǒng)計(jì)軟件簡介
練習(xí)題
第2章數(shù)據(jù)的描述性分析
2.1單變量數(shù)據(jù)的描述分析
2.1.1分類型數(shù)據(jù)
2.1.2數(shù)值型數(shù)據(jù)
2.2雙變量數(shù)據(jù)的描述分析
2.2.1分類型數(shù)據(jù)對分類型數(shù)據(jù)
2.2.2分類型數(shù)據(jù)對數(shù)值型數(shù)據(jù)
2.2.3數(shù)值型數(shù)據(jù)對數(shù)值型數(shù)據(jù)
2.3多變量數(shù)據(jù)的描述分析
練習(xí)題
第3章概率與分布
3.1隨機(jī)性和規(guī)律性
3.2概率
3.3變量的分布
3.3.1離散型分布
3.3.2連續(xù)型分布
3.4中心極限定理和抽樣分布
3.4.1中心極限定理
3.4.2抽樣分布
3.5分位數(shù)
練習(xí)題
第4章參數(shù)估計(jì)
4.1點(diǎn)估計(jì)
4.1.1總體、樣本和統(tǒng)計(jì)量
4.1.2常用的點(diǎn)估計(jì)量
4.1.3估計(jì)量的選擇標(biāo)準(zhǔn)
4.2區(qū)間估計(jì)
4.2.1正態(tài)分布總體均值的區(qū)間估計(jì)
4.2.2獨(dú)立正態(tài)分布總體均值差1-2的區(qū)間估計(jì)
4.2.3配對正態(tài)分布總體均值差D=1-2的區(qū)間估計(jì)
4.2.4總體比例p的區(qū)間估計(jì)
4.2.5總體比例之差p1-p2的區(qū)間估計(jì)
4.3確定合適的樣本量
練習(xí)題
第5章均值的假設(shè)檢驗(yàn)
5.1假設(shè)檢驗(yàn)的基本思想
5.2單個(gè)總體均值的假設(shè)檢驗(yàn)
5.2.1單樣本t檢驗(yàn)
5.2.2單樣本W(wǎng)ilcoxon符號秩和檢驗(yàn)
5.3兩個(gè)總體均值的假設(shè)檢驗(yàn)
5.3.1兩樣本t檢驗(yàn)
5.3.2兩樣本W(wǎng)ilcoxon符號秩和檢驗(yàn)
5.4配對總體均值的假設(shè)檢驗(yàn)
5.4.1配對t檢驗(yàn)
5.4.2配對Wilcoxon符號秩和檢驗(yàn)
5.5正態(tài)性檢驗(yàn)
5.6功效與樣本量的計(jì)算
5.6.1單樣本t檢驗(yàn)與配對t檢驗(yàn)的功效與樣本量
5.6.2兩獨(dú)立樣本t檢驗(yàn)的功效與樣本量
練習(xí)題
第6章比例與列聯(lián)表的假設(shè)檢驗(yàn)
6.1單個(gè)總體的比例
6.2兩個(gè)獨(dú)立總體的比例
6.3多個(gè)總體比例和趨勢檢驗(yàn)
6.4rc表格
6.5比例的功效與樣本量
練習(xí)題
第7章方差分析
7.1單因素方差分析
7.1.1基本思想
7.1.2成對比較和多重檢驗(yàn)
7.1.3Bartlett檢驗(yàn)
7.1.4放寬對方差的假設(shè)
7.1.5KruskalWallis檢驗(yàn)
7.2雙因素方差分析
7.2.1基本思想
7.2.2無交互作用的雙因素方差分析
7.2.3有交互作用的雙因素方差分析
7.2.4Friedman檢驗(yàn)
練習(xí)題
第8章一元線性回歸
8.1基本原理
8.1.1基本模型
8.1.2參數(shù)估計(jì)
8.2數(shù)據(jù)描述
8.3模型設(shè)定和估計(jì)
8.4模型檢驗(yàn)和評價(jià)
8.5殘差與回歸值
8.6預(yù)測與置信區(qū)間
練習(xí)題
第9章多元線性回歸
9.1基本原理
9.2多維數(shù)據(jù)描述
9.3模型設(shè)定和估計(jì)
9.4模型檢驗(yàn)和評價(jià)
9.5模型選擇和逐步回歸
9.6多重共線性
9.6.1多重共線性的定義及檢驗(yàn)
9.6.2逐步回歸
9.6.3嶺回歸
練習(xí)題
第10章簡單時(shí)間序列分析
10.1基本概念
10.1.1自相關(guān)
10.1.2白噪聲
10.1.3平穩(wěn)性
10.2時(shí)間序列的平滑與分解
10.2.1時(shí)間序列的成分
10.2.2時(shí)間序列的分解
練習(xí)題
附錄AR的使用
A.1程序包的安裝與加載
A.2數(shù)據(jù)的讀取與保存
A.2.1直接輸入數(shù)據(jù)
A.2.2讀取R包中的自帶數(shù)據(jù)
A.2.3讀取外部數(shù)據(jù)
A.2.4輸出數(shù)據(jù)
A.2.5編輯數(shù)據(jù)
A.3基本的命令與函數(shù)
A.3.1數(shù)據(jù)類型
A.3.2數(shù)據(jù)對象及其運(yùn)算
A.3.3數(shù)據(jù)的合并與拆分
參考文獻(xiàn)