數(shù)據(jù)分析基礎(chǔ)——基于Python的實(shí)現(xiàn)(基于Python的數(shù)據(jù)分析叢書(shū))
定 價(jià):49 元
叢書(shū)名:基于Python的數(shù)據(jù)分析叢書(shū)
- 作者:主編:賈俊平 副主編:吳翌琳 甄峰
- 出版時(shí)間:2022/7/1
- ISBN:9787300307923
- 出 版 社:中國(guó)人民大學(xué)出版社
- 中圖法分類(lèi):TP311.561
- 頁(yè)碼:328
- 紙張:
- 版次:1
- 開(kāi)本:16
本書(shū)是一本基于Python實(shí)現(xiàn)全部例題計(jì)算和分析的數(shù)據(jù)分析教材,書(shū)中例題解答均給出了詳細(xì)的實(shí)現(xiàn)代碼和結(jié)果。全書(shū)共11章。第1章介紹數(shù)據(jù)分析的相關(guān)概念以及Python的初步使用方法。第2~3章介紹數(shù)據(jù)的描述性分析方法,包括數(shù)據(jù)可視化分析和描述統(tǒng)計(jì)量分析。第4~6章介紹數(shù)據(jù)推斷分析的基本理論和方法,包括概率分布、參數(shù)估計(jì)和假設(shè)檢驗(yàn)。第7~11章介紹實(shí)際中常用的一些數(shù)據(jù)分析方法,包括類(lèi)別變量分析、方差分析、回歸分析、時(shí)間序列分析等。
本書(shū)可作為高等院校各專(zhuān)業(yè)開(kāi)設(shè)數(shù)據(jù)分析或統(tǒng)計(jì)學(xué)課程的教材,也可作為數(shù)據(jù)分析工作者、Python數(shù)據(jù)分析和可視化愛(ài)好者的參考書(shū)。
賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院副教授,從事統(tǒng)計(jì)教學(xué)30多年,著有《統(tǒng)計(jì)學(xué)——基于R》《統(tǒng)計(jì)學(xué)——基于Excel》《統(tǒng)計(jì)學(xué)——基于SPSS》《統(tǒng)計(jì)學(xué)基礎(chǔ)》《數(shù)據(jù)可視化分析——基于R語(yǔ)言》《統(tǒng)計(jì)學(xué)——Python實(shí)現(xiàn)》等多部教材和著作!督y(tǒng)計(jì)學(xué)》(第7版)榮獲首屆全國(guó)教材建設(shè)獎(jiǎng)全國(guó)優(yōu)秀教材二等獎(jiǎng)。
吳翌琳,經(jīng)濟(jì)學(xué)博士,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院、中國(guó)調(diào)查與數(shù)據(jù)中心教授,主要從事經(jīng)濟(jì)統(tǒng)計(jì)分析、創(chuàng)新經(jīng)濟(jì)計(jì)量、指數(shù)編制與應(yīng)用、數(shù)據(jù)可視化等應(yīng)用統(tǒng)計(jì)方向的研究。
甄峰,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院副教授,經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)系主任。國(guó)家統(tǒng)計(jì)局-中國(guó)人民大學(xué)數(shù)據(jù)開(kāi)發(fā)中心副主任,國(guó)際統(tǒng)計(jì)學(xué)會(huì)當(dāng)選會(huì)員,聯(lián)合國(guó)大學(xué)創(chuàng)新與技術(shù)經(jīng)濟(jì)研究所(UNU-MERIT)附屬研究員。
第1章 數(shù)據(jù)分析與Python語(yǔ)言
1.1 數(shù)據(jù)分析概述
1.1.1 數(shù)據(jù)及其來(lái)源
1.1.2 數(shù)據(jù)分析方法
1.1.3 數(shù)據(jù)分析工具
1.2 Python的初步使用
1.2.1 Python的下載與安裝
1.2.2 模塊的安裝與加載
1.2.3 查看幫助文件
1.2.4 編寫(xiě)代碼腳本
1.3 Python數(shù)據(jù)處理
1.3.1 Python的基本數(shù)據(jù)結(jié)構(gòu)
1.3.2 numpy中的數(shù)組
1.3.3 pandas中的序列和數(shù)據(jù)框
1.3.4 隨機(jī)數(shù)和數(shù)據(jù)抽樣
1.3.5 數(shù)據(jù)讀取和保存
1.3.6 生成頻數(shù)分布表
1.4 Python繪圖基礎(chǔ)
1.4.1 Python的主要繪圖模塊
1.4.2 基本繪圖函數(shù)
1.4.3 圖形布局
1.3.4 圖形顏色、線(xiàn)型和標(biāo)記
習(xí) 題
第2章 數(shù)據(jù)可視化分析
2.1 類(lèi)別數(shù)據(jù)可視化
2.1.1 條形圖
2.1.2 餅圖和環(huán)形圖
2.2 數(shù)據(jù)分布可視化
2.2.2 箱線(xiàn)圖和小提琴圖
2.2.3 點(diǎn)圖
2.3 變量間關(guān)系可視化
2.3.1 散點(diǎn)圖
2.3.2 散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣
2.3.3 氣泡圖
2.4 樣本相似性可視化
2.4.1 輪廓圖
2.4.2 雷達(dá)圖
2.5 時(shí)間序列可視化
2.5.1 折線(xiàn)圖
2.5.2 面積圖
2.6 可視化的注意事項(xiàng)
習(xí) 題
第3章 描述統(tǒng)計(jì)量分析
3.1 描述水平的統(tǒng)計(jì)量
3.1.1 平均數(shù)
3.1.2 分位數(shù)
3.1.3 眾數(shù)
3.2 描述差異的統(tǒng)計(jì)量
3.2.1 極差和四分位差
3.2.2 方差和標(biāo)準(zhǔn)差
3.2.3 變異系數(shù)
3.2.4 標(biāo)準(zhǔn)分?jǐn)?shù)
3.3 描述分布形狀的統(tǒng)計(jì)量
3.3.1 偏度系數(shù)
3.3.2 峰度系數(shù)
3.4 一個(gè)綜合描述的例子
習(xí) 題
第4章 推斷分析的理論基礎(chǔ):概率分布
4.1 什么是概率
4.2 隨機(jī)變量的概率分布
4.2.1 隨機(jī)變量及其概括性度量
4.2.2 隨機(jī)變量的概率分布
4.2.3 其他幾個(gè)重要的統(tǒng)計(jì)分布
4.3 樣本統(tǒng)計(jì)量的概率分布
4.3.1 統(tǒng)計(jì)量及其分布
4.3.2 樣本均值的抽樣分布
4.3.3 樣本方差的抽樣分布
4.3.4 樣本比例的抽樣分布
4.3.5 統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤
習(xí) 題
第5章 推斷分析的基本方法:參數(shù)估計(jì)
5.1 參數(shù)估計(jì)的原理
5.1.1 點(diǎn)估計(jì)與區(qū)間估計(jì)
5.1.2 評(píng)量估計(jì)量的標(biāo)準(zhǔn)
5.2 總體均值的區(qū)間估計(jì)
5.2.1 一個(gè)總體均值的估計(jì)
5.2.2 兩個(gè)總體均值差的估計(jì)
5.3 總體比例的區(qū)間估計(jì)
5.3.1 一個(gè)總體比例的估計(jì)
5.3.2 兩個(gè)總體比例差的估計(jì)
5.4 總體方差的區(qū)間估計(jì)
5.4.1 一個(gè)總體方差的估計(jì)
5.4.2 兩個(gè)總體方差比的估計(jì)
習(xí) 題
第6章 推斷分析的基本方法:假設(shè)檢驗(yàn)
6.1 假設(shè)檢驗(yàn)的原理
6.1.1 提出假設(shè)
6.1.2 做出決策
6.1.3 表述結(jié)果
6.1.4 效應(yīng)量分析
6.2 總體均值的檢驗(yàn)
6.2.1 一個(gè)總體均值的檢驗(yàn)
6.2.2 兩個(gè)總體均值差的檢驗(yàn)
6.3 總體比例的檢驗(yàn)
6.3.1 一個(gè)總體比例的檢驗(yàn)
6.3.2 兩個(gè)總體比例差的檢驗(yàn)
6.4 總體方差的檢驗(yàn)
6.4.1 一個(gè)總體方差的檢驗(yàn)
6.4.2 兩個(gè)總體方差比的檢驗(yàn)
6.5 正態(tài)性檢驗(yàn)
6.5.1 正態(tài)概率圖
6.5.2 S-W檢驗(yàn)和K-S檢驗(yàn) )
習(xí) 題
第7章 類(lèi)別變量分析
7.1 一個(gè)類(lèi)別變量的擬合優(yōu)度檢驗(yàn)
7.1.1 期望頻數(shù)相等
7.1.2 期望頻數(shù)不等
7.2 多個(gè)總體比例的檢驗(yàn)
7.2.1 多個(gè)總體比例的檢驗(yàn)
7.2.2 多個(gè)總體比例的多重比較方法
7.3 兩個(gè)類(lèi)別變量的獨(dú)立性檢驗(yàn)
7.3.1 列聯(lián)表與χ²獨(dú)立性檢驗(yàn)
7.3.2 應(yīng)用χ²檢驗(yàn)的注意事項(xiàng)
7.4 兩個(gè)類(lèi)別變量的相關(guān)性度量
7.4.1 φ系數(shù)和Cramer’s V系數(shù)
7.4.2 列聯(lián)系數(shù)
習(xí) 題
第8章 方差分析
8.1 方差分析的原理
8.1.1 什么是方差分析
8.1.2 誤差分解
8.2 單因子方差分析
8.2.1 數(shù)學(xué)模型
8.2.2 效應(yīng)檢驗(yàn)
8.2.3 效應(yīng)量分析
8.2.4 多重比較
8.3 雙因子方差分析
8.3.1 數(shù)學(xué)模型
8.3.2 主效應(yīng)分析
8.3.3 交互效應(yīng)分析
8.4 方差分析的假定及其檢驗(yàn)
8.4.1 正態(tài)性檢驗(yàn)
8.4.2 方差齊性檢驗(yàn)
習(xí) 題
第9章 一元線(xiàn)性回歸分析
9.1 確定變量間的關(guān)系
9.1.1 變量之間的關(guān)系
9.1.2 相關(guān)關(guān)系的描述
9.1.3 關(guān)系強(qiáng)度的度量
9.2 模型估計(jì)和檢驗(yàn)
9.2.1 回歸模型與回歸方程
9.2.2 參數(shù)的最小二乘估計(jì)
9.2.3 模型的擬合優(yōu)度
9.2.4 模型的顯著性檢驗(yàn)
9.3 利用回歸方程進(jìn)行預(yù)測(cè)
9.3.1 均值的置信區(qū)間
9.3.2 個(gè)別值的預(yù)測(cè)區(qū)間
9.4 回歸模型的診斷
9.4.1 殘差與殘差圖
9.4.2 檢驗(yàn)?zāi)P图俣?
習(xí) 題
第10章 多元線(xiàn)性回歸分析
10.1 多元線(xiàn)性回歸模型及其參數(shù)估計(jì)
10.1.1 回歸模型與回歸方程
10.1.2 參數(shù)的最小二乘估計(jì)
10.2 擬合優(yōu)度和顯著性檢驗(yàn)
10.2.1 模型的擬合優(yōu)度
10.2.2 模型的顯著性檢驗(yàn)
10.2.3 模型診斷
10.3 多重共線(xiàn)性及其處理
10.3.1 多重共線(xiàn)性及其識(shí)別
10.3.2 變量選擇與逐步回歸
10.4 相對(duì)重要性和模型比較
10.4.1 自變量的相對(duì)重要性
10.4.2 模型比較
10.5 利用回歸方程進(jìn)行預(yù)測(cè)
10.6 啞變量回歸
10.6.1 在模型中引入啞變量
10.6.2 含有一個(gè)啞變量的回歸
10.7 Logistic回歸
10.7.1 Logistic回歸的基本原理
10.7.2 Logistic回歸建模
習(xí) 題
第11章 時(shí)間序列分析
11.1 時(shí)間序列的成分和預(yù)測(cè)方法
11.1.1 時(shí)間序列的成分
11.1.2 預(yù)測(cè)方法的選擇與評(píng)估
11.2 指數(shù)平滑預(yù)測(cè)
11.2.1 指數(shù)平滑模型的一般表達(dá)
11.2.2 簡(jiǎn)單指數(shù)平滑預(yù)測(cè)
11.2.3 Holt指數(shù)平滑預(yù)測(cè)
11.2.4 Winters指數(shù)平滑預(yù)測(cè)
11.3 趨勢(shì)外推預(yù)測(cè)
11.3.1 線(xiàn)性趨勢(shì)預(yù)測(cè)
11.3.2 非線(xiàn)性趨勢(shì)預(yù)測(cè)
11.4 分解預(yù)測(cè)
11.5 時(shí)間序列平滑
習(xí) 題
參考書(shū)目