《別怕,統(tǒng)計學其實很簡單》是一本優(yōu)秀的統(tǒng)計學入門讀物,首先介紹了統(tǒng)計學理論知識,激發(fā)讀者對統(tǒng)計分析的興趣,幫助讀者完成理論準備。之后通過近30個商業(yè)案例深入地介紹了每種分析方法背后的原理、優(yōu)缺點、適用范圍等,使讀者不僅知其然,更知其所以然。
本書注重實際應用,幫助讀者在短時間內了解統(tǒng)計學的知識體系,體會到統(tǒng)計學在各行各業(yè)中是如何發(fā)揮強大作用的;使讀者具備一定的統(tǒng)計分析能力,并將這些知識應用到實際工作中。
入門級:本書是統(tǒng)計學入門級讀物,只要讀者會加、減、乘、除就能輕松掌握這門瞬間洞察因果的關鍵技能。
思維級:本書涉及日常生活,以及零售業(yè)、電商業(yè)、餐飲業(yè)、金融業(yè)、服務業(yè)和博彩業(yè)等多個行業(yè),有平易近人、隨處可見的典型案例,也有難得一見、使用高新技術的案例;有規(guī)模宏大、涉及多方資源的案例,也有見微知著、僅需少量數(shù)據(jù)的案例;有成功的案例,也有失敗的案例。通過多行業(yè)、多層次、多角度的分析,讀者可了解到統(tǒng)計學是如何在各個行業(yè)中發(fā)揮作用的,看懂各行各業(yè)數(shù)據(jù)背后的真相,進而用統(tǒng)計學的思維,做出好決策。
徐苑琳,四川大學亞洲基礎設施建設與發(fā)展研究院副研究員,成都行政學院副教授,師從牛津大學圣艾德蒙學院院士AngHu,長期從事經(jīng)濟與科技發(fā)展研究,近年來在人民日報、科學管理研究、價格理論與實踐等核心刊物上發(fā)表論文數(shù)十篇。
李倩星,畢業(yè)于西南大學數(shù)學系,曾任美團用戶服務體驗平臺高級數(shù)據(jù)運營,從應用角度關注統(tǒng)計學這門科學。對統(tǒng)計分析、數(shù)據(jù)挖掘有獨到理解。
第1章 為什么要懂點統(tǒng)計學
1.1 這些統(tǒng)計問題,你會做嗎 2
1.2 統(tǒng)計學可以幫到你 6
1.3 到底什么是統(tǒng)計學 10
第2章 描述統(tǒng)計基礎
2.1 基本概念 14
2.2 數(shù)據(jù)預處理 17
2.3 繪制統(tǒng)計圖表 21
第3章 推斷統(tǒng)計基礎
3.1 常見的幾種概率分布 28
3.2 相關分析與回歸分析基礎 34
第4章 描述性統(tǒng)計分析
4.1 描述性統(tǒng)計分析基礎 40
4.2 頻數(shù)分布分析:用統(tǒng)計圖解決倫敦霍亂 40
4.3 關注數(shù)據(jù)代表性:統(tǒng)計學家改良轟炸機 44
4.4 異常值分析:1號店提升營銷精準率 48
4.5 對比分析:折線圖指導購房者尋找合算房價 52
4.6 描述性統(tǒng)計分析概述:泰坦尼克號生還數(shù)據(jù) 55
第5章 相關分析與回歸分析
5.1 相關分析與回歸分析概述 60
5.2 矩陣分解:價值百萬美元的Netflix推薦系統(tǒng) 61
5.3 一元線性回歸:引發(fā)金融危機的風險價值模型 64
5.4 評分系統(tǒng):星巴克選址借力大數(shù)據(jù) 68
5.5 相關與回歸概述:航空乘客數(shù)量預測 71
第6章 關聯(lián)分析與聚類分析
6.1 關聯(lián)分析與聚類分析概述 78
6.2 購物籃分析:啤酒與尿布的經(jīng)典案例 79
6.3 序列模式挖掘:Web訪問模式幫助電商優(yōu)化網(wǎng)站 83
6.4 快速聚類:通過分類降低客戶退貨率 87
6.5 層次聚類:為鳶尾花分類 91
6.6 關聯(lián)與聚類綜述:加州極客的聚類分析把妹法 95
第7章 決策樹與模式識別
7.1 C4.5算法:電信客戶流失預測 100
7.2 自組織神經(jīng)網(wǎng)絡:**路徑和旅行商問題 105
7.3 貝葉斯決策:神奇的谷歌智能翻譯 110
7.4 支持向量機:應用廣泛的手寫識別與語音識別 114
7.5 判別分析:電信行業(yè)構建客戶流失模型 119
7.6 模式識別綜述:日趨成熟的信用評分模型 124
第8章 更多的數(shù)據(jù)挖掘算法
8.1 核密度估計法:警務大數(shù)據(jù)預測犯罪 130
8.2 Flu Trends:谷歌流感趨勢幫助控制疫情 134
8.3 Apriori算法:透視美國國會投票模式 137
8.4 SVD簡化數(shù)據(jù):IBM軟件自動生成新菜譜 142
8.5 文本分析:垃圾郵件過濾系統(tǒng) 146
8.6 AdaBoost元算法:偵測欺詐交易 150