數據科學與商業(yè)分析 用機器學習與統計學優(yōu)化商業(yè)決策
定 價:99 元
- 作者:[美] 馬特·塔迪(Matt Taddy)
- 出版時間:2021/3/1
- ISBN:9787115559135
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:251
- 紙張:
- 版次:01
- 開本:16開
大數據和機器學習等的興起使得商業(yè)分析領域越來越倚重數據科學。本書詳細介紹了商業(yè)數據科學中的關鍵元素,匯集了機器學習、經濟學以及統計學領域的核心原則和最佳實踐,內容涵蓋識別商業(yè)政策中的重要變量、通過實驗測量這些變量,以及挖掘社交媒體以了解公眾對于政策修改的反應,為從事商業(yè)數據科學的數據科學家和商業(yè)人士提供了必備工具。書中通過大量數據分析示例講解如何利用R語言編寫腳本來解決復雜的數據科學問題。
1.亞馬遜北美首席經濟學家,前芝加哥大學統計學教授帶你解決從數據到業(yè)務實操的最后一公里問題;
2.書中通過大量數據分析示例講解如何利用R語言編寫腳本來解決復雜的數據科學問題;
3.本書是解決數據業(yè)務問題的實踐指南,旨在通過大量真實的一線案例,介紹如何將業(yè)務問題和數據聯系起來;
4.本書詳細展示應用統計學+機器學習+經濟學進行數據分析,進而驅動和優(yōu)化商業(yè)決策的過程。
5.基于R語言。
Matt Taddy,美國經濟學家、數據科學家,F任亞馬遜北美首席經濟學家、大名鼎鼎的亞馬遜經濟學家團隊Central Economics Team VP。曾任芝加哥大學布斯商學院計量經濟學和統計學教授,明星教師,開創(chuàng)了數據科學課程。曾任微軟商務人工智能首席研究員、eBay研究員。
對本書的贊譽
獻詞
前言
常見符號的標準用法
第0章 引言 1
從兩張圖說起 1
大數據與機器學習 4
計算 6
第 1章 不確定性 14
1.1 頻率不確定性和bootstrap方法 14
1.2 假設檢驗和錯誤發(fā)現率控制 25
1.3 貝葉斯推斷 33
第 2章 回歸 37
2.1 線性模型 37
2.2 邏輯回歸 46
2.3 偏差與似然 49
2.4 ◆回歸不確定性 53
2.5 空間和時間 56
第3章 正則化 64
3.1 樣本外預測效果 64
3.2 正則化方法 68
3.3 模型選擇 77
3.4 ◆lasso的不確定性量化 87
第4章 分類 94
4.1 最近鄰 94
4.2 概率、成本和分類 97
4.3 多元邏輯回歸 102
4.4 分布式多元回歸 106
4.5 分布式與大數據 110
第5章 實驗 114
5.1 隨機控制試驗 115
5.2 近似實驗設計 125
5.3 ◆工具變量 135
第6章 控制 143
6.1 條件可忽略性與線性處理效果 143
6.2 高維混淆變量調整 146
6.3 ◆樣本分割與正交機器學習 148
6.4 異質性處理效果 152
6.5 合成控制法 164
第7章 分解 167
7.1 聚類 167
7.2 因子模型和主成分分析 173
7.3 主成分回歸 180
7.4 偏最小二乘法 184
第8章 文本作為數據 189
8.1 分詞 190
8.2 文本回歸 194
8.3 主題模型 194
8.4 多元逆回歸 200
8.5 協同過濾 204
8.6 詞嵌入技術 206
第9章 非參數方法 209
9.1 決策樹 210
9.2 隨機森林 216
9.3 因果關系樹 224
9.4 半參數方法與高斯過程 228
第 10章 人工智能 233
10.1 什么是人工智能 233
10.2 通用機器學習 237
10.3 深度學習 240
10.4 ◆SGD 244
10.5 強化學習 248
10.6 商業(yè)環(huán)境中的人工智能 251