統(tǒng)計(jì)機(jī)器學(xué)習(xí)導(dǎo)論
定 價(jià):89 元
叢書名:數(shù)據(jù)科學(xué)與工程技術(shù)叢書
- 作者:[日] 杉山將
- 出版時(shí)間:2018/5/1
- ISBN:9787111596790
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:352
- 紙張:膠版紙
- 版次:1
- 開本:16開
本書對機(jī)器學(xué)習(xí)的關(guān)鍵知識點(diǎn)進(jìn)行了全面講解,幫助讀者順利完成從理論到實(shí)踐的過渡。書中首先介紹用于描述機(jī)器學(xué)習(xí)算法的統(tǒng)計(jì)與概率的知識,接著詳細(xì)分析機(jī)器學(xué)習(xí)技術(shù)的兩類主要方法——生成方法和判別方法,后深入研究了如何使機(jī)器學(xué)習(xí)算法在實(shí)際應(yīng)用中發(fā)揮更大的作用。本書提供程序源代碼,便于讀者進(jìn)行數(shù)據(jù)分析實(shí)踐。本書適合高等院校計(jì)算機(jī)、統(tǒng)計(jì)等專業(yè)的研究生和高年級本科生閱讀,同時(shí)也適合相關(guān)領(lǐng)域的技術(shù)人員參考。
前言機(jī)器學(xué)習(xí)是計(jì)算機(jī)領(lǐng)域的一個(gè)學(xué)科,旨在研究原理、算法以及能夠像人類一樣學(xué)習(xí)的系統(tǒng)的應(yīng)用。近年來,計(jì)算機(jī)和傳感器的發(fā)展使得我們能夠訪問不同領(lǐng)域的海量數(shù)據(jù)(如文本、音頻、圖片、電影、電子商務(wù)、電氣、醫(yī)學(xué)和生物學(xué)等)。在此類大數(shù)據(jù)的分析和利用方面,機(jī)器學(xué)習(xí)起到了核心的作用。
本書致力于討論機(jī)器學(xué)習(xí)的數(shù)學(xué)背景及多種機(jī)器學(xué)習(xí)技術(shù)的實(shí)用化算法。目標(biāo)讀者定位于計(jì)算機(jī)和相關(guān)專業(yè)的本科生和研究生。在工作中應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的工程師和分析數(shù)據(jù)的科學(xué)家也會(huì)從本書中獲益。
本書特色在于每章的主題簡明扼要,給出具體機(jī)器學(xué)習(xí)技術(shù)的數(shù)學(xué)推導(dǎo)并附以簡潔的MATLAB程序。由此,讀者在學(xué)習(xí)數(shù)學(xué)概念的同時(shí),可掌握多種機(jī)器學(xué)習(xí)技術(shù)的實(shí)用價(jià)值。全部MATLAB程序可以從如下網(wǎng)址獲得:
本書第一部分給出機(jī)器學(xué)習(xí)領(lǐng)域的簡要概述。緊接著,第二部分介紹了概率和統(tǒng)計(jì)的基本概念,它們構(gòu)成了統(tǒng)計(jì)機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)。第二部分的成文基于:
第三部分和第四部分分別在生成和判別框架下,介紹了一系列實(shí)用機(jī)器學(xué)習(xí)算法。隨后, 第五部分介紹高級論題,進(jìn)而處理更具挑戰(zhàn)的機(jī)器學(xué)習(xí)任務(wù)。第三部分的成文基于:
第四部分和第五部分的成文基于:
在此感謝東京大學(xué)和東京工業(yè)大學(xué)相關(guān)研究組的研究員和學(xué)生針對本書早期手稿給出的有價(jià)值的反饋。
杉山將東京大學(xué)
【加照片】Masashi Sugiyama,東京大學(xué)教授,擁有東京工業(yè)大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)位,研究興趣包括機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的理論、算法和應(yīng)用,涉及信號處理、圖像處理、機(jī)器人控制等。2007年獲得IBM學(xué)者獎(jiǎng),以表彰其在機(jī)器學(xué)習(xí)領(lǐng)域非平穩(wěn)性方面做出的貢獻(xiàn)。2011年獲得日本信息處理協(xié)會(huì)頒發(fā)的Nagao特別研究獎(jiǎng),以及日本文部科學(xué)省頒發(fā)的青年科學(xué)家獎(jiǎng),以表彰其對機(jī)器學(xué)習(xí)密度比范型的貢獻(xiàn)。
目錄
譯者序
前言
作者簡介
第一部分緒論
第1章統(tǒng)計(jì)機(jī)器學(xué)習(xí)
1.1學(xué)習(xí)的類型
1.2機(jī)器學(xué)習(xí)任務(wù)舉例
1.2.1監(jiān)督學(xué)習(xí)
1.2.2非監(jiān)督學(xué)習(xí)
1.2.3進(jìn)一步的主題
1.3本書結(jié)構(gòu)
第二部分概率與統(tǒng)計(jì)
第2章隨機(jī)變量與概率分布
2.1數(shù)學(xué)基礎(chǔ)
2.2概率
2.3隨機(jī)變量和概率分布
2.4概率分布的性質(zhì)
2.4.1期望、中位數(shù)和眾數(shù)
2.4.2方差和標(biāo)準(zhǔn)差
2.4.3偏度、峰度和矩
2.5隨便變量的變換
第3章離散概率分布的實(shí)例
3.1離散均勻分布
3.2二項(xiàng)分布
3.3超幾何分布
3.4泊松分布
3.5負(fù)二項(xiàng)分布
3.6幾何分布
第4章連續(xù)概率分布的實(shí)例
4.1連續(xù)均勻分布
4.2正態(tài)分布
4.3伽馬分布、指數(shù)分布和卡方分布
4.4Beta分布
4.5柯西分布和拉普拉斯分布
4.6t分布和F分布
第5章多維概率分布
5.1聯(lián)合概率分布
5.2條件概率分布
5.3列聯(lián)表
5.4貝葉斯定理
5.5協(xié)方差與相關(guān)性
5.6獨(dú)立性
第6章多維概率分布的實(shí)例
6.1多項(xiàng)分布
6.2多元正態(tài)分布
6.3狄利克雷分布
6.4威沙特分布
第7章獨(dú)立隨機(jī)變量之和
7.1卷積
7.2再生性
7.3大數(shù)定律
7.4中心極限定理
第8章概率不等式
8.1聯(lián)合界
8.2概率不等式
8.2.1馬爾可夫不等式和切爾諾夫不等式
8.2.2坎泰利不等式和切比雪夫不等式
8.3期望不等式
8.3.1琴生不等式
8.3.2赫爾德不等式和施瓦茨不等式
8.3.3閔可夫斯基不等式
8.3.4康托洛維奇不等式
8.4獨(dú)立隨機(jī)變量和的不等式
8.4.1切比雪夫不等式和切爾諾夫不等式
8.4.2霍夫丁不等式和伯恩斯坦不等式
8.4.3貝內(nèi)特不等式
第9章統(tǒng)計(jì)估計(jì)
9.1統(tǒng)計(jì)估計(jì)基礎(chǔ)
9.2點(diǎn)估計(jì)
9.2.1參數(shù)密度估計(jì)
9.2.2非參數(shù)密度估計(jì)
9.2.3回歸和分類
9.2.4模型選擇
9.3區(qū)間估計(jì)
9.3.1基于正態(tài)樣本期望的區(qū)間估計(jì)
9.3.2bootstrap置信區(qū)間
9.3.3貝葉斯置信區(qū)間
第10章假設(shè)檢驗(yàn)
10.1假設(shè)檢驗(yàn)基礎(chǔ)
10.2正態(tài)樣本期望的檢驗(yàn)
10.3尼曼皮爾森引理
10.4列聯(lián)表檢驗(yàn)
10.5正態(tài)樣本期望差值檢驗(yàn)
10.5.1無對應(yīng)關(guān)系的兩組樣本
10.5.2有對應(yīng)關(guān)系的兩組樣本
10.6秩的無參檢驗(yàn)
10.6.1無對應(yīng)關(guān)系的兩組樣本
10.6.2有對應(yīng)關(guān)系的兩組樣本
10.7蒙特卡羅檢驗(yàn)
第三部分統(tǒng)計(jì)模式識別的生成式方法
第11章通過生成模型估計(jì)的模式識別
11.1模式識別的公式化
11.2統(tǒng)計(jì)模式識別
11.3分類器訓(xùn)練的準(zhǔn)則
11.3.1最大后驗(yàn)概率規(guī)則
11.3.2最小錯(cuò)誤分類率準(zhǔn)則
11.3.3貝葉斯決策規(guī)則
11.3.4討論
11.4生成式方法和判別式方法
第12章極大似然估計(jì)
12.1定義
12.2高斯模型
12.3類后驗(yàn)概率的計(jì)算
12.4Fisher線性判別分析
12.5手寫數(shù)字識別
12.5.1預(yù)備知識
12.5.2線性判別分析的實(shí)現(xiàn)
12.5.3多分類器方法
第13章極大似然估計(jì)的性質(zhì)
13.1一致性
13.2漸近無偏性
13.3漸近有效性
13.3.1一維的情況
13.3.2多維的情況
13.4漸近正態(tài)性
13.5總結(jié)
第14章極大似然估計(jì)的模型選擇
14.1模型選擇
14.2KL散度
14.3AIC信息論準(zhǔn)則
14.4交叉檢驗(yàn)
14.5討論
第15章高斯混合模型的極大似然估計(jì)
15.1高斯混合模型
15.2極大似然估計(jì)
15.3梯度上升算法
15.4EM算法
第16章非參數(shù)估計(jì)
16.1直方圖方法
16.2問題描述
16.3核密度估計(jì)
16.3.1Parzen 窗法
16.3.2利用核的平滑
16.3.3帶寬的選擇
16.4最近鄰密度估計(jì)
16.4.1最近鄰距離
16.4.2最近鄰分類器
第17章貝葉斯推理
17.1貝葉斯預(yù)測分布
17.1.1定義
17.1.2與極大似然估計(jì)的比較
17.1.3計(jì)算問題
17.2共軛先驗(yàn)
17.3最大后驗(yàn)估計(jì)
17.4貝葉斯模型選擇
第18章邊緣相似的解析近似
18.1拉普拉斯近似
18.1.1高斯密度估計(jì)
18.1.2例證
18.1.3應(yīng)用于邊際似然逼近
18.1.4貝葉斯信息準(zhǔn)則
18.2變分近似
18.2.1變分貝葉斯最大期望算法
18.2.2與一般最大期望法的關(guān)系
第19章預(yù)測分布的數(shù)值近似
19.1蒙特卡羅積分
19.2重要性采樣
19.3采樣算法
19.3.1逆變換采樣
19.3.2拒絕采樣
19.3.3馬爾可夫鏈蒙特卡羅方法
第20章貝葉斯混合模型
20.1高斯混合模型
20.1.1貝葉斯公式化
20.1.2變分推斷
20.1.3吉布斯采樣
20.2隱狄利克雷分配模型
20.2.1主題模型
20.2.2貝葉斯公式化
20.2.3吉布斯采樣
第四部分統(tǒng)計(jì)機(jī)器學(xué)習(xí)的判別式方法
第21章學(xué)習(xí)模型
21.1線性參數(shù)模型
21.2核模型
21.3層次模型
第22章最小二乘回歸
22.1最小二乘法
22.2線性參數(shù)模型的解決方案
22.3最小二乘法的特性
22.4大規(guī)模數(shù)據(jù)的學(xué)習(xí)算法
22.5層次模型的學(xué)習(xí)算法
第23章具有約束的最小二乘回歸
23.1子空間約束的最小二乘
23.22約束的最小二乘
23.3模型選擇
第24章稀疏回歸
24.11約束的最小二乘
24.2解決1約束的最小二乘
24.3稀疏學(xué)習(xí)的特征選擇
24.4若干擴(kuò)展
24.4.1廣義1約束最小二乘
24.4.2p約束最小二乘
24.4.31+2約束最小二乘
24.4.41,2約束最小二乘
24.4.5跡范數(shù)約束最小二乘
第25章穩(wěn)健回歸
25.12損失最小化的非穩(wěn)健性
25.21損失最小化
25.3Huber損失最小化
25.3.1定義
25.3.2隨機(jī)梯度算法
25.3.3迭代加權(quán)最小二乘
25.3.41約束Huber損失最小化
25.4Tukey 損失最小化
第26章最小二乘分類器
26.1基于最小二乘回歸的分類器
26.20/1損失和間隔
2