機(jī)器學(xué)習(xí)算法入門與編程實(shí)踐(基于Python·微課視頻版)
定 價(jià):69.8 元
- 作者:唐四薪 等
- 出版時(shí)間:2021/11/1
- ISBN:9787111693543
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書對(duì)機(jī)器學(xué)習(xí)算法的基本原理和Python程序?qū)崿F(xiàn)進(jìn)行了系統(tǒng)的介紹,每種算法都采用Sklearn程序?qū)崿F(xiàn)并用Matplotlib進(jìn)行數(shù)據(jù)可視化。為了幫助讀者更加高效、直觀地學(xué)習(xí),作者為本書錄制了13個(gè)微課視頻,讀者可以用手機(jī)掃描書中的二維碼進(jìn)行觀看,也可以將視頻下載后進(jìn)行觀看。
本書共8章,包括機(jī)器學(xué)習(xí)概述、Python機(jī)器學(xué)習(xí)與可視化、關(guān)聯(lián)規(guī)則與推薦算法、聚類算法、分類算法、回歸與邏輯回歸、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等內(nèi)容。
本書可以作為高等院校機(jī)器學(xué)習(xí)和人工智能概論等課程的教材,也可作為機(jī)器學(xué)習(xí)算法入門讀者的自學(xué)用書,還可以作為人工智能等領(lǐng)域機(jī)器學(xué)習(xí)研究者和應(yīng)用人員的參考書。
隨著人工智能技術(shù)的興起,機(jī)器學(xué)習(xí)在各行各業(yè)的應(yīng)用越來越廣。工信部印發(fā)的《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018—2020年)》中指出:當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革正在萌發(fā),大數(shù)據(jù)的形成、理論算法的革新、計(jì)算能力的提升及網(wǎng)絡(luò)設(shè)施的演進(jìn)驅(qū)動(dòng)人工智能發(fā)展進(jìn)入新階段,智能化成為技術(shù)和產(chǎn)業(yè)發(fā)展的重要方向。人工智能具有顯著的溢出效應(yīng),將進(jìn)一步帶動(dòng)其他技術(shù)的進(jìn)步,推動(dòng)戰(zhàn)略性新興產(chǎn)業(yè)總體突破,正在成為推進(jìn)供給側(cè)結(jié)構(gòu)性改革的新動(dòng)能、振興實(shí)體經(jīng)濟(jì)的新機(jī)遇、建設(shè)制造強(qiáng)國和網(wǎng)絡(luò)強(qiáng)國的新引擎。
對(duì)于初學(xué)者而言,機(jī)器學(xué)習(xí)是一門難度較大的學(xué)科,其難點(diǎn)大致體現(xiàn)在以下三個(gè)方面:
首先,機(jī)器學(xué)習(xí)的大部分算法復(fù)雜難懂,這些算法對(duì)于初學(xué)者來說結(jié)構(gòu)復(fù)雜,概念抽象,特別是一些大型機(jī)器學(xué)習(xí)模型(如人工神經(jīng)網(wǎng)絡(luò)),很難將模型的所有細(xì)節(jié)一一呈現(xiàn),學(xué)習(xí)難度較大,學(xué)習(xí)門檻較高。因此學(xué)術(shù)界認(rèn)為,隨著模型越來越復(fù)雜,機(jī)器學(xué)習(xí)模型的可解釋性(Interpretability)也會(huì)越來越差。例如,很多深度神經(jīng)網(wǎng)絡(luò)模型人類已無法完全理解,需要讀者從黑盒的層面進(jìn)行理解。
其次,用機(jī)器學(xué)習(xí)方法解決某個(gè)實(shí)際應(yīng)用的過程是煩瑣且枯燥的。如收集數(shù)據(jù)、特征提取、數(shù)據(jù)標(biāo)準(zhǔn)化和數(shù)據(jù)降維等,這些數(shù)據(jù)預(yù)處理工作都很煩瑣且耗時(shí),初學(xué)者如果對(duì)機(jī)器學(xué)習(xí)理解得不透徹,就很難堅(jiān)持下去。
再次,模型的選擇、訓(xùn)練和評(píng)估需要考慮影響實(shí)際問題的各種因素,并要調(diào)整參數(shù),避免欠擬合和過擬合,這使得整個(gè)操作過程非常復(fù)雜。如果初學(xué)者對(duì)涉及的理論和方法掌握不到位,理解不透徹,就很容易出現(xiàn)問題,導(dǎo)致得到的機(jī)器學(xué)習(xí)模型性能太差而無法使用。
目前市面上有很多機(jī)器學(xué)習(xí)類圖書,這些圖書根據(jù)側(cè)重點(diǎn)不同大致可以分為兩類:類以講解機(jī)器學(xué)習(xí)的算法理論為主,而對(duì)機(jī)器學(xué)習(xí)的編程實(shí)現(xiàn)講述較少;第二類以講解機(jī)器學(xué)習(xí)編程為主,而對(duì)機(jī)器學(xué)習(xí)的算法理論講述較少。由于機(jī)器學(xué)習(xí)模型比較復(fù)雜,讀者如果不了解編程實(shí)現(xiàn),往往在將理論應(yīng)用于實(shí)踐去解決實(shí)際問題時(shí)會(huì)有困難;相應(yīng)地,讀者如果不了解機(jī)器學(xué)習(xí)的理論,那么對(duì)編程思想及各種參數(shù)的含義就很難理解,從而導(dǎo)致難以獨(dú)立編寫程序去解決實(shí)際問題。為了解決這些問題,讓機(jī)器學(xué)習(xí)變得更加通俗易懂,筆者編寫了本書。本書將機(jī)器學(xué)習(xí)的算法原理與編程實(shí)現(xiàn)結(jié)合起來講述,可以幫助讀者在理解算法的基礎(chǔ)上動(dòng)手實(shí)踐,從而降低學(xué)習(xí)的門檻。
本書特色
* 提供微課視頻:筆者為本書的重點(diǎn)內(nèi)容錄制了11段微課配套教學(xué)視頻,幫助讀者高效、直觀地學(xué)習(xí)。讀者可以用手機(jī)或其他終端設(shè)備掃描書中的二維碼進(jìn)行在線觀看,也可以直接將視頻下載到本地計(jì)算機(jī)上觀看。
* 立體化教學(xué)支持:本書各章都設(shè)置了大量的習(xí)題,涵蓋選擇題、填空題、問答題和實(shí)踐題等,并提供源代碼、教學(xué)PPT、習(xí)題參考答案、考試試卷、教學(xué)大綱和實(shí)驗(yàn)指導(dǎo)等完善的立體化教學(xué)資料。
* 注重案例教學(xué):本書第3~8章各提供一個(gè)綜合案例,幫助讀者了解機(jī)器學(xué)習(xí)算法是如何處理各種細(xì)節(jié)問題的。掌握機(jī)器學(xué)習(xí)的目的是解決實(shí)際問題,因此要將相關(guān)算法用于實(shí)際案例。雖然人們開發(fā)了一些機(jī)器學(xué)習(xí)算法庫,即便不了解算法的具體細(xì)節(jié),也能編寫機(jī)器學(xué)習(xí)程序,但是要用這些算法解決實(shí)際問題,如果不了解算法細(xì)節(jié),則很難編寫出有實(shí)用價(jià)值的程序。
* 內(nèi)容重點(diǎn)突出:本書以面向初學(xué)者的視角詳細(xì)講述機(jī)器學(xué)習(xí)算法原理,展現(xiàn)機(jī)器學(xué)習(xí)的難點(diǎn),注重解決讀者學(xué)習(xí)時(shí)容易“掉坑”的問題。
* 降低學(xué)習(xí)門檻:本書詳細(xì)介紹如何使用sklearn編寫機(jī)器學(xué)習(xí)程序。sklearn是一個(gè)封裝好的機(jī)器學(xué)習(xí)算法庫,簡單易學(xué),學(xué)習(xí)該算法庫可以幫助讀者加深對(duì)機(jī)器學(xué)習(xí)相關(guān)概念和模型的理解,為進(jìn)一步學(xué)習(xí)TensorFlow深度學(xué)習(xí)算法打下基礎(chǔ)。
* 內(nèi)容實(shí)用性強(qiáng):本書對(duì)所有的sklearn程序均使用Matplotlib庫實(shí)現(xiàn)數(shù)據(jù)分析的可視化,這使得本書內(nèi)容具有較強(qiáng)的實(shí)用性。
本書內(nèi)容
本書共8章,包括機(jī)器學(xué)習(xí)概述、Python機(jī)器學(xué)習(xí)與可視化、關(guān)聯(lián)規(guī)則與推薦算法、聚類、分類、回歸與邏輯回歸、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)。
本書讀者對(duì)象
本書既可作為高等院校相關(guān)專業(yè)機(jī)器學(xué)習(xí)和人工智能概論等課程的教材,也可作為機(jī)器學(xué)習(xí)算法入門讀者的自學(xué)讀物,還可作為人工智能、機(jī)器學(xué)習(xí)研究者和從業(yè)者的參考書。
配套教學(xué)資料獲取
本書涉及的源代碼、微課教學(xué)視頻、教學(xué)PPT、習(xí)題參考答案、考試試卷、教學(xué)大綱和實(shí)驗(yàn)指導(dǎo)等配套資料的下載網(wǎng)址為https://mooc1.chaoxing.com/course/218580397.html。讀者也可以在華章公司的網(wǎng)站(www.hzbook.com)上搜索到本書,然后單擊“資料下載”按鈕,即可在本書頁面上找到下載鏈接進(jìn)行下載。
本書作者
本書是湖南省普通高等學(xué)校教學(xué)改革研究項(xiàng)目(HNJG-2020-0687)的成果。本書由唐四薪主筆編寫,唐金娟參與編寫了本書第1章。
售后支持
本書在編寫的過程中參考了其他專家、學(xué)者和機(jī)器學(xué)習(xí)愛好者的相關(guān)資料,筆者已盡可能地在參考文獻(xiàn)中列出,在此表示感謝!有部分資料未能查到原作者而沒有羅列,在此表示歉意,但同時(shí)
編輯推薦
每種算法都采用sklearn程序?qū)崿F(xiàn)并用Matplotlib進(jìn)行數(shù)據(jù)可視化
提供11個(gè)微課配套教學(xué)視頻,讀者可以掃碼在線觀看
11個(gè)微課教學(xué)視頻+89個(gè)示例+6個(gè)綜合案例+156個(gè)示意圖+131個(gè)習(xí)題
前言
第1章 機(jī)器學(xué)習(xí)概述1
1.1 機(jī)器學(xué)習(xí)的概念和步驟1
1.1.1 機(jī)器學(xué)習(xí)的一般過程2
1.1.2 機(jī)器學(xué)習(xí)的定義4
1.1.3 機(jī)器學(xué)習(xí)的過程舉例4
1.1.4 評(píng)估機(jī)器學(xué)習(xí)模型的效果7
1.2 機(jī)器學(xué)習(xí)的預(yù)處理環(huán)節(jié)9
1.2.1 收集相關(guān)樣本10
1.2.2 數(shù)據(jù)預(yù)處理10
1.2.3 數(shù)據(jù)標(biāo)準(zhǔn)化12
1.2.4 數(shù)據(jù)降維14
1.3 機(jī)器學(xué)習(xí)的類型15
1.3.1 按完成的任務(wù)分類15
1.3.2 按學(xué)習(xí)的過程分類16
1.4 機(jī)器學(xué)習(xí)的發(fā)展歷史和應(yīng)用領(lǐng)域17
1.4.1 機(jī)器學(xué)習(xí)的發(fā)展歷史17
1.4.2 機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域20
1.5 習(xí)題22
第2章 Python機(jī)器學(xué)習(xí)與可視化24
2.1 Python程序入門24
2.1.1 一些簡單的Python程序24
2.1.2 序列數(shù)據(jù)結(jié)構(gòu)26
2.1.3 序列處理函數(shù)28
2.1.4 函數(shù)和類29
2.2 Python數(shù)據(jù)分析工具32
2.2.1 Anaconda的使用32
2.2.2 Spyder集成開發(fā)環(huán)境33
2.2.3 NumPy庫34
2.3 數(shù)據(jù)可視化——基于Matplotlib庫37
2.3.1 繪制曲線圖38
2.3.2 繪制散點(diǎn)圖等其他圖形43
2.4 SciPy庫47
2.5 sklearn庫49
2.5.1 樣本及樣本的劃分49
2.5.2 導(dǎo)入或創(chuàng)建數(shù)據(jù)集53
2.5.3 數(shù)據(jù)預(yù)處理56
2.5.4 數(shù)據(jù)的降維59
2.5.5 調(diào)用機(jī)器學(xué)習(xí)模型61
2.6 習(xí)題63
第3章 關(guān)聯(lián)規(guī)則與推薦算法65
3.1 關(guān)聯(lián)規(guī)則挖掘65
3.1.1 基本概念65
3.1.2 Apriori算法68
3.1.3 Apriori算法的程序?qū)崿F(xiàn)72
3.1.4 FP-Growth算法73
3.2 推薦系統(tǒng)及算法77
3.2.1 協(xié)同過濾推薦算法78
3.2.2 協(xié)同過濾推薦算法應(yīng)用實(shí)例81
3.3 利用協(xié)同過濾推薦算法實(shí)現(xiàn)電影節(jié)目推薦85
3.4 習(xí)題87
第4章 聚類89
4.1 聚類的原理與實(shí)現(xiàn)89
4.1.1 聚類的概念和類型89
4.1.2 如何度量距離89
4.1.3 聚類的基本步驟93
4.2 層次聚類算法97
4.2.1 層次聚類法舉例98
4.2.2 層次聚類法的sklearn實(shí)現(xiàn)99
4.3 K-means聚類算法103
4.3.1 K-means聚類算法的原理和實(shí)例104
4.3.2 K-means聚類算法的k值的確定110
4.3.3 K-means聚類算法的sklearn實(shí)現(xiàn)111
4.4 K-medoids聚類算法112
4.4.1 K-medoids聚類算法的原理和實(shí)例112
4.4.2 K-medoids聚類算法的sklearn實(shí)現(xiàn)118
4.5 DBSCAN聚類算法119
4.5.1 DBSCAN聚類算法的原理和實(shí)例119
4.5.2 DBSCAN聚類算法的sklearn實(shí)現(xiàn)124
4.6 利用聚類算法實(shí)現(xiàn)車牌識(shí)別126
4.7 習(xí)題129
第5章 分類130
5.1 分類的基本原理130
5.1.1 分類與聚類的區(qū)別131
5.1.2 分類的步驟132
5.1.3 分類模型預(yù)測(cè)結(jié)果評(píng)估134
5.1.4 sklearn庫的常用分類算法135
5.2 K-近鄰算法136
5.2.1 K-近鄰算法的原理和實(shí)例136
5.2.2 sklearn中分類模型的編程步驟140
5.2.3 K-近鄰算法的sklearn實(shí)現(xiàn)142
5.2.4 繪制分類邊界圖144
5.2.5 確定的k值146
5.3 樸素貝葉斯分類算法147
5.3.1 樸素貝葉斯的原理與實(shí)例148
5.3.2 樸素貝葉斯分類的常見問題152
5.3.3 樸素貝葉斯分類算法的sklearn實(shí)現(xiàn)154
5.4 決策樹分類算法156
5.4.1 信息論基礎(chǔ)157
5.4.2 ID3算法162
5.4.3 C4.5算法167
5.4.4 CART算法171
5.4.5 決策樹分類算法的sklearn實(shí)現(xiàn)173
5.5 隨機(jī)森林分類算法175
5.5.1 集成學(xué)習(xí)理論175
5.5.2 隨機(jī)森林分類算法的理論與實(shí)例177
5.5.3 隨機(jī)森林分類算法的sklearn實(shí)現(xiàn)183
5.6 利用運(yùn)動(dòng)手環(huán)數(shù)據(jù)預(yù)測(cè)身體姿態(tài)186
5.7 習(xí)題191
第6章 回歸與邏輯回歸193
6.1 線性回歸193
6.1.1 相關(guān)與回歸193
6.1.2 線性回歸分析194
6.1.3 線性回歸方程參數(shù)的求法196
6.1.4 線性回歸模型的sklearn實(shí)現(xiàn)201
6.2 邏輯回歸206
6.2.1 線性分類模型的原理206
6.2.2 邏輯回歸模型及實(shí)例209
6.3 邏輯回歸模型的sklearn實(shí)現(xiàn)212
6.3.1 sklearn中的邏輯回歸模型212
6.3.2 利用邏輯回歸模型預(yù)測(cè)是否錄取學(xué)生214
6.4 利用邏輯回歸模型預(yù)測(cè)貸款違約行為218
6.5 習(xí)題222
第7章 人工神經(jīng)網(wǎng)絡(luò)223
7.1 神經(jīng)元與感知機(jī)223
7.1.1 人工神經(jīng)元與邏輯回歸模型224
7.1.2 感知機(jī)模型225
7.1.3 感知機(jī)模型的Python實(shí)現(xiàn)227
7.1.4 多層感知機(jī)模型228
7.2 人工神經(jīng)網(wǎng)絡(luò)的核心要素231
7.2.1 神經(jīng)元的激活函數(shù)231
7.2.2 損失函數(shù)233
7.2.3 網(wǎng)絡(luò)結(jié)構(gòu)235
7.2.4 反向傳播236
7.3 人工神經(jīng)網(wǎng)絡(luò)的sklearn實(shí)現(xiàn)239
7.3.1 sklearn人工神經(jīng)網(wǎng)絡(luò)模塊239
7.3.2 利用人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)二手房銷售數(shù)據(jù)240
7.4 深度學(xué)習(xí)與深度神經(jīng)網(wǎng)絡(luò)242
7.4.1 深度學(xué)習(xí)的概念和原理243
7.4.2 TensorFlow概述244
7.4.3