計(jì)算機(jī)視覺、自然語言處理和語音識(shí)別是目前深度學(xué)習(xí)領(lǐng)域很熱門的三大應(yīng)用方向,本書旨在幫助零基礎(chǔ)或基礎(chǔ)較為薄弱的讀者入門深度學(xué)習(xí),達(dá)到能夠獨(dú)立使用深度學(xué)習(xí)知識(shí)處理計(jì)算機(jī)視覺問題的水平。通過閱讀本書,讀者將學(xué)到人工智能的基礎(chǔ)概念及Python編程技能,掌握PyTorch的使用方法,學(xué)到深度學(xué)習(xí)相關(guān)的理論知識(shí),比如卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、自動(dòng)編碼器,等等。在掌握深度學(xué)習(xí)理論和編程技能之后,讀者還會(huì)學(xué)到如何基于PyTorch深度學(xué)習(xí)框架實(shí)戰(zhàn)計(jì)算機(jī)視覺。本書中的大量實(shí)例可讓讀者在循序漸進(jìn)地學(xué)習(xí)的同時(shí),不斷地獲得成就感。本書面向?qū)ι疃葘W(xué)習(xí)技術(shù)感興趣、但是相關(guān)基礎(chǔ)知識(shí)較為薄弱或者零基礎(chǔ)的讀者。
作者的文筆很好,對(duì)深度學(xué)習(xí)、Python、PyTorch、神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)及相關(guān)數(shù)學(xué)知識(shí)講解透徹,使書中的內(nèi)容很好理解。
全書的架構(gòu)也很好,學(xué)習(xí)下來,對(duì)深度學(xué)習(xí)的整個(gè)脈絡(luò)都掌握得很清晰,可以說一本書通俗易懂地講到了PyTorch實(shí)戰(zhàn)計(jì)算機(jī)視覺所涉及的方方面面。
這是一本零基礎(chǔ)入門書,希望能幫助您更好地入門并進(jìn)階深度學(xué)習(xí)。
人工智能(Artificial Intelligence,簡(jiǎn)稱AI)一詞在很久以前就有了,被大眾津津樂道卻是近幾年的事情,這和機(jī)器學(xué)習(xí)(Machine Learning)、深度學(xué)習(xí)(Deep Learning)等技術(shù)的崛起有著千絲萬縷的聯(lián)系,而這一切又得益于大數(shù)據(jù)的發(fā)展和計(jì)算機(jī)處理性能的不斷提升。
本書將帶領(lǐng)讀者了解人工智能的相關(guān)技術(shù)和發(fā)展近況,通過一些實(shí)例來掌握必備的技能,并能夠獨(dú)立使用相關(guān)技術(shù)完成對(duì)計(jì)算機(jī)視覺問題的分析和處理。本書各個(gè)章節(jié)的知識(shí)要點(diǎn)如下。
第1章主要介紹人工智能、神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺的發(fā)展歷史,讓讀者對(duì)這一領(lǐng)域有一個(gè)全面的認(rèn)識(shí)。
第2章主要介紹在理解和掌握后面章節(jié)的內(nèi)容時(shí)需要用到的數(shù)學(xué)知識(shí),以及在實(shí)戰(zhàn)操作的過程中進(jìn)行環(huán)境搭建及安裝相關(guān)軟件的方法。本書中數(shù)學(xué)相關(guān)的大部分知識(shí)都集中在本章中,其主要目的是讓讀者先對(duì)這個(gè)領(lǐng)域的知識(shí)產(chǎn)生興趣,這樣才能更好地深入學(xué)習(xí)和研究。在本章中不會(huì)插入大量的數(shù)學(xué)公式,這樣做會(huì)讓初學(xué)者望而卻步,在不斷消化公式的過程中喪失學(xué)習(xí)興趣和動(dòng)力。通過不斷實(shí)戰(zhàn)來學(xué)習(xí),可以累積成就感,這種自頂向下的方式不失為一種更好的學(xué)習(xí)方法。
第3章主要介紹在學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的過程中會(huì)經(jīng)常遇到的一些概念和定義。比如后向傳播(Back Propagation)、激活函數(shù)(Activation Function)、監(jiān)督學(xué)習(xí)(Supervised Learning)、無監(jiān)督學(xué)習(xí)(Unsupervised Learning),等等,這也是為之后學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)做準(zhǔn)備。在搭建一個(gè)完整的深度神經(jīng)網(wǎng)絡(luò)模型時(shí),就需要不斷地用到本章的內(nèi)容了。
第4章主要介紹深度神經(jīng)網(wǎng)絡(luò)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)。首先介紹卷積層、全連接層、池化層等相關(guān)內(nèi)容,之后又列舉了目前主流的一些卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),并對(duì)比它們之間的相同點(diǎn)和不同點(diǎn),以便于掌握不同的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和技術(shù)細(xì)節(jié)。
第5章主要介紹Python編程語言的相關(guān)知識(shí),目的是讓讀者掌握Python語言的語法定義和使用方式,并使用Python語言進(jìn)行功能代碼的編寫;還會(huì)介紹在處理計(jì)算機(jī)視覺問題時(shí)需要用到的兩個(gè)重要的Python包:NumPy和Matplotlib。本章內(nèi)容豐富,而且Python語言自身就很簡(jiǎn)單且易上手,讀者很快就能掌握Python這門編程語言。
第6章主要介紹如何使用PyTorch深度學(xué)習(xí)框架。PyTorch非常簡(jiǎn)單易用,能夠根據(jù)我們的需求快速搭建出我們想要的深度神經(jīng)網(wǎng)絡(luò)模型,這在很大程度上歸功于PyTorch基于動(dòng)態(tài)圖計(jì)算的特性,它與基于靜態(tài)圖計(jì)算的深度學(xué)習(xí)框架相比,有更多的優(yōu)勢(shì),比如PyTorch不僅速度快,還有許多功能強(qiáng)大的包可供調(diào)用。本章先介紹PyTorch中常用的包和類的使用方法;然后介紹如何使用PyTorch中的一些自動(dòng)化方法來提升代碼的執(zhí)行效率和簡(jiǎn)潔度;最后會(huì)通過一個(gè)綜合實(shí)例,使用本章的內(nèi)容解決一個(gè)實(shí)際的計(jì)算機(jī)視覺問題。
第7章一開始就是一個(gè)關(guān)于計(jì)算機(jī)視覺問題的實(shí)戰(zhàn),介紹了一種非常實(shí)用的深度神經(jīng)網(wǎng)絡(luò)復(fù)用方法,即遷移學(xué)習(xí)(Transfer Learning)。在掌握遷移學(xué)習(xí)的原理之后,會(huì)基于PyTorch對(duì)遷移學(xué)習(xí)進(jìn)行實(shí)戰(zhàn),并解決比之前更復(fù)雜的計(jì)算機(jī)視覺問題。對(duì)實(shí)戰(zhàn)代碼的解析會(huì)貫穿本章,讓讀者更深刻地理解代碼。
第8章講解如何基于PyTorch實(shí)戰(zhàn)圖像風(fēng)格遷移(Neural Style)。通過對(duì)本章的學(xué)習(xí),讀者會(huì)發(fā)現(xiàn),利用卷積神經(jīng)網(wǎng)絡(luò)不僅能處理圖片分類問題,只要有想法和創(chuàng)意,還能做更多、更有趣的事情。
第9章介紹一種多模型融合方法,在現(xiàn)有的模型遭遇性能提升瓶頸時(shí),可通過搭建一種經(jīng)過科學(xué)融合的新模型達(dá)到超過預(yù)期的泛化能力。本章依然會(huì)基于PyTorch對(duì)多模型融合方法進(jìn)行實(shí)戰(zhàn)。
第10章介紹一種區(qū)別于卷積神經(jīng)網(wǎng)絡(luò)的新神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡(jiǎn)稱RNN)。不同于卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的圖像特征提取能力,循環(huán)神經(jīng)網(wǎng)絡(luò)主要用于處理有序輸入的數(shù)據(jù)。為了方便讀者理解模型如何對(duì)有序數(shù)據(jù)進(jìn)行處理,本章會(huì)基于PyTorch使用循環(huán)神經(jīng)網(wǎng)絡(luò)來處理一個(gè)計(jì)算機(jī)視覺問題。
第11章講解自動(dòng)編碼器,它是一種使用非監(jiān)督學(xué)習(xí)方法的神經(jīng)網(wǎng)絡(luò)。自編碼器能夠?qū)崿F(xiàn)很多功能,本章會(huì)選取一個(gè)圖像去噪問題來進(jìn)行自動(dòng)編碼器實(shí)戰(zhàn)。
本書前6章的內(nèi)容可作為后5章的鋪墊,前6章的知識(shí)偏向基礎(chǔ)和理論,不過,只有掌握了這些內(nèi)容,才能從容應(yīng)對(duì)后5章的實(shí)戰(zhàn)。這個(gè)循序漸進(jìn)的過程會(huì)讓讀者對(duì)知識(shí)的理解更深刻,技能提升更迅速。
人工智能在近幾年大熱,網(wǎng)絡(luò)上的相關(guān)資料良莠不齊且沒有體系,即使有優(yōu)秀的干貨,對(duì)于基礎(chǔ)薄弱的初學(xué)者來說起點(diǎn)也太高。本書也是出于對(duì)這一現(xiàn)狀的考慮,通過從基礎(chǔ)到實(shí)戰(zhàn)、由淺入深的過程,讓讀者基于PyTorch來使用深度學(xué)習(xí)方法實(shí)際解決一些計(jì)算機(jī)視覺相關(guān)的問題,這樣,讀者在獲取知識(shí)的過程中會(huì)更有成就感,學(xué)起來也會(huì)更積極、主動(dòng)。
感謝家人的鼓勵(lì)和支持,也感謝張國霞編輯的幫助和付出,筆者才能以更好的方式將這部作品呈現(xiàn)在讀者的面前。希望讀者能遵從敏捷學(xué)習(xí)的思路,多實(shí)戰(zhàn)、多思考并不斷進(jìn)步。在本書中會(huì)有很多實(shí)例,讀者可以舉一反三、不斷實(shí)踐,在發(fā)現(xiàn)問題時(shí)要多思考,畢竟本書涉及的內(nèi)容有限,若想讓自己的能力得到更高層次的提升,則需要獲取更多的資料來充實(shí)自己。
唐進(jìn)民
2018年5月
輕松注冊(cè)成為博文視點(diǎn)社區(qū)用戶(www.broadview.com.cn),掃碼直達(dá)本書頁面。
- 提交勘誤:您對(duì)書中內(nèi)容的修改意見可在 提交勘誤 處提交,若被采納,將獲贈(zèng)博文視點(diǎn)社區(qū)積分(在您購買電子書時(shí),積分可用來抵扣相應(yīng)金額)。
- 交流互動(dòng):在頁面下方 讀者評(píng)論 處留下您的疑問或觀點(diǎn),與我們和其他讀者一同學(xué)習(xí)交流。
頁面入口:http://www.broadview.com.cn/34144
唐進(jìn)民
深入理解深度學(xué)習(xí)與計(jì)算機(jī)視覺知識(shí)體系,有扎實(shí)的PyTorch、Python和數(shù)學(xué)功底。長期活躍于Github、知乎等平臺(tái)并分享與深度學(xué)習(xí)相關(guān)的文章,具有一定的閱讀量和人氣。此前還在某AI網(wǎng)絡(luò)教育平臺(tái)兼職Mentor,輔導(dǎo)新學(xué)員入門機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。