關于我們
書單推薦
新書推薦
|
深度學習:從入門到實戰(zhàn)
深度學習:從入門到實戰(zhàn)摒棄了枯燥的理論推導,以大量實戰(zhàn)應用案例及知識模塊等內容幫助機器學習領域的初、中級程序員踏實通過深度學習的技術門檻,切實提升開發(fā)技能,積累開發(fā)經驗。實戰(zhàn)應用案例豐富,深入淺出地解析深度學習的方法論和深度學習實戰(zhàn)應用是本書的一大特色,全書詳細講述了深度學習中涉及的神經網絡基礎知識、方法論解析與核心技術;同時從12個落地實踐角度闡述了深度學習的實踐應用。此外,本書中所有案例的代碼程序均可以運行,讀者按照相應說明,即可得到預期效果,希望本書的努力可以為讀者在深度學習領域提供一定幫助,這就是我們的動力與追求。
前言 隨著云計算、大數據、人工智能技術的深度發(fā)展,大數據帶來了海量多源異構數據的積累,云計算帶來了超強計算能力,在這樣呼喚創(chuàng)新的新時代背景下,深度學習起起伏伏幾十載,今天終于走上了人工智能的巔峰?梢哉f,經過數據、算力(計算能力)、算法的深度融合和推動,深度學習已經成長為目前最主流并且最具有應用前景的機器學習技術。本書盡量避免過多繁雜的理論推導,力圖用深入淺出的語言表達,讓更多讀者輕松邁入深度學習的大門。同時,希望通過大量的案例和實戰(zhàn)應用,幫助讀者快速上手、入門深度學習,了解深度學習可以應用于哪些領域,擅長解決哪些經典難題,以便在后續(xù)的學習研究過程中,從本書講解的方法論解析中獲得啟迪,找到真正屬于自己的解決人工智能領域問題的金鑰匙。 讀者對象 本書適合以下讀者群體閱讀: (1)對人工智能、大數據、云計算等新興技術感興趣的愛好者 人工智能無疑是站在巨人肩膀大數據和云計算上的產物,可以說,數據和計算能力的支撐,是人工智能發(fā)展的基石,而深度學習就是這個領域最頂層的技術,因此,本書可以幫助讀者在入門深度學習的同時,對大數據和云計算技術有整體把握,理解深度學習在云計算、大數據時代的重要性。 (2)開源項目的愛好者 深度學習技術已經創(chuàng)造了大量的開源項目,擁有大量的開源項目維護團隊和貢獻者。例如,Google開源的TensorFlow框架、賈揚清博士(現就職于Facebook)開源的Caffe框架、亞馬遜主推的MXNet框架等等。本書在實戰(zhàn)案例部分的講解涉及了不同開源框架的源代碼,以期在眾口難調的深度學習領域,實現調眾口的作用,幫助讀者了解和掌握主流深度學習框架源代碼的設計思想和核心技術。 (3)深度學習、機器學習、人工智能技術的開發(fā)者 不論是在市場還是技術層面,人工智能領域的關注度持續(xù)火熱。很多未入門深度學習的讀者都想近距離感受深度學習的魅力,而很多深度學習的初級開發(fā)者也苦于該領域的技術飛速更新迭代,很難梳理出適合自己領域的知識圖譜。因此,本書在講解中兼顧了對入門級讀者關于基本概念、基本知識點的介紹,并加強了在實戰(zhàn)部分對領域知識的總結,使得不同層次的開發(fā)者都可以從本書中得到急需的方法與技巧指導。 (4)高等院校計算機相關專業(yè)的大四和一年級碩士研究生 從學科分類的本質屬性上講,深度學習與計算機科學與技術學科有很深的淵源,而高等院校計算機相關專業(yè)的學生,不論是在未來就業(yè)還是在求學期間的科學研究,都是深度學習領域研究的新生力量和重要創(chuàng)新、推廣、優(yōu)化、提升的動力儲備。本書在講解相對專業(yè)的理論知識點時,會穿插分析其中蘊含的方法論思想,希望可以為正在書海作舟的讀者們提供一些啟迪,增強對深度學習所涉及方法論知識的理解,為今后的工作、學習、生活提供一定的指導和幫助。 本書愿景 對于大多數理工科出身的程序員來說,人文社科類的思想、理論、見解,就像是海市蜃樓,愿景是如此美好,但是現實的骨感、抽象讓其望而卻步。因此本書可以作為以深度學習基礎理論為根基,以其蘊含的方法論思想為導向,幫助理工男(女)掌握深度學習核心技術,并懷著智者情懷,去懸壺濟世,融入新時代的人工智能大潮,去踐行長風破浪會有時,直掛云帆濟滄海的宏圖大志。 作為技術類的科技書籍,本書希望幫助讀者解析深度學習蘊含的方法論思維模式,同時培養(yǎng)其掌握深度學習實戰(zhàn)應用的技能,進而完成在深度學習領域入門精通實戰(zhàn)的不斷提升,完成從新手小白到領域行家的轉變,從技能和方法論兩個層面上,全面武裝讀者,完成深度學習:從入門到實戰(zhàn)。 深度學習的意義 掌握深度學習的好處如下: (1)從個人發(fā)展的角度講,作為一名新時代的程序員或者IT技術相關領域工作者,人工智能領域人才的極度短缺,這是一個全球性的行業(yè)現狀,因此,以深度學習為代表的核心技術也就是該領域從業(yè)者的核心競爭力。也就是說,掌握了深度學習技術,也就具備了進軍人工智能的通關令牌,這對接下來的技術提升、就業(yè)等方面都具有很大的推動作用。 (2)從知識學習的角度講,深度學習是一個交叉學科的產物,是橫跨現代生物學中的腦科學、心理學以及計算機科學中的數據工程、軟件工程、程序設計、并行計算等軟硬兼顧的技術。掌握了深度學習,讀者將會對計算機領域的相關技術構建起一個更加清晰的知識圖譜,即便在計算機科學領域知識不斷拓展,新概念、新知識層出不窮的今天,掌握深度學習的核心思想與技術,對優(yōu)化個人知識結構的合理性,提高綜合能力的全面性,都是大有裨益的。 (3)從思維模式的角度講,深度學習不僅是抽象的理論技術,更是一種鮮活有溫度的思維模式,熟練掌握深度學習的核心思維模式,構建優(yōu)化的體系全局觀,運用局部微調、逐層優(yōu)化的處事策略,在各個領域都會產生普遍的適用價值。因此,也希望本書在思維模式上對讀者有所啟迪。 成為專業(yè)深度學習程序員的臺階 我們都知道,從小白到專業(yè)的程序員,是有幾個臺階需要逐一跨越的,下面梳理一下深度學習程序員的成長過程: 第一個臺階,操作系統入門。操作系統是連接用戶與機器之間的橋梁,掌握Linux操作系統的基礎知識、基本操作是邁進深度學習大門的第一步。雖然,目前也有基于Windows系列操作系統的深度學習開發(fā)組件,但從開發(fā)者成長的長遠角度講,不建議長期依賴Windows系統,對于一個開發(fā)者來講,自由、可控、高效永遠是第一追求。 第二個臺階,掌握編程語言。目前深度學習最友好的編程語言是Python。因此,在掌握一定面向對象編程技巧的基礎上,不斷加深對Python編程模式、豐富的庫函數的理解與運用,是學習深度學習的重要階段。如果對Java和C(或C )有一定編程學習基礎,這會對深度學習的進階有很大幫助。 第三個臺階,初步理解深度學習的基本原理。即使對機器學習、神經網絡等基礎理論及算法無法全面吃透,但是從宏觀上了解其核心思想,也是對下一階段的實際運用大有好處。畢竟,理論可以指導實踐,同時實踐可以反哺理論的完善與理解。 第四個臺階,初步掌握深度學習的框架。有了對深度學習基本原理的理解,結合目前主流的深度學習框架,對其進行深入剖析,從實戰(zhàn)的角度促進對原理的理解。至于深度學習框架,Keras和Caffe目前比較適合初學者入門。 第五個臺階,在實戰(zhàn)中增強對基本原理和框架的駕馭能力。理論和實踐是相輔相成的,將二者相互促進、相互融合是一個成功的深度學習程序員的最高境界。 在跨越了這五個臺階之后,只需要再經歷一些大型實戰(zhàn)項目的深度歷練,即可成為一個優(yōu)秀的深度學習程序員。 深度學習的進階地圖 結合多年的人工智能領域學習和成長經驗,我們勾勒出一個深度學習的進階地圖(roadmap)。 學習 階段 學習內容和目標 上機 實踐 入門 操作系統基礎知識,尤其強化對Linux操作系統的運用技能訓練;編程語言的熟練掌握,尤其加強的Python的基本語法規(guī)則、函數庫的掌握與運用 18小時 精通 理解深度學習的基本原理,掌握神經元模型、BP神經網絡、卷積神經網絡、循環(huán)神經網絡、生成式對抗網絡的核心技術。 24小時 掌握深度學習的主流開發(fā)框架,至少精通一種成熟的框架。以Caffe為例,可以實現對深度學習的基本原理的實現,包括單神經元、單層網絡、多層網絡、BP算法、卷積神經網絡、循環(huán)神經網絡、生成式對抗網絡的實現及參數調優(yōu),并且可以對模型結構進行適度優(yōu)化調整。 24小時 實戰(zhàn) 結合深度學習基本理論及開發(fā)框架,對語音、視頻、自然語言理解、計算機視覺等方面進行實戰(zhàn)化項目開發(fā)和驗證,并構建不同領域解決問題方案的架構體系,針對效率、效果、性能等方面的問題,可以創(chuàng)造性地提出優(yōu)化的高性能深度學習模型,并在實戰(zhàn)中取得良好效果。 36小時 根據深度學習的進階地圖和學習經驗,我們設計了本書的內容。全書共12章,分為3篇,下面分別介紹這三篇的內容安排。 第1篇深度學習入門篇 第1篇可被視作是深度學習相關基礎知識的濃縮,幫助讀者回顧并初步了解深度學習最核心的內容。深度學習的入門篇包括第0~2章,其中第0章旨在幫助讀者理清深度學習、機器學習、人工智能之間的關系,從宏觀上把握整個深度學習領域的生態(tài)系統,了解深度學習的發(fā)展方向及前沿趨勢。第1章提綱挈領地講解矩陣理論、概率理論、機器學習方法、神經網絡以及部分最優(yōu)化原理,旨在幫助讀者夯實深度學習的理論基礎,為進一步探索深度學習的核心技術充實知識儲備。第2章旨在幫助讀者揭開神經網絡的神秘面紗,從單個M-P神經元到感知機模型,再到多層前饋神經網絡,逐步進入深度神經網絡的核心世界,讓讀者按照神經網絡不斷完善優(yōu)化的成長軌跡,感受一段深度學習的成長歷程。 總的來說,第1篇是拋磚引玉,畢竟深度學習是一個多學科交叉融合的技術,與其面面俱到不如突出重點,希望讀者從本篇開始夯實深度學習的理論基礎。 第2篇深度學習方法論解析篇 方法論是技術的靈魂;反之,技術是方法論的客觀體現。第2篇是深度學習的方法論解析篇,包括第3~5章,通篇貫穿著方法論的辯證思想,從圖像、視頻、語音等領域的關鍵技術出發(fā),分別講解卷積神經網絡(CNN)、生成式對抗網絡(GAN)、循環(huán)神經網絡(RNN)的核心技術及其方法論思想。其中第3章以卷積神經網絡中逐層抽象、平移不變、局部連接(稀疏)、權值共享等為核心,全方位詮釋人生智慧中升華、適應、舍得、合作的精髓。第4章解讀了生成式對抗網絡中蘊含的博弈、學習、平衡的方法論思想。第5章通過案例剖析,講解循環(huán)神經網絡中涉及的記憶與遺忘,借鑒與提升等思想。 本書的一大亮點就是在講解深度學習核心技術的同時,用大量的知識擴容和認知提升模塊剖析其中蘊含的方法論思想,以期對深度學習進行內外兼修講解和重塑。 第3篇深度學習實戰(zhàn)篇 戰(zhàn)場是檢驗戰(zhàn)斗力的試金石。結合第1篇、第2篇的知識儲備,第3篇從實戰(zhàn)應用的角度展示深度學習在多個維度的應用場景,包括第6~11章。工欲善其事必先利其器,第6章介紹主流的深度學習工具及框架,對Python、MATLAB、TensorFlow、Caffe等工具進行了講解。第7章從圖像分類、特征提取、遷移學習、特征可視化角度全面解析首個深度卷積神經網絡模型AlexNet的原理與實戰(zhàn)應用。第8章從Hello Word級別的手寫數字開始,依次對手寫漢字識別、手寫數字角度矯正進行實戰(zhàn),將手寫體識別進行到底。第9章以視頻監(jiān)控中人臉檢測和物體檢測為例,闡釋深度學習在安防領域的研究意義和研究現狀,剖析了深度學習在視頻監(jiān)控檢測中的實戰(zhàn)應用。第10章介紹了信息安全領域的信息隱藏技術,并結合團隊最新研究成果,以生成式對抗網絡為核心技術提出無載體的信息隱藏方案。第11章以軟件設計大賽題目為背景,利用深度學習技術為服裝檢測問題提出可行的解決方案,是深度學習技術在服裝識別技術的有益探索。 本篇是對全書講解知識點的總結與提升,只有對知識點的融匯才能實現能力上的貫通,通過對所學知識的實戰(zhàn)應用,相信讀者可以真正的融匯貫通。 本書學習建議 本書共分為3篇,第1篇為深度學習的入門篇,第2篇為深度學習的方法論解析篇,第3篇為深度學習的實戰(zhàn)篇。如果你是一名具有一定機器學習、人工智能基礎和實際操作經驗的讀者,那么可以直接閱讀后兩篇。方法論解析篇側重于對經典深度學習模型的原理講解及其蘊含的方法論解析,實戰(zhàn)篇側重于多領域的案例實戰(zhàn)和解決方案分析,讀者可以按實際情況自行安排學習計劃。但是,如果你是一名初學者,建議你從第1篇開始仔細研讀所有的知識點,這對后續(xù)的學習是至關重要的。 后續(xù)學習與提高 有了本書的學習基礎,讀者可以從以下兩個方向進行后續(xù)學習和提高。 (1)繼續(xù)對深度學習的基礎理論進行深入學習,尤其對最優(yōu)化技術、矩陣論、并行計算等核心知識進行深入剖析,探索深度學習在理論上的突破。 (2)繼續(xù)將所學的深度學習理論和模型應用到更廣闊的領域,包括語音、圖像、視頻、自然語言理解、計算機視覺;其實,對其中任意一個領域的不斷探索都可以讓你成為該領域的專家。 當然,希望你不斷保持對人工智能領域技術的探索熱情,繼續(xù)閱讀更多的深度學習著作,不斷提升自己的核心技術能力,真正成為深度學習的行家里手。 輔助學習材料 Caffe官方教程中譯本 人工智能頂級會議論文 本書源代碼 本書參考文獻和全書參考資源 以上內容,我們整體打包放在了封底二維碼中,讀者可掃碼下載學習。 致謝 深度學習的原理與人的一生極為相似,都是在以不斷追求目標利益最大化的前提下,反復的磨練、妥協、修正、適應、取舍、優(yōu)化,不斷地權衡利弊,不斷地折中妥協,不斷地在舍得中博弈決策,最終實現目標效益的最優(yōu)化。筆者希望在講解理論技術的同時,將這些人生感悟與讀者分享,給還在不斷探索與追逐夢想的讀者一些啟迪,找到屬于自己的螺旋式上升,波浪式前進的人生之路。 在本書的撰寫過程中,崔翛龍教授、張之明教授提出了大量寶貴建議,同時感謝碩士研究生曾子賢、彭圳生、段妍羽、王赟、張俊等做了資料整理以及文字校正工作,在此表示由衷的感謝。 感謝武信和位智團隊的小伙伴們,從你們那里,我看到了一個充滿活力、充滿創(chuàng)造力,能打仗、打勝仗的鐵一般的隊伍。 感謝本書的所有編輯,感謝大家的辛勤勞動,是你們的支持與鼓勵才有這本書的順利出版。 最后感謝我的家人以及未來的妻子文文,你們是我不懈奮斗的動力。 編者 2018年4月
高志強,軍隊指揮學武警信息化研究方向博士,畢業(yè)于中國人民武裝警察部隊工程大學,武警部隊首屆軍事大數據工程專業(yè)籌備組成員。作為骨干成員參與研制多項武警部隊信息化裝備及平臺系統,參與國家自然科學基金2項、陜西省自然科學基金1項。主要研究方向:深度學習、大數據與智能計算、面向大數據開放與治理的差分隱私保護數據發(fā)布關鍵技術研究及應用、粒子群優(yōu)化算法等。
黃劍,現為武警工程大學教員,技術十一級,少校警銜,主要研究領域包括,武警信息化,軍隊指揮學,軍事智能系統。 李永,男,博士,碩士生導師,武警工程大學計算機基礎教研室副主任。2011年12 月獲國防科大計算機科學與技術博士學位。中國計算機學會會員。研究領域為機器學習,模式識別、圖像處理和國產自主可控軟件應用。長期從事《程序設計基礎》、《高級人工智能》、《計算機邏輯學》、《數據庫基礎》等計算機領域教學工作,發(fā)表論文20 余篇。曾獲武警部隊科技進步一等獎和軍隊教學成果三等獎。 劉明明,男,碩士學歷,武警工程大學教員。研究方向為信息隱藏,深度學習。 第1篇深度學習入門篇 第0章引言:從人工智能到深度學習 2 0.1 人工智能與機器學習 2 0.1.1 人工智能 3 【知識擴容】大數據帶來的挑戰(zhàn) 4 0.1.2 機器學習 4 【認知提升】細說圖靈測試 5 【新觀點】機器學習適合做什么 6 0.2 機器學習的模式 7 【知識擴容】人工智能學派之爭 8 0.3 深度學習 9 【案例0-1】天氣預報深度神經網絡 9 【認知提升】說文解字深度學習 11 【應知應會】深度與學習 12 【最佳實踐】減小損失函數的方法 12 0.4 溫故知新 13 0.5 停下來,思考一下 14 第1章深度學習入門基礎 16 1.1 數學基礎 16 1.1.1 矩陣論基礎 17 【案例1-1】像指揮官一樣對矩陣進行排兵布陣 18 1.1.2 概率論基礎與重要結論 19 【應知應會】MATLAB中概率論基本命令 21 1.2 機器學習基礎 21 1.2.1 監(jiān)督學習 22 【應知應會】數據挖掘與機器學習 22 1.2.2 無監(jiān)督學習 23 【案例1-2】無監(jiān)督學習中的k-means聚類 24 1.3 神經網絡基礎 26 1.3.1 生物神經網絡 26 【認知提升】探索初級視覺皮層的啟示 26 1.3.2 人工神經網絡與神經元模型 27 【知識擴容】Walter Pitts其人 27 1.4 最優(yōu)化理論基礎 28 1.4 1 最優(yōu)化問題 29 1.4.2 多目標優(yōu)化問題 30 1.4.3 群智能優(yōu)化方法 31 【案例1-3】指揮群智能團隊逐漸逼近問題最優(yōu)解 32 1.5 溫故知新 35 1.6 停下來,思考一下 36 第2章神經網絡原理與實現 38 2.1 線性問題與感知機 38 2.2 多層前饋神經網絡與BP算法 41 2.2.1 多層前饋神經網絡 41 【案例2-1】具有異或邏輯的感知機 42 2.2.2 多層前饋神經網絡的訓練 43 【案例2-2】訓練前饋神經網絡 47 【應知應會】梯度下降算法 47 2.3 其他神經網絡 48 2.3.1 徑向基函數網絡 48 2.3.2 自組織映射網絡 49 【案例2-3】用SOM網絡聚類Iris數據 49 2.3.3 深度神經網絡 50 2.4 溫故知新 53 2.5 停下來,思考一下 53 第2篇深度學習方法論解析篇 第3章卷積神經網絡(CNN) 58 3.1 卷積神經網絡入門 58 3.1.1 生物機理 59 3.1.2 拓撲結構 61 【知識擴容】圖像處理中的全連接網絡與卷積網絡 63 3.1.3 卷積神經網絡的特點 63 3.2 卷積神經網絡的關鍵技術 64 3.2.1 卷積 65 【案例3-1】利用圖像的卷積操作對66的單通道圖像進行瘦身 66 【知識擴容】多通道卷積 67 【案例3-2】構建基本CNN 68 【認知提升】不同角度看卷積 68 3.2.2 池化 69 【最佳實踐】小技巧總結 71 【案例3-3】在Keras框架中實現MaxPooling 71 【知識擴容】VGG卷積神經網絡 72 【案例3-4】揭開VGG和GoogLeNet的廬山真面目 73 【認知提升】GoogleNet的Inception結構 75 3.2.3 扁平化 75 【案例3-5】實現圖像特征矩陣的扁平化操作 76 3.2.4 關鍵技術小結 76 【新觀點】卷積神經網絡發(fā)展方向 77 3.3 綜合案例:三步教你構建手寫字識別神經網絡 78 【應知應會】Adam優(yōu)化算法 79 【知識擴容】CNN在自然語言處理中的應用 81 3.4 溫故知新 82 3.5 停下來,思考一下 82 第4章生成式對抗網絡(GAN) 84 4.1 生成式對抗網絡基本原理 84 4.1.1 GAN的核心思想 84 【認知提升】GAN與博弈理論 85 4.1.2 GAN數學描述 86 【認知提升】囚徒困境博弈模型 86 4.1.3 GAN的網絡結構與核心技術 87 4.1.4 GAN的改進模型 90 【案例4-1】ACGAN基于TensorFlow框架的實現(圖像為6464單通道數據) 91 【認知提升】博弈理論與多目標優(yōu)化 98 4.2 GAN應用 99 4.2.1 數據缺失 100 4.2.2 多標簽預測 101 4.2.3 根據環(huán)境生成相應數據 102 4.2.4 數據特征表示 103 4.2.5 圖像檢索 104 4.2.6 文本到圖像翻譯 104 4.2.7 醫(yī)學方面 105 4.3 綜合案例:動手構建生成式對抗網絡 106 4.3.1 基于MATLAB的GAN 106 4.3.2 基于TensorFlow的GAN 108 4.4 溫故知新 115 4.5 停下來,思考一下 115 第5章循環(huán)神經網絡(RNN) 117 5.1 循環(huán)神經網絡基本原理 117 5.1.1 問題背景 118 【案例5-1】詞性標注(我學習循環(huán)神經網絡) 118 【應知應會】one-hot編碼 119 【認知提升】神經網絡的記憶問題 120 5.1.2 循環(huán)神經網絡基本思想 120 【最佳實踐】RNN的梯度爆炸和消失問題 123 5.2 LSTM網絡基本原理 124 5.2.1 LSTM的關鍵技術 124 【知識擴容】遞歸神經網絡(Recursive Neural Network,RNN) 128 5.2.2 LSTM的應用 128 【應知應會】自然語言處理 129 5.3 綜合案例:基于LSTM的語音預測 130 5.3.1 加載數據 130 5.3.2 定義網絡結構 130 5.3.3 網絡訓練及評估 131 【應知應會】深度學習代碼一般結構 132 5.4 綜合案例:基于循環(huán)神經網絡的手寫數字識別 132 5.4.1 數據準備及參數設置 132 5.4.2 網絡構建 133 5.4.3 網絡訓練 134 5.5 綜合案例:基于LSTM的自然語言處理 135 5.5.1 數據收集及編碼 135 5.5.2 構建LSTM模型 136 5.5.3 模型訓練 137 5.5 溫故知新 137 5.6 停下來,思考一下 138 第3篇深度學習實戰(zhàn)篇 第6章深度學習主流工具及框架 142 6.1 MATLAB基本語法與深度學習工具箱 142 6.1.1 MATLAB簡介 142 6.1.2 MATLAB安裝 143 6.1.3 MATLAB常用語法 146 6.1.4 基于MATLAB的深度學習工具箱 149 【案例6-1】基于MATLAB的AlexNet模型初探 151 【案例6-2】用安裝好的深度學習工具箱中的卷積神經網絡做mnist 手寫數字識別,來驗證工具箱的有效性 152 6.2 Python基本語法、庫與開發(fā)工具 153 6.2.1 Python簡介 153 6.2.2 Python安裝 153 6.2.3 Python常用語法 155 【應知應會】Python常見錯誤提示及原因 156 6.2.4 常用Python庫 157 6.2.5 常用Python開發(fā)工具 161 【知識擴容】PyCharm常用快捷鍵 162 【案例6-3】Python送你圣誕帽 163 6.3 Caffe框架及環(huán)境搭建 165 6.3.1 Caffe簡介 165 6.3.2 Caffe環(huán)境搭建 166 【案例6-4】手寫體數字識別 167 6.4 TensorFlow框架及環(huán)境搭建 167 6.4.1 TensorFlow簡介 167 6.4.2 TensorFlow與Keras框架的關系 168 6.4.3 Windows 10上TensorFlow的環(huán)境搭建 169 6.5 其他常用框架 177 6.5.1 微軟CNTK 177 6.5.2 MXNet 178 6.5.3 Torch 178 6.5.4 Theano 179 6.6 溫故知新 180 6.7 停下來,思考一下 180 第7章 AlexNet關鍵技術與實戰(zhàn) 182 7.1 剖析AlexNet網絡結構 182 【知識擴容】ImageNet與李飛飛 186 7.2 AlexNet關鍵技術 187 7.2.1 ReLU激活函數 187 7.2.2 標準化 187 【應知應會】激活函數的飽和與不飽和 188 【認知提升】馬太效應、二八定律、長尾理論 188 7.2.3 Dropout 189 7.2.4 多GPU 190 【應知應會】CUDA 190 7.3 AlexNet與LeNet對比 191 7.4 CNN通用架構 191 7.5 綜合案例:基于AlexNet的深度學習實戰(zhàn) 192 7.5.1 靜態(tài)圖像分類 192 7.5.2 用AlexNet做特征提。╢eature extraction) 194 7.5.3 用AlexNet做遷移學習 197 7.5.4 卷積神經網絡的特征可視化 200 7.6 溫故知新 209 7.7 停下來,思考一下 210 第8章將手寫體識別進行到底 211 8.1 手寫體識別江湖地位 211 8.2 手寫數字識別 212 8.2.1 手寫數字的無監(jiān)督學習 213 【應知應會】稀疏表示 213 【應知應會】無監(jiān)督學習中的自動編碼器 219 8.2.2 手寫數字的全連接神經網絡識別 219 【應知應會】softmax函數介紹 220 【認知提升】熵 220 8.2.3 手寫數字的卷積神經網絡識別 221 8.3 手寫漢字識別 229 8.3.1 數據讀取及預處理 229 【最佳實踐】數據讀取 231 8.3.2 卷積神經網絡構建 231 8.3.3 網絡模型訓練及結果可視化 233 8.4 綜合案例:手寫數字旋轉角度識別 234 8.4.1 數據載入 235 8.4.2 網絡構建 235 8.4.3 網絡訓練 236 8.4.4 測試預測精度 236 8.4.5 殘差展示 237 8.4.6 偏轉角度矯正及可視化 237 8.5 溫故知新 238 8.6 停下來,思考一下 239 第9章基于深度學習的視頻檢測 240 9.1 人物監(jiān)控視頻問題研究意義及現狀 240 9.1.1 研究意義 240 9.1.2 國內外研究現狀 242 9.2 研究情況介紹 244 9.2.1 研究內容 244 9.2.2 研究目標及關鍵科學問題 244 【案例9-1】基于Python庫的人臉識別 245 9.3 綜合案例:基于深度學習的人臉視頻檢測 247 9.3.1 環(huán)境準備 247 9.3.2 數據處理 248 9.3.3 模型訓練 250 9.3.4 監(jiān)控代碼 255 9.4 綜合案例:基于深度學習的物體視頻檢測 256 9.4.1 AlexNet回顧 256 9.4.2 入門版 257 9.4.3 初級版 258 9.4.4 加強版 259 9.4.5 升級版 260 9.4.6 豪華版 261 【案例9-2】讓手機當網絡攝像頭 262 9.5 溫故知新 262 9.6 停下來,思考一下 263 第10章基于深度學習的信息隱藏 264 10.1 數字圖像隱寫分析研究現狀及意義 264 10.1.1 研究意義 267 10.1.2 研究現狀 268 10.1.3 潛在的應用 268 10.2 數字圖像隱寫分析概述 270 【案例10-1】基于四叉樹編碼的空間域高保真可逆信息隱藏 271 10.3 基于ACGAN的無載體信息隱藏 272 10.3.1 生成式對抗網絡回顧 272 【應知應會】零和博弈 272 10.3.2 基于ACGAN的信息隱藏關鍵技術 274 10.4 綜合案例:ACGAN信息隱藏實戰(zhàn) 276 10.4.1 方案概述 276 【認知提升】可逆信息隱藏 277 10.4.2 隱藏算法與提取算法的實現 278 10.4.3 性能分析 286 10.4.3 可靠性 287 10.4.4 安全性 287 10.5 溫故知新 288 1
你還可能感興趣
我要評論
|