MATLAB計算機視覺與深度學習實戰(zhàn)(第2版)
定 價:128 元
- 作者:劉衍琦
- 出版時間:2024/5/1
- ISBN:9787121475733
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP317
- 頁碼:400
- 紙張:
- 版次:01
- 開本:16開
本書詳細講解了29個實用的MATLAB計算機視覺與深度學習實戰(zhàn)案例(含可運行程序),涉及圖像去霧、答題卡識別、圖像分割、肝臟影像輔助分割系統(tǒng)、人臉二維碼編解碼系統(tǒng)、英文印刷體字符識別、圖像融合、全景圖像拼接、圖像壓縮和重建、視頻處理工具、運動目標檢測、路面裂縫檢測識別系統(tǒng)、車流量計數(shù)、三維網(wǎng)格模型特征點提取、數(shù)字水印、圖像水印、輔助自動駕駛、汽車目標檢測、手寫數(shù)字識別、以圖搜圖、驗證碼識別、圖像生成、影像識別、物體識別、圖像校正、時間序列分析、交通目標檢測、智能問答等,還講解了深度神經(jīng)網(wǎng)絡(luò)的拆分、編輯、重構(gòu)等多項重要技術(shù)及應(yīng)用,涵蓋了數(shù)字圖像處理中幾乎所有的基本模塊,并延伸到了深度學習的理論及應(yīng)用方面。工欲善其事,必先利其器。本書對每個數(shù)字圖像處理的知識點都提供了豐富、生動的案例素材,并以MATLAB為工具詳細講解了實驗的核心程序,涉及DeepLearning Toolbox、TensorFlow、Keras、Java等。通過對這些程序的閱讀、理解和仿真運行,讀者可以更加深刻地理解圖像處理的相關(guān)知識,并且更加熟練地掌握計算機視覺及深度學習在不同領(lǐng)域中的應(yīng)用。本書以案例為基礎(chǔ),結(jié)構(gòu)緊湊,內(nèi)容深入淺出,實驗簡單高效,適合高等院校計算機、通信和自動化等相關(guān)專業(yè)的教師、本科生、研究生,以及計算機視覺工程人員閱讀和參考。
本書主編:劉衍琦 技術(shù)圖書主編,擁有企業(yè)、研究所、高校從業(yè)經(jīng)歷,長期從事大數(shù)據(jù)和人工智能實踐應(yīng)用相關(guān)工作,主要涉及機器學習、計算機視覺和自然語言處理等領(lǐng)域。曾主持和參與多個科研項目,已出版十余部圖書,擁有多項國家專利。圖書代表作包括《計算機視覺與深度學習實戰(zhàn)》《MATLAB圖像與視頻處理實用案例詳解》等。王小超天津工業(yè)大學副教授,碩士生導(dǎo)師,大連理工大學博士,北京航空航天大學計算機學院博士后,中國計算機學會會員,天津市131創(chuàng)新型人才培養(yǎng)工程第三層次人才。研究方向為圖形圖像處理,發(fā)表論文30多篇,主持完成國家自然科學基金項目1項。詹福宇博士,畢業(yè)于西北工業(yè)大學航空學院飛行器設(shè)計專業(yè),四川省特聘專家,自貢市“鹽都百千萬英才計劃”青年拔尖人才,現(xiàn)任中電科航空電子有限公司無人機領(lǐng)域高級技術(shù)專家,中電科特種飛機系統(tǒng)工程有限公司副總工程師。主要從事飛行器設(shè)計、導(dǎo)航飛控系統(tǒng)、智能控制系統(tǒng)等研究工作。本書副主編:于召虎愛爾眼科醫(yī)院集團青東區(qū)域CEO,青島市西海岸新區(qū)政協(xié)委員。從事醫(yī)療綜合管理工作多年,主要研究方向為青少年近視防控及醫(yī)學領(lǐng)域大數(shù)據(jù)分析、醫(yī)學影像智能識別等。李雪梅擁有研究所、高校從業(yè)經(jīng)歷,主要研究方向為數(shù)據(jù)挖掘與分析、自然語言處理、大數(shù)據(jù)存儲管理與挖掘等。曾主持和參與多項科研項目,針對機器學習在信息安全領(lǐng)域中的應(yīng)用進行過深入研究并發(fā)表相關(guān)專利論文。楊昌玉技術(shù)圖書主編,Elastic認證專家,阿里云MVP(大數(shù)據(jù)領(lǐng)域最有價值專家),CSDN博客專家(排名Top150)。博客累計閱讀量超萬,并被阿里云、騰訊云、華為云、360doc、51CTO等知名媒體平臺轉(zhuǎn)載,在CSDN 2013年及2016年的博客征文大賽中獲特等獎。擁有企業(yè)、研究所、高校從業(yè)經(jīng)歷,長期從事大數(shù)據(jù)存儲和檢索相關(guān)工作。
第1章 基于圖像增強方法的圖像去霧技術(shù) 1
1.1 案例背景 1
1.2 空域圖像增強 1
1.3 直方圖均衡化 2
1.4 程序?qū)崿F(xiàn) 4
1.4.1 設(shè)計GUI 4
1.4.2 全局直方圖均衡化處理 5
1.4.3 限制對比度的自適應(yīng)直方圖均衡化處理 6
1.4.4 Retinex增強處理 8
1.4.5 方法評測 10
第2章 基于Hough變換的答題卡識別 15
2.1 案例背景 15
2.2 圖像二值化 15
2.3 傾斜校正 16
2.4 圖像分割 19
2.5 程序?qū)崿F(xiàn) 21
2.5.1 圖像灰度化 21
2.5.2 灰度圖像二值化 21
2.5.3 圖像平滑濾波 21
2.5.4 圖像校正 22
2.5.5 完整性核查 22
第3章 基于聚類算法的圖像分割 32
3.1 案例背景 32
3.2 K-means聚類算法的原理 32
3.3 K-means聚類算法的特點 33
3.4 K-means聚類算法的缺點 34
3.5 基于K-means聚類算法進行圖像分割 34
3.6 程序?qū)崿F(xiàn) 35
3.6.1 數(shù)據(jù)樣本間的距離 35
3.6.2 提取特征向量 36
3.6.3 圖像聚類分割 36
第4章 基于區(qū)域生長的肝臟影像輔助分割系統(tǒng) 40
4.1 案例背景 40
4.2 閾值分割算法 40
4.3 區(qū)域生長算法 41
4.4 基于閾值預(yù)分割的區(qū)域生長算法 42
4.5 程序?qū)崿F(xiàn) 42
第5章 基于主成分分析的人臉二維碼編解碼系統(tǒng) 46
5.1 案例背景 46
5.2 QR編碼簡介 46
5.2.1 QR編碼的符號結(jié)構(gòu) 46
5.2.2 QR編碼的基本特性 47
5.2.3 QR編碼的流程 48
5.2.4 QR譯碼的流程 49
5.3 主成分分析 49
5.4 程序?qū)崿F(xiàn) 50
5.4.1 人臉建庫 50
5.4.2 人臉識別 51
5.4.3 人臉二維碼 52
第6章 基于特征匹配的英文印刷體字符識別 58
6.1 案例背景 58
6.2 圖像預(yù)處理 58
6.3 圖像識別技術(shù) 59
6.4 程序?qū)崿F(xiàn) 61
6.4.1 設(shè)計GUI 61
6.4.2 回調(diào)識別 65
第7章 基于小波變換的圖像融合 67
7.1 案例背景 67
7.2 小波變換 68
7.3 程序?qū)崿F(xiàn) 70
7.3.1 設(shè)計GUI 70
7.3.2 圖像載入 70
7.3.3 小波融合 72
第8章 基于塊匹配的全景圖像拼接 75
8.1 案例背景 75
8.2 圖像拼接 75
8.3 圖像匹配 76
8.4 圖像融合 78
8.5 程序?qū)崿F(xiàn) 78
8.5.1 設(shè)計GUI 78
8.5.2 載入圖像 79
8.5.3 圖像匹配 81
8.5.4 圖像拼接 84
第9章 基于主成分分析的圖像壓縮和重建 90
9.1 案例背景 90
9.2 主成分分析降維的原理 90
9.3 由得分矩陣重建樣本 91
9.4 主成分分析數(shù)據(jù)壓縮比 92
9.5 基于主成分分析的圖像壓縮 92
9.6 程序?qū)崿F(xiàn) 92
9.6.1 主成分分析的代碼實現(xiàn) 92
9.6.2 圖像與樣本間的轉(zhuǎn)換 93
9.6.3 基于主成分分析的圖像壓縮 94
第10章 基于小波變換的圖像壓縮 98
10.1 案例背景 98
10.2 圖像壓縮基礎(chǔ) 98
10.3 程序?qū)崿F(xiàn) 99
第11章 基于GUI搭建通用的視頻處理工具 107
11.1 案例背景 107
11.2 視頻解析 107
11.3 程序?qū)崿F(xiàn) 108
11.3.1 設(shè)計GUI 108
11.3.2 實現(xiàn)GUI 110
第12章 基于幀間差分法進行運動目標檢測 120
12.1 案例背景 120
12.2 幀間差分法 120
12.3 背景差分法 121
12.4 光流法 122
12.5 程序?qū)崿F(xiàn) 123
第13章 路面裂縫檢測識別系統(tǒng)設(shè)計 132
13.1 案例背景 132
13.2 圖像灰度化 132
13.3 圖像濾波 134
13.4 圖像增強 136
13.5 圖像二值化 137
13.6 程序?qū)崿F(xiàn) 139
第14章 基于光流場的車流量計數(shù) 151
14.1 案例背景 151
14.2 光流法檢測運動物體的基本原理 151
14.3 光流場的計算方法 152
14.4 梯度光流場約束方程 153
14.5 Horn-Schunck算法 155
14.6 程序?qū)崿F(xiàn) 156
14.6.1 計算視覺系統(tǒng)工具箱簡介 156
14.6.2 基于光流場檢測汽車運動 157
第15章 基于鄰域支持的三維網(wǎng)格模型特征點提取 164
15.1 案例背景 164
15.2 網(wǎng)格特征提取 164
15.2.1 鄰域支持 165
15.2.2 網(wǎng)格特征點提取 166
15.3 程序?qū)崿F(xiàn) 170
第16章 基于小波變換的數(shù)字水印技術(shù) 174
16.1 案例背景 174
16.2 數(shù)字水印技術(shù)原理 175
16.3 典型的數(shù)字水印算法 177
16.4 數(shù)字水印攻擊和評價 179
16.5 基于小波變換的水印技術(shù) 180
16.6 程序?qū)崿F(xiàn) 182
16.6.1 準備宿主圖像和水印圖像 182
16.6.2 小波數(shù)字水印的嵌入 183
16.6.3 小波數(shù)字水印的檢測和提取 187
16.6.4 小波數(shù)字水印的攻擊實驗 189
第17章 基于BEMD與Hilbert曲線的圖像水印技術(shù) 193
17.1 案例背景 193
17.2 BEMD與Hilbert曲線 193
17.2.1 相關(guān)工作 194
17.2.2 案例算法 196
17.3 程序?qū)崿F(xiàn) 200
17.3.1 實驗結(jié)果與分析 200
17.3.2 核心程序 203
第18章 基于計算機視覺的輔助自動駕駛 209
18.1 案例背景 209
18.2 環(huán)境感知 210
18.3 行為決策 210
18.4 路徑規(guī)劃 211
18.5 運動控制 211
18.6 程序?qū)崿F(xiàn) 211
18.6.1 傳感器數(shù)據(jù)載入 211
18.6.2 創(chuàng)建追蹤器 213
18.6.3 碰撞預(yù)警 215
第19章 基于深度學習的汽車目標檢測 220
19.1 案例背景 220
19.2 基本架構(gòu) 220
19.3 卷積層 221
19.4 池化層 223
19.5 程序?qū)崿F(xiàn) 223
19.5.1 加載數(shù)據(jù) 223
19.5.2 構(gòu)建CNN 224
19.5.3 訓(xùn)練CNN 226
19.5.4 評估訓(xùn)練效果 227
第20章 基于深度學習的手寫數(shù)字識別 230
20.1 案例背景 230
20.2 卷積核 230
20.3 特征圖 232
20.4 池化降維 233
20.5 模型定義 234
20.6 MATLAB實現(xiàn) 244
20.6.1 解析數(shù)據(jù)集 244
20.6.2 構(gòu)建網(wǎng)絡(luò)模型 247
20.6.3 構(gòu)建識別平臺 250
20.7 Python實現(xiàn) 253
20.7.1 數(shù)據(jù)拆分 253
20.7.2 訓(xùn)練網(wǎng)絡(luò) 254
20.7.3 網(wǎng)絡(luò)測試 257
20.7.4 集成應(yīng)用 257
第21章 基于深度學習的以圖搜圖 260
21.1 案例背景 260
21.2 選擇模型 260
21.2.1 AlexNet 261
21.2.2 VGGNet 263
21.2.3 GoogLeNet 264
21.3 深度特征 266
21.4 程序?qū)崿F(xiàn) 269
21.4.1 構(gòu)建深度索引 269
21.4.2 構(gòu)建搜索引擎 272
21.4.3 構(gòu)建搜索平臺 275
第22章 基于深度學習的驗證碼識別 278
22.1 案例背景 278
22.2 生成驗證碼數(shù)據(jù) 278
22.3 驗證碼CNN識別 286
22.4 程序?qū)崿F(xiàn) 289
22.4.1 驗證碼樣本數(shù)據(jù)集標注 289
22.4.2 驗證碼樣本數(shù)據(jù)集分割 291
22.4.3 訓(xùn)練驗證碼識別模型 292
22.4.4 測試驗證碼識別模型 294
第23章 基于生成對抗網(wǎng)絡(luò)的圖像生成 297
23.1 案例背景 297
23.2 選擇生成對抗數(shù)據(jù) 297
23.3 設(shè)計生成對抗網(wǎng)絡(luò) 298
23.4 程序?qū)崿F(xiàn) 304
23.4.1 訓(xùn)練生成對抗模型 304
23.4.2 測試生成對抗模型 307
23.4.3 構(gòu)建生成對抗平臺 309
第24章 基于深度學習的影像識別 311
24.1 案例背景 311
24.2 選擇肺部影像數(shù)據(jù)集 311
24.3 編輯CNN遷移模型 313
24.4 程序?qū)崿F(xiàn) 319
24.4.1 訓(xùn)練CNN遷移模型 319
24.4.2 測試CNN遷移模型 323
24.4.3 融合CNN遷移模型 326
24.4.4 構(gòu)建CNN識別平臺 328
第25章 基于CNN的物體識別 330
25.1 案例背景 330
25.2 CIFAR-10數(shù)據(jù)集 331
25.3 VGGNet 332
25.4 ResNet 334
25.5 程序?qū)崿F(xiàn) 336
第26章 基于CNN的圖像校正 344
26.1 案例背景 344
26.2 傾斜數(shù)據(jù)集 344
26.3 自定義CNN回歸網(wǎng)絡(luò) 346
26.4 AlexNet回歸網(wǎng)絡(luò) 347
26.5 程序?qū)崿F(xiàn) 349
第27章 基于LSTM的時間序列分析 357
27.1 案例背景 357
27.2 厄爾尼諾—南方濤動指數(shù)數(shù)據(jù) 357
27.3 樣條分析 358
27.4 用MATLAB實現(xiàn)LSTM預(yù)測 359
27.5 用Python實現(xiàn)LSTM預(yù)測 363
第28章 基于YOLO的交通目標檢測 368
28.1 案例背景 368
28.2 車輛YOLO檢測 371
28.3 交通標志YOLO檢測 378
第29章 基于ChatGPT的智能問答 384
29.1 案例背景 384
29.2 網(wǎng)絡(luò)URL訪問 384
29.3 ChatGPT接口說明 385
29.4 構(gòu)建智能問答應(yīng)用 386