本書以數(shù)字圖像處理基礎理論與真實案例相結(jié)合的方式,深入淺出地介紹數(shù)字圖像處理的常見任務及實現(xiàn)技術。本書共9章,內(nèi)容包含數(shù)字圖像處理概述、圖像的基本變換、圖像增強與復原、形態(tài)學處理、圖像特征提取、圖像分割等技術,以及車牌檢測、QR碼的檢測、鋼軌表面缺陷檢測等案例。本書以Python為算法實現(xiàn)工具,大部分章包含操作實踐代碼和課后習題,幫助讀者在數(shù)字圖像處理基礎任務和案例中應用算法,鞏固所學內(nèi)容。
本書可以作為高校信息技術或人工智能相關專業(yè)的教材,也可以作為數(shù)字圖像處理應用的開發(fā)人員和從事數(shù)字圖像處理技術研究的科研人員的參考用書。對于有一定基礎和經(jīng)驗的讀者,也能幫助他們查漏補缺,深入理解并掌握相關原理和方法,提高解決實際問題的能力。
理論與實戰(zhàn)結(jié)合,以數(shù)字圖像處理常用技術與任務案例相結(jié)合。
以應用為導向,在多種場景下介紹數(shù)字圖像處理相關操作。
注重啟發(fā)式教學,帶給讀者從介紹到完成的完整工作流程體驗。
楊坦,中山大學博士,任教于華南師范大學數(shù)學科學學院,主講數(shù)學建模、數(shù)據(jù)挖掘等課程。主持和參與編寫多部教材,獲得兩項數(shù)字圖像處理方面的國家發(fā)明專利。
第 1章 數(shù)字圖像處理概述 1
1.1 認識數(shù)字圖像處理 1
1.1.1 了解數(shù)字圖像處理的起源 1
1.1.2 了解數(shù)字圖像處理的應用領域 4
1.1.3 了解圖像工程與數(shù)字圖像處理的關系 7
1.2 認識數(shù)字圖像 7
1.2.1 了解人眼的視覺系統(tǒng) 7
1.2.2 了解數(shù)字圖像 8
1.2.3 熟悉像素間的基本關系 9
1.3 認識數(shù)字圖像處理工具 11
1.3.1 熟悉常用數(shù)字圖像處理工具 12
1.3.2 數(shù)字圖像處理工具對比 13
1.4 了解數(shù)字圖像處理相關Python庫 14
1.4.1 了解Pillow庫 14
1.4.2 了解NumPy庫 15
1.4.3 了解scikit-image庫 15
1.4.4 熟悉OpenCV庫 16
小結(jié) 17
課后習題 18
第 2章 圖像的基本變換 19
2.1 讀寫圖像數(shù)據(jù) 19
2.1.1 讀取和顯示圖像 20
2.1.2 保存圖像 20
2.2 在圖像上繪制圖形 21
2.2.1 繪制簡單的圖形 21
2.2.2 標注圖像中的人臉區(qū)域 25
2.3 轉(zhuǎn)換圖像的顏色空間 26
2.3.1 了解顏色空間 26
2.3.2 顏色空間的相互轉(zhuǎn)換 31
2.4 圖像幾何變換 32
2.4.1 了解圖像的幾何變換 33
2.4.2 人臉圖像幾何變換 35
小結(jié) 39
課后習題 40
第3章 圖像增強與復原 41
3.1 使用空間濾波增強圖像 41
3.1.1 了解空間濾波 41
3.1.2 使用空間濾波平滑圖像 44
3.1.3 使用空間濾波銳化圖像 48
3.1.4 使用空間濾波模糊圖像 54
3.2 使用頻率域濾波增強圖像 56
3.2.1 了解頻率域濾波 56
3.2.2 使用頻率域濾波平滑圖像 58
3.2.3 使用頻率域濾波銳化圖像 65
3.3 復原車牌圖像 73
3.3.1 了解噪聲模型 74
3.3.2 復原只存在噪聲的圖像 77
小結(jié) 83
課后習題 83
第4章 形態(tài)學處理 85
4.1 腐蝕和膨脹車牌圖像 85
4.1.1 了解腐蝕與膨脹 85
4.1.2 腐蝕車牌圖像 89
4.1.3 膨脹車牌圖像 91
4.2 使用開/閉操作處理車牌圖像 92
4.2.1 了解開操作與閉操作 93
4.2.2 對車牌圖像進行開操作 94
4.2.3 對車牌圖像進行閉操作 96
4.3 使用基本的形態(tài)學算法處理圖像 97
4.3.1 了解基本的形態(tài)學算法 97
4.3.2 使用形態(tài)學算法處理車牌圖像 119
小結(jié) 122
課后習題 122
第5章 圖像特征提取 125
5.1 提取圖像的顏色特征 125
5.1.1 了解圖像的顏色特征 125
5.1.2 提取水質(zhì)圖像的顏色特征 134
5.2 提取圖像的紋理特征 136
5.2.1 了解圖像的紋理特征 136
5.2.2 提取組織切片圖像的紋理特征 140
5.3 提取圖像的輪廓特征 142
5.3.1 了解圖像的輪廓特征 142
5.3.2 提取電容器零件圖像的輪廓特征 144
5.4 提取圖像的形狀特征 145
5.4.1 了解圖像的形狀特征 145
5.4.2 提取車牌圖像的形狀特征 155
小結(jié) 156
課后習題 156
第6章 圖像分割 158
6.1 使用閾值分割圖像 158
6.1.1 閾值分割方法的基本原理 158
6.1.2 基于全局閾值的大津法 159
6.1.3 自適應閾值分割方法 161
6.1.4 使用閾值分割方法處理巖石樣本圖像 162
6.2 基于邊緣檢測的圖像分割 167
6.2.1 邊緣檢測 167
6.2.2 使用Hough變換檢測直線 173
6.2.3 基于Hough變換的QR碼分割 174
6.3 區(qū)域生長算法 175
6.3.1 區(qū)域生長算法的流程 176
6.3.2 使用區(qū)域生長算法分割心形圖像 176
6.4 結(jié)合空間域與色彩域的圖像分割算法 178
6.4.1 SLIC算法 178
6.4.2 QuickShift算法 181
小結(jié) 182
課后習題 182
第7章 車牌檢測 184
7.1 了解項目背景 184
7.2 分析項目需求 185
7.2.1 數(shù)據(jù)說明 185
7.2.2 項目目標 186
7.2.3 車牌檢測流程 187
7.3 定位車牌 187
7.3.1 車牌粗略定位 187
7.3.2 車牌精細定位 193
7.4 車牌字符分割 200
7.5 結(jié)果分析 204
小結(jié) 205
課后習題 205
第8章 QR碼的檢測 206
8.1 了解項目背景 206
8.2 分析項目需求 207
8.2.1 數(shù)據(jù)說明 207
8.2.2 項目目標 209
8.2.3 QR碼檢測流程 209
8.3 圖像的預處理 210
8.3.1 圖像灰度化 210
8.3.2 圖像去噪 211
8.3.3 灰度圖像二值化 214
8.4 定位塊的檢測 216
8.4.1 提取二值圖像的輪廓 217
8.4.2 輪廓嵌套結(jié)構(gòu)檢測 218
8.4.3 定位塊線掃描特征篩選 219
8.5 QR碼的分割與解析 222
8.5.1 計算3個定位塊在QR碼中的位置關系 222
8.5.2 計算定位塊的4個頂點的坐標 225
8.5.3 計算QR碼的4個角點的坐標及朝向 228
8.5.4 QR碼的幾何校正及縮放 229
8.5.5 QR碼的解析 230
小結(jié) 231
課后習題 231
第9章 鋼軌表面缺陷檢測 232
9.1 了解項目背景 232
9.2 分析項目需求 233
9.2.1 數(shù)據(jù)說明 233
9.2.2 項目目標 234
9.2.3 鋼軌表面缺陷檢測流程 235
9.3 圖像預處理 235
9.3.1 鋼軌表面不均勻光照的消除 236
9.3.2 基于連通性分析的黑邊去除 237
9.4 基于區(qū)域生長算法的鋼軌表面缺陷檢測 240
9.4.1 種子點的提取 240
9.4.2 上閾值的自適應選擇 242
9.4.3 區(qū)域生長算法的效果分析 249
小結(jié) 249
課后習題 250
參考文獻 251