數(shù)字圖像處理與深度學(xué)習(xí)技術(shù)應(yīng)用
定 價:69 元
叢書名:人工智能與智能系統(tǒng)人才培養(yǎng)系列
- 作者:楊淑瑩
- 出版時間:2024/8/1
- ISBN:9787121483011
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP391.413;TP181
- 頁碼:312
- 紙張:
- 版次:01
- 開本:16開
本書介紹了數(shù)字圖像處理技術(shù)和深度學(xué)習(xí)技術(shù),以及這些技術(shù)的應(yīng)用,全書由12章組成。前九章主要介紹數(shù)字圖像處理技術(shù),內(nèi)容包括:Python 環(huán)境搭建、位圖基礎(chǔ)、圖像的顯示、圖像的幾何變換、圖像灰度變換、圖像的平滑處理、圖像銳化處理、圖像分割及測量、圖像的形態(tài)學(xué)處理,后三章主要介紹深度學(xué)習(xí)技術(shù),將數(shù)字圖像處理技術(shù)和深度學(xué)習(xí)技術(shù)相結(jié)合應(yīng)用于項目開發(fā),內(nèi)容包括基于卷積神經(jīng)網(wǎng)絡(luò)CNN 模型的漢字識別、基于Faster RCNN 模型的手勢識別、基于卷積神經(jīng)網(wǎng)絡(luò)CNN 模型的語音識別共三個項目的開發(fā)技術(shù)。本書僅僅介紹基本的理論知識,同時介紹將理論轉(zhuǎn)化為代碼的實現(xiàn)步驟和基于Python 開發(fā)工具的編程代碼,并且可以將處理前與處理后的圖像進(jìn)行對照比較。實例程序的框架結(jié)構(gòu)簡單,代碼簡潔,使初學(xué)Python 者很快就掌握圖像處理與圖像識別技術(shù)。
楊淑瑩,博士,天津理工大學(xué)計算機(jī)科學(xué)與工程學(xué)院教授,碩士研究生導(dǎo)師,天津市“教學(xué)名師”,中國圖像圖形學(xué)學(xué)會第五屆理事會學(xué)術(shù)委員會委員。多年來在圖像、語音、時間序列等方面進(jìn)行模式識別相關(guān)工作的深入研究,涉及模式識別,數(shù)字圖像處理、信號與信息處理、智能計算等領(lǐng)域。承擔(dān)并完成國家級、市級自然科學(xué)基金項目多項,獲得天津市科學(xué)技術(shù)進(jìn)步獎2項,發(fā)表論文50多篇;撰寫專著6部。現(xiàn)任國家級精品課、國家級精品資源共享課負(fù)責(zé)人;主編教材獲得國家級“十一五”規(guī)劃教材和國家級“十二五”規(guī)劃教材;獲得市級教學(xué)成果獎3項。
第1章 圖像處理編程基礎(chǔ) (1)
1.1 Python開發(fā)基礎(chǔ) (1)
1.1.1 Python的安裝 (1)
1.1.2 PyCharm的安裝 (6)
1.1.3 OpenCV及常用庫的配置 (9)
1.2 數(shù)字圖像處理與深度學(xué)習(xí)技術(shù)簡介 (13)
1.3 系統(tǒng)界面開發(fā)基礎(chǔ) (15)
1.4 圖像顯示 (17)
1.4.1 待處理圖像的顯示 (17)
1.4.2 處理后圖像的顯示 (20)
習(xí)題 (20)
第2章 彩色圖像特效處理 (21)
2.1 圖像的顏色表示 (21)
2.1.1 像素的顏色 (21)
2.1.2 圖像的存儲結(jié)構(gòu) (21)
2.1.3 圖像的精度 (25)
2.2 彩色圖像的灰度化處理 (26)
2.3 彩色圖像的著色處理 (28)
2.4 彩色圖像的亮度調(diào)整 (29)
2.5 彩色圖像的對比度調(diào)整 (31)
2.6 彩色圖像的曝光處理 (33)
2.7 彩色圖像的馬賽克處理 (34)
2.8 彩色圖像的梯度銳化處理 (35)
2.9 彩色圖像的浮雕處理 (37)
2.10 彩色圖像的霓虹處理 (38)
小結(jié) (39)
習(xí)題 (40)
第3章 圖像的合成處理 (41)
3.1 圖像的代數(shù)運算 (41)
3.1.1 圖像加運算 (41)
3.1.2 圖像減運算 (43)
3.2 圖像邏輯運算 (45)
3.2.1 位與運算 (46)
3.2.2 位或運算 (47)
3.2.3 位非運算 (48)
3.2.4 位異或運算 (49)
小結(jié) (50)
習(xí)題 (51)
第4章 圖像的幾何變換 (52)
4.1 概述 (52)
4.2 圖像平移 (54)
4.3 圖像鏡像 (56)
4.4 圖像縮放 (58)
4.5 圖像轉(zhuǎn)置 (60)
4.6 投影變換 (61)
4.7 圖像旋轉(zhuǎn) (63)
小結(jié) (66)
習(xí)題 (66)
第5章 圖像的灰度變換 (67)
5.1 概述 (67)
5.2 二值化和閾值處理 (68)
5.3 灰度線性變換與分段線性變換 (69)
5.3.1 灰度線性變換 (69)
5.3.2 分段線性變換 (71)
5.4 灰度非線性變換 (73)
5.4.1 灰度對數(shù)變換 (73)
5.4.2 灰度指數(shù)變換 (75)
5.4.3 灰度冪次變換 (76)
5.5 灰度直方圖 (78)
5.5.1 灰度直方圖概念 (78)
5.5.2 直方圖正規(guī)化 (80)
5.5.3 直方圖均衡化 (82)
5.5.4 自適應(yīng)直方圖均衡化 (85)
小結(jié) (88)
習(xí)題 (88)
第6章 圖像平滑處理 (89)
6.1 概述 (89)
6.2 噪聲消除法 (90)
6.2.1 二值圖像的黑白點噪聲濾波 (90)
6.2.2 消除孤立黑像素點 (91)
6.3 鄰域平均法 (93)
6.3.1 3×3均值濾波 (94)
6.3.2 N×N均值濾波 (95)
6.3.3 超限鄰域平均法 (96)
6.3.4 方框濾波 (98)
6.4 高斯濾波 (100)
6.5 中值濾波 (101)
6.5.1 N×N中值濾波 (102)
6.5.2 十字形中值濾波 (103)
6.5.3 N×N最大值濾波 (105)
6.6 雙邊濾波 (106)
6.7 2D卷積核的實現(xiàn) (109)
6.8 產(chǎn)生噪聲處理 (111)
6.8.1 隨機(jī)噪聲 (111)
6.8.2 椒鹽噪聲 (112)
小結(jié) (113)
習(xí)題 (114)
第7章 圖像邊緣銳化處理 (115)
7.1 概述 (115)
7.2 圖像微分邊緣檢測 (116)
7.2.1 縱向邊緣檢測 (116)
7.2.2 橫向邊緣檢測 (117)
7.2.3 雙向邊緣檢測 (118)
7.3 常用的邊緣檢測算子及方法 (120)
7.3.1 Roberts邊緣檢測算子 (120)
7.3.2 Sobel邊緣檢測算子 (122)
7.3.3 Prewitt邊緣檢測算子 (124)
7.3.4 Scharr邊緣檢測算子 (125)
7.3.5 Krisch自適應(yīng)邊緣檢測 (126)
7.3.6 拉普拉斯算子 (129)
7.3.7 高斯-拉普拉斯算子 (131)
7.3.8 Canny邊緣檢測 (134)
7.4 梯度銳化 (136)
7.4.1 提升邊緣 (137)
7.4.2 根據(jù)梯度二值化圖像 (139)
小結(jié) (141)
習(xí)題 (141)
第8章 圖像形態(tài)學(xué)處理 (143)
8.1 概述 (143)
8.2 圖像腐蝕 (143)
8.2.1 水平腐蝕 (144)
8.2.2 垂直腐蝕 (146)
8.2.3 全方向腐蝕 (147)
8.3 圖像膨脹 (148)
8.3.1 水平膨脹 (149)
8.3.2 垂直膨脹 (150)
8.3.3 全方向膨脹 (151)
8.4 圖像開運算與閉運算 (152)
8.4.1 圖像開運算 (152)
8.4.2 圖像閉運算 (154)
8.5 形態(tài)學(xué)梯度運算 (156)
8.6 黑帽與禮帽運算 (157)
8.7 圖像細(xì)化 (159)
小結(jié) (163)
習(xí)題 (163)
第9章 圖像分割與測量 (165)
9.1 概述 (165)
9.2 閾值法分割 (166)
9.2.1 直方圖門限選擇法 (166)
9.2.2 半閾值選擇法 (169)
9.2.3 迭代閾值法 (171)
9.2.4 Otsu閾值法 (173)
9.2.5 自適應(yīng)閾值法 (175)
9.2.6 分水嶺算法 (177)
9.3 投影法分割 (184)
9.3.1 水平投影分割 (184)
9.3.2 垂直投影分割 (185)
9.4 輪廓檢測 (187)
9.4.1 輪廓提取 (187)
9.4.2 邊界跟蹤法 (188)
9.4.3 區(qū)域增長法 (191)
9.4.4 輪廓檢測與擬合 (195)
9.5 目標(biāo)物體測量 (198)
9.5.1 區(qū)域標(biāo)記 (198)
9.5.2 面積測量 (200)
9.5.3 周長測量 (201)
9.6 最小外包形狀檢測 (203)
9.6.1 最小外包矩形 (203)
9.6.2 最小外包圓形 (204)
9.6.3 最小外包三角形 (205)
9.6.4 最小外包橢圓 (206)
9.7 霍夫檢測 (207)
9.7.1 霍夫直線檢測 (207)
9.7.2 霍夫圓檢測 (211)
小結(jié) (214)
習(xí)題 (214)
第10章 圖像頻域變換處理 (215)
10.1 圖像頻域變換 (215)
10.1.1 圖像傅里葉變換 (215)
10.1.2 圖像快速傅里葉變換 (218)
10.1.3 圖像離散余弦變換 (222)
10.1.4 圖像頻域變換原理 (225)
10.2 頻域低通濾波 (226)
10.2.1 理想低通濾波 (226)
10.2.2 梯形低通濾波 (229)
10.2.3 巴特沃思低通濾波 (231)
10.2.4 指數(shù)低通濾波 (233)
10.3 頻域高通濾波 (235)
10.3.1 理想高通濾波 (235)
10.3.2 梯形高通濾波 (237)
10.3.3 巴特沃思高通濾波 (239)
10.3.4 指數(shù)高通濾波 (241)
小結(jié) (243)
習(xí)題 (243)
第11章 基于深度學(xué)習(xí)CNN模型的漢字識別 (244)
11.1 深度學(xué)習(xí)技術(shù)概述 (244)
11.2 CNN基本概念 (245)
11.3 漢字識別系統(tǒng)設(shè)計 (249)
11.4 漢字圖像預(yù)處理 (251)
11.5 投影與分割 (253)
11.6 構(gòu)建漢字識別模型 (256)
11.6.1 構(gòu)建CNN模型 (256)
11.6.2 識別模型訓(xùn)練 (258)
11.7 漢字識別模型檢驗 (260)
第12章 基于深度學(xué)習(xí)CNN模型的語音識別 (265)
12.1 語音識別系統(tǒng)設(shè)計 (265)
12.2 語音信號預(yù)處理及特征提取 (266)
12.2.1 語音信號預(yù)處理 (266)
12.2.2 MFCC特征提取 (268)
12.3 構(gòu)建語音識別模型 (270)
12.3.1 構(gòu)建CNN模型 (270)
12.3.2 識別模型訓(xùn)練 (273)
12.4 語音識別模型檢驗 (274)
第13章 基于深度學(xué)習(xí)Faster R-CNN模型的手勢識別 (279)
13.1 R-CNN目標(biāo)檢測與識別模型 (279)
13.2 邊框回歸(Bounding Box Regression)原理 (282)
13.3 Faster R-CNN目標(biāo)檢測與識別模型 (284)
13.3.1 Faster R-CNN模型框架 (284)
13.3.2 基于區(qū)域提議網(wǎng)絡(luò)(RPN)的目標(biāo)檢測 (285)
13.3.3 基于RoI池化和分類技術(shù)的目標(biāo)識別 (288)
13.4 手勢識別系統(tǒng)設(shè)計 (289)
13.5 構(gòu)建手勢識別模型 (291)
13.5.1 構(gòu)建Faster R-CNN模型 (291)
13.5.2 Faster R-CNN識別模型訓(xùn)練 (295)
13.6 手勢識別模型檢驗 (299)