視頻圖像技術(shù)是人工智能、計(jì)算機(jī)科學(xué)、光學(xué)、電子信息等領(lǐng)域的基礎(chǔ)技術(shù),相關(guān)的原理知識(shí)涉及面較廣,應(yīng)用性很強(qiáng)。本書(shū)基于視頻圖像技術(shù)的基本原理、相關(guān)設(shè)備、算法和應(yīng)用等內(nèi)容編寫(xiě),主要分為三部分。第一部分為視頻圖像技術(shù)原理與設(shè)備操作,主要介紹視頻信號(hào)“采-傳-存-顯-控”的基本原理;第二部分為視頻圖像智能化分析算法與工程實(shí)踐,涵蓋經(jīng)典算法和基于深度學(xué)習(xí)的主流算法,包括視頻圖像數(shù)據(jù)預(yù)處理、圖像增強(qiáng)、圖像分割、圖像分類(lèi)、運(yùn)動(dòng)目標(biāo)檢測(cè)、目標(biāo)檢測(cè)與識(shí)別、運(yùn)動(dòng)目標(biāo)跟蹤、雙目視覺(jué)測(cè)距、圖像無(wú)縫拼接、圖像三維重建,其中不乏計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用;第三部分為視頻圖像技術(shù)基礎(chǔ)開(kāi)發(fā)環(huán)境的搭建,主要介紹視頻圖像技術(shù)常用的編程語(yǔ)言,為讀者實(shí)現(xiàn)各種視頻圖像技術(shù)提供快速的編程指導(dǎo)和環(huán)境配置方法,包括MATLAB編程基礎(chǔ)、OpenCV編程基礎(chǔ)、Python編程基礎(chǔ)和面向深度學(xué)習(xí)的智能化圖像處理環(huán)境搭建。本書(shū)每章都按照“學(xué)習(xí)目的、實(shí)踐內(nèi)容、準(zhǔn)備材料、預(yù)備知識(shí)、實(shí)踐步驟”的結(jié)構(gòu)進(jìn)行編寫(xiě),旨在使讀者快速掌握并應(yīng)用視頻圖像技術(shù),能夠圍繞實(shí)際應(yīng)用場(chǎng)景,循序漸進(jìn)地使用本書(shū)中介紹的方法解決部分實(shí)際問(wèn)題,從而具備面向工程應(yīng)用的綜合分析與實(shí)踐能力。本書(shū)可作為高等學(xué)校本科生、研究生視頻圖像處理相關(guān)課程的教材和參考書(shū),也可為相關(guān)領(lǐng)域的工程技術(shù)人員提供參考。
李熙瑩,中山大學(xué)智能工程學(xué)院副教授,碩士生導(dǎo)師,現(xiàn)為視頻圖像智能分析與應(yīng)用技術(shù)公安部重點(diǎn)實(shí)驗(yàn)室目標(biāo)識(shí)別與行為分析研究室主任、視頻圖像智能分析與應(yīng)用技術(shù)公安部重點(diǎn)實(shí)驗(yàn)室學(xué)術(shù)委員會(huì)委員。主要研究視頻圖像車(chē)輛檢測(cè)與識(shí)別、視頻交通信息采集、視頻目標(biāo)跟蹤與行為分析、視頻大數(shù)據(jù)處理與分析等技術(shù)及其在交通管理、公共安全領(lǐng)域的應(yīng)用。目前已在車(chē)輛識(shí)別監(jiān)控、交通流參數(shù)獲取、視頻智能識(shí)別與分析等方面取得實(shí)質(zhì)性成果,與企業(yè)合作開(kāi)發(fā)多個(gè)軟件產(chǎn)品和應(yīng)用系統(tǒng),應(yīng)用覆蓋上萬(wàn)路視頻,服務(wù)于多個(gè)警種,出口到國(guó)外,用戶評(píng)價(jià)很高。主持有綜合交通、計(jì)算機(jī)視覺(jué)、公共安全等領(lǐng)域的國(guó)家科技專(zhuān)項(xiàng)、國(guó)家自然科學(xué)基金重點(diǎn)和面上、國(guó)際合作、省部級(jí)項(xiàng)目十余項(xiàng),經(jīng)費(fèi)近千萬(wàn)。目前已在國(guó)內(nèi)外期刊和會(huì)議發(fā)表論文60余篇;申請(qǐng)發(fā)明專(zhuān)利30多項(xiàng),其中11項(xiàng)國(guó)內(nèi)專(zhuān)利與2項(xiàng)美國(guó)專(zhuān)利獲得授權(quán)。2017年獲公安部科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng), 2014年獲得中國(guó)智能交通協(xié)會(huì)科學(xué)技術(shù)獎(jiǎng)二等獎(jiǎng)(排名第一)。
第一部分 視頻圖像技術(shù)原理與設(shè)備操作
第1章 視頻采集 2
1.1 學(xué)習(xí)目的 2
1.2 實(shí)踐內(nèi)容 2
1.3 準(zhǔn)備材料 2
1.4 預(yù)備知識(shí) 3
1.4.1 視頻圖像技術(shù)概述 3
1.4.2 光源 7
1.4.3 鏡頭 10
1.4.4 圖像補(bǔ)償與降噪 11
1.4.5 攝像機(jī)類(lèi)型 13
1.4.6 數(shù)字示波器 14
1.5 實(shí)施步驟 15
1.5.1 觀察攝像機(jī)的外觀、形狀、接口,了解其功能 15
1.5.2 連接設(shè)備,采集視頻 15
1.5.3 觀察鏡頭參數(shù)變化的成像效果 16
1.5.4 觀察光照條件變化的成像效果 16
1.5.5 觀察不同類(lèi)型攝像機(jī)的成像效果 16
1.5.6 調(diào)整攝像機(jī)參數(shù),觀察視頻效果 16
1.5.7 利用示波器觀察視頻信號(hào) 17
第2章 視頻傳輸 18
2.1 學(xué)習(xí)目的 18
2.2 實(shí)踐內(nèi)容 18
2.3 準(zhǔn)備材料 18
2.4 預(yù)備知識(shí) 19
2.4.1 傳輸介質(zhì) 19
2.4.2 視頻雙絞線傳輸器 21
2.4.3 視頻光端機(jī) 22
2.4.4 交換機(jī)和網(wǎng)絡(luò)視頻適配器 22
2.4.5 無(wú)線網(wǎng)橋 23
2.4.6 PoE供電 23
2.4.7 網(wǎng)絡(luò)損傷儀 24
2.5 實(shí)施步驟 24
2.5.1 同軸電纜和雙絞器傳輸 24
2.5.2 交換機(jī)傳輸 24
2.5.3 無(wú)線網(wǎng)橋傳輸 27
2.5.4 網(wǎng)絡(luò)損傷環(huán)境下不同編碼方式的傳輸 28
第3章 視頻存儲(chǔ) 30
3.1 學(xué)習(xí)目的 30
3.2 實(shí)踐內(nèi)容 30
3.3 準(zhǔn)備材料 30
3.4 預(yù)備知識(shí) 31
3.4.1 數(shù)字存儲(chǔ)技術(shù) 31
3.4.2 RAID技術(shù) 34
3.4.3 云存儲(chǔ) 39
3.5 實(shí)施步驟 40
3.5.1 高清硬盤(pán)錄像機(jī)多路視頻輸入 40
3.5.2 高清硬盤(pán)錄像機(jī)抓拍畫(huà)面 41
3.5.3 高清硬盤(pán)錄像機(jī)錄像存儲(chǔ) 41
3.5.4 高清硬盤(pán)錄像機(jī)錄像回放 42
3.5.5 高清硬盤(pán)錄像機(jī)錄像文件導(dǎo)出 43
3.5.6 遠(yuǎn)程登錄網(wǎng)絡(luò)錄像機(jī) 44
3.5.7 設(shè)置RAID功能 45
3.5.8 云存儲(chǔ)設(shè)備的基本操作 46
第4章 視頻顯示 47
4.1 學(xué)習(xí)目的 47
4.2 實(shí)踐內(nèi)容 47
4.3 準(zhǔn)備材料 47
4.4 預(yù)備知識(shí) 48
4.4.1 顯示器的類(lèi)型 48
4.4.2 液晶顯示器 49
4.4.3 顯示器的技術(shù)參數(shù) 51
4.4.4 顯示器的常用接口 52
4.4.5 分辨率 54
4.5 實(shí)施步驟 56
4.5.1 觀察多種顯示器的外觀 56
4.5.2 熟悉信號(hào)輸入接口 56
4.5.3 更改液晶顯示器的參數(shù) 57
第5章 中心與云臺(tái)控制 58
5.1 學(xué)習(xí)目的 58
5.2 實(shí)踐內(nèi)容 58
5.3 準(zhǔn)備材料 58
5.4 預(yù)備知識(shí) 59
5.4.1 中心控制設(shè)備 59
5.4.2 云臺(tái) 60
5.4.3 云臺(tái)控制協(xié)議 62
5.5 實(shí)施步驟 63
5.5.1 將多種視頻設(shè)備接入監(jiān)控中心,并控制視頻信號(hào)上電視墻 63
5.5.2 觀察攝像機(jī)云臺(tái)及接口 65
5.5.3 利用視頻監(jiān)控設(shè)備實(shí)現(xiàn)云臺(tái)控制 65
5.5.4 編程實(shí)現(xiàn)云臺(tái)控制(選做) 68
第6章 視頻監(jiān)控系統(tǒng) 69
6.1 學(xué)習(xí)目的 69
6.2 實(shí)踐內(nèi)容 69
6.3 準(zhǔn)備材料 69
6.4 預(yù)備知識(shí) 69
6.4.1 視頻監(jiān)控系統(tǒng)介紹 69
6.4.2 視頻監(jiān)控系統(tǒng)方案選型指導(dǎo) 72
6.5 實(shí)施步驟 76
6.5.1 不同視頻監(jiān)控系統(tǒng)的對(duì)比 76
6.5.2 室內(nèi)視頻監(jiān)控系統(tǒng)方案設(shè)計(jì) 76
6.5.3 室內(nèi)視頻監(jiān)控系統(tǒng)方案實(shí)現(xiàn) 76
6.5.4 室外視頻監(jiān)控系統(tǒng)方案設(shè)計(jì) 76
6.5.5 室外視頻監(jiān)控系統(tǒng)方案實(shí)現(xiàn) 77
第7章 機(jī)器視覺(jué) 78
7.1 學(xué)習(xí)目的 78
7.2 實(shí)踐內(nèi)容 78
7.3 準(zhǔn)備材料 78
7.4 預(yù)備知識(shí) 79
7.4.1 機(jī)器視覺(jué)系統(tǒng)簡(jiǎn)介 79
7.4.2 機(jī)器視覺(jué)系統(tǒng)的組成 80
7.4.3 機(jī)器視覺(jué)系統(tǒng)設(shè)備選型 85
7.5 實(shí)施步驟 86
7.5.1 觀察、熟悉工業(yè)相機(jī) 86
7.5.2 工業(yè)相機(jī)視頻數(shù)據(jù)的存儲(chǔ)和處理 86
7.5.3 選用合適的工業(yè)相機(jī)和鏡頭 90
7.5.4 對(duì)比成像效果 91
7.5.5 手機(jī)屏幕壞點(diǎn)檢測(cè) 92
第二部分 視頻圖像智能化分析算法與工程實(shí)踐
第8章 視頻圖像數(shù)據(jù)預(yù)處理:數(shù)據(jù)增強(qiáng)與標(biāo)注 94
8.1 學(xué)習(xí)目的 94
8.2 實(shí)踐內(nèi)容 94
8.3 準(zhǔn)備材料 94
8.4 預(yù)備知識(shí) 94
8.4.1 常用的數(shù)據(jù)增強(qiáng)方法 95
8.4.2 圖像標(biāo)注工具VGG Image Annotator的使用 100
8.5 實(shí)施步驟 104
8.5.1 編程實(shí)現(xiàn)批量圖像的預(yù)處理 104
8.5.2 對(duì)批量圖像進(jìn)行在線標(biāo)注 104
第9章 圖像增強(qiáng) 105
9.1 學(xué)習(xí)目的 105
9.2 實(shí)踐內(nèi)容 105
9.3 準(zhǔn)備材料 105
9.4 預(yù)備知識(shí) 105
9.4.1 灰度變換增強(qiáng) 106
9.4.2 直方圖增強(qiáng) 107
9.4.3 圖像平滑 108
9.4.4 圖像銳化 108
9.4.5 暗通道先驗(yàn)去霧算法 109
9.4.6 圖像質(zhì)量評(píng)價(jià)指標(biāo) 110
9.5 實(shí)施步驟 111
9.5.1 編程實(shí)現(xiàn)不同的圖像增強(qiáng)方法 111
9.5.2 編程實(shí)現(xiàn)暗通道先驗(yàn)去霧算法 111
第10章 圖像分割 112
10.1 學(xué)習(xí)目的 112
10.2 實(shí)踐內(nèi)容 112
10.3 準(zhǔn)備材料 112
10.4 預(yù)備知識(shí) 112
10.4.1 圖像分割算法的研究現(xiàn)狀 112
10.4.2 基于閾值的圖像分割算法 113
10.4.3 基于圖論的圖像分割算法 116
10.4.4 選擇性搜索算法 117
10.5 實(shí)施步驟 119
10.5.1 采集并標(biāo)注數(shù)據(jù) 119
10.5.2 編程實(shí)現(xiàn)基于閾值的圖像分割算法 119
10.5.3 編程實(shí)現(xiàn)選擇性搜索算法并進(jìn)行圖像分割測(cè)試 120
第11章 圖像分類(lèi) 121
11.1 學(xué)習(xí)目的 121
11.2 實(shí)踐內(nèi)容 121
11.3 準(zhǔn)備材料 121
11.4 預(yù)備知識(shí) 121
11.4.1 CIFAR-10簡(jiǎn)介 122
11.4.2 卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介 122
11.4.3 經(jīng)典的網(wǎng)絡(luò)模型 124
11.4.4 利用PyTorch構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)對(duì)CIFAR-10進(jìn)行分類(lèi) 132
11.5 實(shí)施步驟 136
第12章 運(yùn)動(dòng)目標(biāo)檢測(cè) 137
12.1 學(xué)習(xí)目的 137
12.2 實(shí)踐內(nèi)容 137
12.3 實(shí)驗(yàn)準(zhǔn)備 137
12.4 預(yù)備知識(shí) 137
12.4.1 常用的運(yùn)動(dòng)目標(biāo)檢測(cè)方法——背景差法 138
12.4.2 常用的運(yùn)動(dòng)目標(biāo)檢測(cè)方法——幀差法 140
12.4.3 運(yùn)動(dòng)目標(biāo)檢測(cè)的優(yōu)化策略——形態(tài)學(xué)處理 141
12.4.4 運(yùn)動(dòng)目標(biāo)檢測(cè)的評(píng)價(jià)指標(biāo)1——IoU 145
12.4.5 運(yùn)動(dòng)目標(biāo)檢測(cè)的評(píng)價(jià)指標(biāo)2——檢出率、漏檢率和多檢率 147
12.4.6 運(yùn)動(dòng)目標(biāo)檢測(cè)算法流程示例 149
12.5 實(shí)施步驟 150
12.5.1 編程實(shí)現(xiàn)背景差法 150
12.5.2 編程實(shí)現(xiàn)幀差法 150
12.5.3 編程實(shí)現(xiàn)目標(biāo)檢測(cè)IoU的計(jì)算 150
12.5.4 編程實(shí)現(xiàn)目標(biāo)檢測(cè)評(píng)價(jià)指標(biāo)的計(jì)算 150
第13章 目標(biāo)檢測(cè)與識(shí)別 151
13.1 學(xué)習(xí)目的 151
13.2 實(shí)踐內(nèi)容 151
13.3 準(zhǔn)備材料 151
13.4 預(yù)備知識(shí) 151
13.4.1 傳統(tǒng)目標(biāo)檢測(cè)與識(shí)別算法 151
13.4.2 滑動(dòng)窗口(Sliding Window)法 152
13.4.3 基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)與識(shí)別算法 154
13.5 實(shí)施步驟 159
13.5.1 訓(xùn)練集準(zhǔn)備 159
13.5.2 將KITTI格式轉(zhuǎn)化為VOC格式 160
13.5.3 利用PyTorch搭建一個(gè)基于YOLO v3的目標(biāo)檢測(cè)與識(shí)別網(wǎng)絡(luò) 160
13.5.4 利用已有網(wǎng)絡(luò)模型及參數(shù)實(shí)現(xiàn)在線交通目標(biāo)的檢測(cè)與識(shí)別 162
第14章 運(yùn)動(dòng)目標(biāo)跟蹤 165
14.1 學(xué)習(xí)目的 165
14.2 實(shí)踐內(nèi)容 165
14.3 準(zhǔn)備材料 165
14.4 預(yù)備知識(shí) 165
14.4.1 運(yùn)動(dòng)目標(biāo)跟蹤算法 165
14.4.2 運(yùn)動(dòng)目標(biāo)跟蹤數(shù)據(jù)集 171
14.4.3 運(yùn)動(dòng)目標(biāo)跟蹤算法的評(píng)價(jià)準(zhǔn)則與方法 171
14.5 實(shí)施步驟(任意選擇一個(gè)算法實(shí)現(xiàn)) 173
14.5.1 實(shí)現(xiàn)卡爾曼濾波器 173
14.5.2 實(shí)現(xiàn)DeepSORT算法 173
第15章 視頻圖像雙目視覺(jué)測(cè)距 174
15.1 學(xué)習(xí)目的 174
15.2 實(shí)踐內(nèi)容 174
15.3 準(zhǔn)備材料 174
15.4 預(yù)備知識(shí) 174
15.4.1 雙目立體視覺(jué)的成像原理 175
15.4.2 雙目立體視覺(jué)的標(biāo)定和矯正 175
15.4.3 立體匹配算法 179
15.4.4 深度圖計(jì)算 181
15.4.5 雙目視覺(jué)測(cè)距流程 181
15.4.6 Kinect 182
15.5 實(shí)施步驟 183
15.5.1 雙目圖像獲取 183
15.5.2 標(biāo)定 183
15.5.3 編程實(shí)現(xiàn)雙目視覺(jué)測(cè)距算法 183
第16章 圖像無(wú)縫拼接 184
16.1 學(xué)習(xí)目的 184
16.2 實(shí)踐內(nèi)容 184
16.3 準(zhǔn)備材料 184
16.4 預(yù)備知識(shí) 184
16.4.1 圖像拼接的基本原理 184
16.4.2 基于單應(yīng)性變換的圖像拼接算法 185
16.4.3 APAP算法 192
16.5 實(shí)施步驟(任意選擇一個(gè)算法實(shí)現(xiàn)) 194
16.5.1 采集圖像 194
16.5.2 編程實(shí)現(xiàn)基于單應(yīng)性變換的圖像拼接算法 194
16.5.3 編程實(shí)現(xiàn)APAP算法 194
第17章 圖像三維重建 195
17.1 學(xué)習(xí)目的 195
17.2 實(shí)踐內(nèi)容 195
17.3 準(zhǔn)備材料 195
17.4 預(yù)備知識(shí) 195
17.4.1 圖像三維重建技術(shù) 195
17.4.2 基于運(yùn)動(dòng)的三維重建算法中關(guān)鍵幀的篩選 196
17.4.3 圖像三維重建的基本流程 197
17.4.4 圖像三維重建軟件 203
17.5 實(shí)施步驟 205
17.5.1 使用無(wú)人機(jī)采集視頻并提取關(guān)鍵幀 205
17.5.2 編程實(shí)現(xiàn)圖像三維重建 206
17.5.3 使用Pix4D Mapper軟件實(shí)現(xiàn)圖像三維重建 206
第三部分 視頻圖像技術(shù)基礎(chǔ)開(kāi)發(fā)環(huán)境的搭建
第18章 MATLAB編程基礎(chǔ) 210
18.1 學(xué)習(xí)目的 210
18.2 實(shí)踐內(nèi)容 210
18.3 準(zhǔn)備材料 210
18.4 預(yù)備知識(shí) 210
18.4.1 MATLAB簡(jiǎn)介 210
18.4.2 MATLAB安裝 211
18.4.3 MATLAB的基本使用 215
18.4.4 MATLAB圖像處理基本操作 218
18.5 實(shí)施步驟 219
18.5.1 使用MATLAB 219
18.5.2 MATLAB圖像處理 220
18.5.3 總結(jié) 221
第19章 OpenCV編程基礎(chǔ) 222
19.1 學(xué)習(xí)目的 222
19.2 實(shí)踐內(nèi)容 222
19.3 準(zhǔn)備材料 222
19.4 預(yù)備知識(shí) 222
19.4.1 OpenCV簡(jiǎn)介 222
19.4.2 OpenCV安裝 222
19.5 實(shí)施步驟 225
19.5.1 圖像直方圖處理 225
19.5.2 空間域?yàn)V波與頻域變換 226
第20章 Python編程基礎(chǔ) 230
20.1 學(xué)習(xí)目的 230
20.2 實(shí)踐內(nèi)容 230
20.3 準(zhǔn)備材料 230
20.4 預(yù)備知識(shí) 230
20.4.1 Python 3.7.3安裝 230
20.4.2 Python常用函數(shù) 232
20.5 實(shí)施步驟 232
20.5.1 用Python創(chuàng)建一個(gè)csv文件 232
20.5.2 用Python寫(xiě)一個(gè)腳本 233
20.5.3 多邊形面積求解 233
20.5.4 ?的計(jì)算 233
20.5.5 下載圖像、分類(lèi)保存并拼接 234
第21章 面向深度學(xué)習(xí)的智能化圖像處理環(huán)境搭建 235
21.1 學(xué)習(xí)目的 235
21.2 項(xiàng)目?jī)?nèi)容 235
21.3 準(zhǔn)備材料 235
21.4 預(yù)備知識(shí) 235
21.4.1 Windows 10環(huán)境下PyTorch的安裝 235
21.4.2 Ubuntu 18.04環(huán)境下PyTorch的安裝 239
21.5 實(shí)施步驟 240
21.5.1 編程測(cè)試是否有GPU 240
21.5.2 編程實(shí)現(xiàn)梯度計(jì)算 241
21.5.3 搭建基本的分類(lèi)神經(jīng)網(wǎng)絡(luò) 241
致 謝 244
參考文獻(xiàn) 245
附錄A 實(shí)驗(yàn)報(bào)告 250
附錄B 實(shí)驗(yàn)記錄表 251