計算機(jī)視覺:原理、算法、應(yīng)用及學(xué)習(xí)(原書第5版)
定 價:149 元
叢書名:智能科學(xué)與技術(shù)叢書
- 作者:[英]E. R. 戴維斯(E. R. Davies)
- 出版時間:2020/10/1
- ISBN:9787111664796
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP302.7
- 頁碼:0
- 紙張:
- 版次:
- 開本:16開
本書系統(tǒng)地展示了計算機(jī)視覺的基本方法學(xué),講解基礎(chǔ)理論的同時,強(qiáng)調(diào)算法和實(shí)際中的設(shè)計約束。此次第5版全面修訂,涵蓋更多計算機(jī)視覺的概念和應(yīng)用,既適合本科生和研究生,也適合該領(lǐng)域的研究人員和工程師。
譯者序
推薦序
第5版前言
第1版前言
縮寫詞匯表
第1章 計算機(jī)視覺面臨的挑戰(zhàn) 1
1.1 導(dǎo)言—人類及其感官 1
1.2 視覺的本質(zhì) 2
1.2.1 識別過程 2
1.2.2 解決識別問題 3
1.2.3 物體定位 4
1.2.4 場景分析 5
1.2.5 視覺是逆向圖形學(xué) 6
1.3 從自動視覺檢測到監(jiān)控 6
1.4 本書是關(guān)于什么的 7
1.5 機(jī)器學(xué)習(xí)的作用 8
1.6 后續(xù)章節(jié)內(nèi)容概述 9
1.7 書目注釋 9
第一部分 初級視覺
第2章 圖像與圖像處理 12
2.1 導(dǎo)言 12
2.2 圖像處理操作 15
2.2.1 灰度圖像的一些基本操作 15
2.2.2 二值圖像的基本操作 19
2.3 卷積和點(diǎn)擴(kuò)散函數(shù) 21
2.4 順序操作與并行操作 22
2.5 結(jié)束語 23
2.6 書目和歷史注釋 24
2.7 問題 24
第3章 圖像濾波和形態(tài)學(xué) 25
3.1 導(dǎo)言 25
3.2 通過高斯平滑抑制噪聲 27
3.3 中值濾波器 28
3.4 模式濾波器 30
3.5 秩排序濾波器 35
3.6 銳化–反銳化掩模 35
3.7 中值濾波器引入的偏移 36
3.7.1 中值偏移的連續(xù)體模型 36
3.7.2 推廣到灰度圖 38
3.7.3 中值偏移的離散模型 40
3.8 秩排序濾波器引入的偏移 41
3.9 濾波器在計算機(jī)視覺工業(yè)應(yīng)用中的作用 44
3.10 圖像濾波中的色彩 44
3.11 二值圖像的膨脹和腐蝕 45
3.11.1 膨脹和腐蝕 45
3.11.2 抵消效應(yīng) 45
3.11.3 改進(jìn)的膨脹與腐蝕算子 45
3.12 數(shù)學(xué)形態(tài)學(xué) 46
3.12.1 泛化的形態(tài)學(xué)膨脹 46
3.12.2 泛化的形態(tài)學(xué)腐蝕 47
3.12.3 膨脹與腐蝕之間的對偶性 47
3.12.4 膨脹與腐蝕算子的特性 48
3.12.5 閉合與開啟 50
3.12.6 基本形態(tài)學(xué)運(yùn)算概要 51
3.13 形態(tài)學(xué)分組 53
3.14 灰度圖像中的形態(tài)學(xué) 54
3.15 結(jié)束語 55
3.16 書目和歷史注釋 56
3.17 問題 58
第4章 閾值的作用 61
4.1 導(dǎo)言 61
4.2 區(qū)域生長方法 62
4.3 閾值方法 62
4.3.1 尋找合適的閾值 62
4.3.2 解決閾值選取中的偏差問題 63
4.4 自適應(yīng)閾值 64
4.5 更徹底的閾值選擇方法 66
4.5.1 基于方差的閾值 67
4.5.2 基于熵的閾值 67
4.5.3 最大似然閾值 68
4.6 全局波谷閾值方法 69
4.7 應(yīng)用全局波谷閾值方法的實(shí)際結(jié)果 71
4.8 直方圖凹性分析 75
4.9 結(jié)束語 75
4.10 書目和歷史注釋 76
4.11 問題 77
第5章 邊緣檢測 78
5.1 導(dǎo)言 78
5.2 邊緣檢測基本理論 79
5.3 模板匹配方法 80
5.4 3×3模板算子理論 81
5.5 微分梯度算子的設(shè)計 82
5.6 圓形算子的概念 83
5.7 圓形算子的詳細(xì)實(shí)現(xiàn) 83
5.8 微分邊緣算子的系統(tǒng)設(shè)計 85
5.9 上述方法的問題—?一些替代方案 86
5.10 滯后閾值 88
5.11 Canny算子 89
5.12 Laplacian算子 92
5.13 結(jié)束語 93
5.14 書目和歷史注釋 93
5.15 問題 94
第6章 角點(diǎn)、興趣點(diǎn)和不變特征的檢測 95
6.1 導(dǎo)言 95
6.2 模板匹配 95
6.3 二階導(dǎo)數(shù)方法 96
6.4 基于中值濾波的角點(diǎn)檢測器 98
6.4.1 分析中值檢測器的操作 98
6.4.2 實(shí)際結(jié)果 99
6.5 Harris興趣點(diǎn)算子 100
6.5.1 各種幾何構(gòu)型的角點(diǎn)信號和位移 102
6.5.2 交叉點(diǎn)和T形交叉點(diǎn)的性能 103
6.5.3 Harris算子的不同形式 105
6.6 角點(diǎn)方向 106
6.7 局部不變特征檢測器與描述符 106
6.7.1 幾何變換和特征標(biāo)準(zhǔn)化 107
6.7.2 Harris尺度、仿射不變檢測器和描述符 108
6.7.3 Hessian尺度、仿射不變檢測器和描述符 109
6.7.4 尺度不變特征變換算子 110
6.7.5 加速魯棒特征算子 110
6.7.6 最大穩(wěn)定極值區(qū)域 111
6.7.7 各種不變特征檢測器的比較 112
6.7.8 定向梯度直方圖 114
6.8 結(jié)束語 115
6.9 書目和歷史注釋 116
6.10 問題 118
第7章 紋理分析 119
7.1 導(dǎo)言 119
7.2 紋理分析的一些基本方法 121
7.3 灰度共生矩陣 122
7.4 Laws紋理能量法 123
7.5 Ade特征濾波器法 125
7.6 對Laws法和Ade法的評估 126
7.7 結(jié)束語 127
7.8 書目和歷史注釋 127
第二部分 中級視覺
第8章 二值化形狀分析 130
8.1 導(dǎo)言 130
8.2 二值圖像的連通性 131
8.3 物體標(biāo)記和計數(shù) 131
8.4 尺寸濾波 136
8.5 距離函數(shù)及其用途 138
8.6 骨架和細(xì)化 140
8.6.1 交叉數(shù) 141
8.6.2 細(xì)化的并行和順序?qū)崿F(xiàn) 143
8.6.3 引導(dǎo)細(xì)化 144
8.6.4 如何看待骨架的本質(zhì) 145
8.6.5 骨架節(jié)點(diǎn)分析 146
8.6.6 骨架在形狀識別中的應(yīng)用 146
8.7 形狀識別的其他度量 147
8.8 邊界跟蹤過程 148
8.9 結(jié)束語 149
8.10 書目和歷史注釋 150
8.11 問題 151
第9章 邊界模式分析 154
9.1 導(dǎo)言 154
9.2 邊界跟蹤過程 156
9.3 質(zhì)心輪廓 156
9.4 質(zhì)心輪廓方法存在的問題 157
9.5。╯, ψ)圖 159
9.6 解決遮擋問題 160
9.7 邊界長度度量的準(zhǔn)確性 162
9.8 結(jié)束語 163
9.9 書目和歷史注釋 164
9.10 問題 165
第10章 直線、圓和橢圓的檢測 166
10.1 導(dǎo)言 166
10.2 霍夫變換在直線檢測中的應(yīng)用 167
10.3 垂足法 169
10.4 使用RANSAC進(jìn)行直線檢測 171
10.5 腹腔鏡工具的位置 174
10.6 基于霍夫的圓形物體檢測方案 175
10.7 圓半徑未知的問題 178
10.8 克服速度問題 179
10.9 橢圓檢測 181
10.9.1 直徑平分法 182
10.9.2 弦切法 183
10.9.3 尋找剩余橢圓參數(shù) 184
10.10 人類虹膜定位 185
10.11 結(jié)束語 186
10.12 書目和歷史注釋 187
10.13 問題 189
第11章 廣義霍夫變換 191
11.1 導(dǎo)言 191
11.2 廣義霍夫變換 192
11.3 空間匹配濾波的相關(guān)性 193
11.4 梯度加權(quán)與均勻加權(quán) 194
11.4.1 靈敏度和計算負(fù)荷的計算 195
11.4.2 總結(jié) 196
11.5 使用GHT檢測橢圓 196
11.6 各種橢圓檢測方法的比較 199
11.7 物體定位的圖論方法 200
11.8 節(jié)省計算的可能性 204
11.9 使用GHT進(jìn)行特征排序 205
11.10 推廣最大團(tuán)及其他方法 207
11.11 搜索 208
11.12 結(jié)束語 208
11.13 書目和歷史注釋 209
11.14 問題 212
第12章 物體分割與形狀模型 215
12.1 導(dǎo)言 215
12.2 主動輪廓 215
12.3 使用主動輪廓獲得的實(shí)際結(jié)果 217
12.4 用于物體分割的水平集方法 218
12.5 形狀模型 219
12.6 結(jié)束語 227
12.7 書目和歷史注釋 227
第三部分 機(jī)器學(xué)習(xí)和深度學(xué)習(xí)網(wǎng)絡(luò)
第13章 基本分類概念 230
13.1 導(dǎo)言 230
13.2 最近鄰算法 231
13.3 貝葉斯決策理論 232
13.4 最近鄰與貝葉斯方法的關(guān)系 234
13.4.1 問題的數(shù)學(xué)陳述 234
13.4.2 最近鄰算法的重要性 236
13.5 最佳特征數(shù)量 236
13.6 代價函數(shù)和錯誤–拒絕權(quán)衡 236
13.7 監(jiān)督和無監(jiān)督學(xué)習(xí) 238
13.8 聚類分析 238
13.9 支持向量機(jī) 240
13.10 人工神經(jīng)網(wǎng)絡(luò) 241
13.11 反向傳播算法 244
13.12 多層感知器架構(gòu) 246
13.13 訓(xùn)練數(shù)據(jù)過擬合 247
13.14 結(jié)束語 248
13.15 書目和歷史注釋 249
13.16 問題 250
第14章 機(jī)器學(xué)習(xí):概率方法 251
14.1 導(dǎo)言 251
14.2 高斯混合和EM算法 253
14.3 更一般的EM算法視圖 257
14.4 一些實(shí)際例子 259
14.5 主成分分析 264
14.6 多分類器 266
14.7 Boosting方法 268
14.8 AdaBoost建模 270
14.9 Boosting方法的損失函數(shù) 272
14.10 LogitBoost算法 275
14.11 Boosting方法的有效性 277
14.12 多類別的Boosting方法 277
14.13 接受者操作特性 281
14.14 結(jié)束語 284
14.15 書目和歷史注釋 284
14.16 問題 286
第15章 深度學(xué)習(xí)網(wǎng)絡(luò) 287
15.1 導(dǎo)言 287
15.2 卷積神經(jīng)網(wǎng)絡(luò) 289
15.3 用于定義CNN架構(gòu)的參數(shù) 290
15.4 LeCun 等人提出的LeNet 架構(gòu) 293
15.5 Krizhevsky等人提出的AlexNet架構(gòu) 296
15.6 Zeiler和Fergus對CNN架構(gòu)的研究 300
15.7 Zeiler和Fergus的可視化實(shí)驗 302
15.8 Simonyan和Zisserman的VGGNet架構(gòu) 303
15.9 Noh等人的DeconvNet架構(gòu) 305
15.10 Badrinarayanan等人的SegNet架構(gòu) 307
15.11 循環(huán)神經(jīng)網(wǎng)絡(luò) 309
15.12 結(jié)束語 311
15.13 書目和歷史注釋 313
第四部分 三維視覺和運(yùn)動
第16章 三維世界 316
16.1 導(dǎo)言 316
16.2 三維視覺方法 316
16.3 三維視覺投影方案 318
16.3.1 雙目圖像 319
16.3.2 對應(yīng)問題 320
16.4 陰影形狀 322
16.5 光度立體技術(shù) 325
16.6 表面光滑性的假設(shè) 326
16.7 紋理形狀 327
16.8 結(jié)構(gòu)光的使用 327
16.9 三維物體識別方案 329
16.10 Horaud的匯聚定向技術(shù) 329
16.11 一個重要的范例—工業(yè)零件的定位 332
16.12 結(jié)束語 333
16.13 書目和歷史注釋 334
16.14 問題 336
第17章 解決n點(diǎn)透視問題 338
17.1 導(dǎo)言 338
17.2 視角倒轉(zhuǎn)現(xiàn)象 338
17.3 弱透視投影下的姿勢歧義性 339
17.4 求姿勢估計的唯一解 341
17.4.1 三點(diǎn)情況下的解 343
17.4.2 利用對稱梯形來預(yù)測姿勢 344
17.5 結(jié)束語 345
17.6 書目和歷史注釋 345
17.7 問題 346
第18章 不變量與透視 347
18.1 導(dǎo)言 347
18.2 交比:“比率的比率”的概念 348
18.3 非共線點(diǎn)的不變量 351
18.4 圓錐曲線上點(diǎn)的不變量 353
18.5 微分和半微分不變量 355
18.6 對稱交比函數(shù) 356
18.7 消失點(diǎn)檢測 357
18.8 更多關(guān)于消失點(diǎn)的內(nèi)容 358
18.9 圓和橢圓的表觀中心 359
18.10 美術(shù)和攝影中的透視效果 360
18.11 結(jié)束語 365
18.12 書目和歷史注釋 365
18.13 問題 367
第19章 圖像變換和攝像機(jī)校準(zhǔn) 368
19.1 導(dǎo)言 368
19.2 圖像變換 369
19.3 攝像機(jī)校準(zhǔn) 372
19.4 內(nèi)部和外部參數(shù) 373
19.5 徑向畸變糾正 375
19.6 多視圖視覺 376
19.7 廣義的對極幾何 376
19.8 本征矩陣 377
19.9 基礎(chǔ)矩陣 378
19.10 本征矩陣和基礎(chǔ)矩陣的性質(zhì) 379
19.11 評估基礎(chǔ)矩陣 380
19.12 8點(diǎn)算法的更新 380
19.13 圖像校正 380
19.14 三維重建 381
19.15 結(jié)束語 382
19.16 書目和歷史注釋 383
19.17 問題 384
第20章 運(yùn)動 385
20.1 導(dǎo)言 385
20.2 光流 385
20.3 光流場的理解 387
20.4 利用擴(kuò)展焦點(diǎn)避免碰撞 389
20.5 時間鄰近度分析 390
20.6 基于光流模型的基本問題 391
20.7 運(yùn)動中的立體視覺 391
20.8 卡爾曼濾波器 393
20.9 寬基線匹配 394
20.10 結(jié)束語 395
20.11 書目和歷史注釋 396
20.12 問題 396
第五部分 計算機(jī)視覺的應(yīng)用
第21章 人臉檢測與識別:深度學(xué)習(xí)帶來的影響 398
21.1 導(dǎo)言 398
21.2 一種人臉檢測的簡單方法 399
21.3 人臉特征檢測 401
21.4 用于快速人臉檢測的Viola-Jones方法 402
21.5 人臉識別的特征臉方法 404
21.6 人臉識別的其他難點(diǎn) 406
21.7 人臉正面化 408
21.8 Sun等人提出的DeepID人臉表征系統(tǒng) 410
21.9 再議快速人臉檢測 413
21.10 三維人臉檢測 416
21.11 結(jié)束語 417
21.12 書目和歷史注釋 418
第22章 監(jiān)控 420
22.1 導(dǎo)言 420
22.2 監(jiān)控:基本幾何 421
22.3 前景–背景分離 424
22.3.1 背景建模 424
22.3.2 背景建模的實(shí)例 426
22.3.3 前景的直接檢測 430
22.4 粒子濾波 430
22.5 基于顏色直方圖的跟蹤 434
22.6 粒子濾波的應(yīng)用 437
22.7 倒角匹配、跟蹤和遮擋 439
22.8 多個攝像機(jī)的組合視角 440
22.9 交通流量監(jiān)測的應(yīng)用 443
22.9.1 Bascle等人的系統(tǒng) 443
22.9.2 Koller等人的系統(tǒng) 445
22.10 車牌定位 446
22.11 跟蹤遮擋分類 447
22.12 通過步態(tài)區(qū)分行人 449
22.13 人體步態(tài)分析 451
22.14 基于模型的動物跟蹤 452
22.15 結(jié)束語 454
22.16 書目和歷史注釋 455
22.17 問題 456
第23章 車載視覺系統(tǒng) 457
23.1 導(dǎo)言 457
23.2 定位道路 458
23.3 道路交通標(biāo)線的定位 459
23.4 道路交通標(biāo)志的定位 461
23.5 車輛的定位 462
23.6 通過查看車牌和其他結(jié)構(gòu)特征獲得的信息 464
23.7 定位行人 466
23.8 導(dǎo)航和自我運(yùn)動 468
23.9 農(nóng)業(yè)車輛導(dǎo)航 471
23.9.1 任務(wù)的三維層面 473
23.9.2 實(shí)時實(shí)現(xiàn) 473
23.10 結(jié)束語 474
23.11 高級駕駛輔助系統(tǒng)的更多細(xì)節(jié)及相關(guān)書目 474
23.11.1 車輛檢測的發(fā)展 476
23.11.2 行人檢測的發(fā)展 476
23.11.3 道路和車道檢測的發(fā)展 478
23.11.4 交通標(biāo)志檢測的發(fā)展 479
23.11.5 路徑規(guī)劃、導(dǎo)航和自我運(yùn)動的發(fā)展 480
23.12 問題 480
第24章 結(jié)語——計算機(jī)視覺展望 481
24.1 導(dǎo)言 481
24.2 機(jī)器視覺中的重要參數(shù) 481
24.3 權(quán)衡 483
24.3.1 一些重要的權(quán)衡 483
24.3.2 兩階段模板匹配權(quán)衡 484
24.4 摩爾定律的作用 484
24.5 硬件、算法和過程 485
24.6 選擇表達(dá)形式的重要性 485
24.7 過去、現(xiàn)在和未來 486
24.8 深度學(xué)習(xí)探索 487
24.9 書目和歷史注釋 487
在線資源
附錄A 穩(wěn)健統(tǒng)計
附錄B 采樣定理
附錄C 顏色的表示
附錄D 從分布中采樣
參考文獻(xiàn)