本書系統(tǒng)地介紹了計(jì)算機(jī)視覺的基本原理、典型方法和實(shí)用技術(shù),內(nèi)容包括緒論、圖像采集、基元檢測(cè)、顯著性檢測(cè)、目標(biāo)分割、目標(biāo)表達(dá)和描述、紋理分析、形狀特性分析、立體視覺、三維景物恢復(fù)、運(yùn)動(dòng)分析、景物識(shí)別、廣義匹配、時(shí)空行為理解、場(chǎng)景解釋等。讀者可從中了解計(jì)算機(jī)視覺的基本原理和典型技術(shù),并能據(jù)此解決計(jì)算機(jī)視覺應(yīng)用中的一些具體問(wèn)題。本書提供了許多講解例題,每章均有小結(jié)和參考、思考題和練習(xí)題(本書為部分思考題和練習(xí)題提供了解答)。
本書可作為信息科學(xué)、計(jì)算機(jī)科學(xué)、計(jì)算機(jī)應(yīng)用、信號(hào)與信息處理、通信與信息系統(tǒng)、電子與通信工程、模式識(shí)別與智能系統(tǒng)等學(xué)科大學(xué)本科或研究生的專業(yè)基礎(chǔ)課教材,也可作為遠(yuǎn)程教育或繼續(xù)教育中計(jì)算機(jī)應(yīng)用、電子技術(shù)等專業(yè)的研究生相關(guān)課程教材,還可供涉及計(jì)算機(jī)視覺技術(shù)應(yīng)用行業(yè)(如工業(yè)自動(dòng)化、人機(jī)交互、辦公自動(dòng)化、視覺導(dǎo)航和機(jī)器人、安全監(jiān)控、生物醫(yī)學(xué)、遙感測(cè)繪、智能交通和軍事公安等)的科技工作者自學(xué)及科研參考。
(1)計(jì)算機(jī)視覺領(lǐng)域的權(quán)威理論教材,有極高的學(xué)術(shù)價(jià)值。
(2)書稿內(nèi)容思路清晰,表述極其嚴(yán)謹(jǐn),作者對(duì)計(jì)算機(jī)視覺的理解非常深刻,繪制了計(jì)算機(jī)視覺與相關(guān)學(xué)科的關(guān)系圖譜,讓讀者對(duì)該領(lǐng)域的構(gòu)架一目了然。
(3)增加微課內(nèi)容,通俗易懂地講解本書知識(shí)點(diǎn)。
(4)我國(guó)圖像領(lǐng)域的奠基人之一。
章毓晉,1989年獲比利時(shí)列日大學(xué)應(yīng)用科學(xué)博士學(xué)位。1989年至1993年先后為荷蘭德爾夫特大學(xué)博士后及研究人員。1993年到清華大學(xué)工作,1997年起被聘為教授,1998年起被聘為博士生導(dǎo)師,2014年起被聘為教學(xué)科研系列的“長(zhǎng)聘教授”。已在國(guó)內(nèi)外發(fā)表了500多篇圖像工程研究論文,出版了40多本教材和專著。曾任第24屆國(guó)際圖像處理會(huì)議(ICIP?2017)等20多個(gè)國(guó)內(nèi)外學(xué)術(shù)會(huì)議的程序委員會(huì)主席,F(xiàn)為中國(guó)圖象圖形學(xué)學(xué)會(huì)副理事長(zhǎng);國(guó)際光學(xué)工程協(xié)會(huì)(SPIE)會(huì)士(因在圖像工程方面的成就)。
1、 緒論
1.1 計(jì)算機(jī)視覺 1
1.1.1 視覺概述 1
1.1.2 計(jì)算機(jī)視覺的目標(biāo) 2
1.1.3 相關(guān)學(xué)科 2
1.1.4 應(yīng)用領(lǐng)域 4
1.2 圖像基礎(chǔ) 4
1.2.1 圖像及類別 4
1.2.2 圖像表達(dá)和顯示 6
1.2.3 圖像存儲(chǔ) 7
1.3 像素間聯(lián)系 10
1.3.1 像素鄰域 10
1.3.2 像素間距離 11
1.4 本書內(nèi)容提要 15
1.4.1 計(jì)算機(jī)視覺系統(tǒng)及模塊 15
1.4.2 如何學(xué)習(xí)使用本書 16
總結(jié)和復(fù)習(xí) 19
2、 圖像采集 21
2.1 采集裝置 21
2.2 采集模型 23
2.2.1 幾何成像模型 23
2.2.2 亮度成像模型 28
2.2.3 空間和幅度分辨率 31
2.3 采集方式 32
2.3.1 成像方式一覽 32
2.3.2 結(jié)構(gòu)光法 33
2.4 攝像機(jī)標(biāo)定 34
2.4.1 標(biāo)定程序和步驟 34
2.4.2 兩級(jí)標(biāo)定法 37
總結(jié)和復(fù)習(xí) 40
3、 基元檢測(cè) 42
3.1 邊緣檢測(cè) 42
3.1.1 檢測(cè)原理 42
3.1.2 一階導(dǎo)數(shù)算子 43
3.1.3 二階導(dǎo)數(shù)算子 47
3.1.4 邊界閉合 51
3.1.5 邊界細(xì)化 51
3.2 SUSAN算子 52
3.2.1 USAN原理 53
3.2.2 角點(diǎn)和邊緣檢測(cè) 53
3.3 哈里斯興趣點(diǎn)算子 56
3.4 哈夫變換 58
3.3.1 基本哈夫變換 58
3.3.2 廣義哈夫變換 61
3.3.3 完整廣義哈夫變換 63
3.5 橢圓定位和檢測(cè) 64
3.6 位置直方圖技術(shù) 66
總結(jié)和復(fù)習(xí) 68
4、 顯著性檢測(cè) 71
4.1 顯著性概述 71
4.2 基于對(duì)比度的檢測(cè) 74
4.2.1 對(duì)比度算法分類 74
4.2.2 基于對(duì)比度幅值 74
4.2.3 基于對(duì)比度分布 75
4.2.4 基于最小方向?qū)Ρ榷取?7
4.3 基于最穩(wěn)定區(qū)域的檢測(cè) 79
4.3.1 區(qū)域顯著性 79
4.3.2 最穩(wěn)定區(qū)域 80
4.3.3 顯著性計(jì)算 82
4.3.4 顯著性后處理 83
4.4 顯著目標(biāo)區(qū)域提取及效果評(píng)價(jià) 84
4.4.1 顯著目標(biāo)區(qū)域提取 84
4.4.2 顯著區(qū)域提取效果評(píng)價(jià) 85
總結(jié)和復(fù)習(xí) 89
5、 目標(biāo)分割 91
5.1 輪廓搜索 91
5.1.1 圖搜索 91
5.1.2 動(dòng)態(tài)規(guī)劃 93
5.2 主動(dòng)輪廓模型 94
5.2.1 主動(dòng)輪廓 94
5.2.2 能量函數(shù) 95
5.3 基本閾值技術(shù) 97
5.3.1 原理和分類 97
5.3.2 全局閾值的選取 98
5.3.3 局部閾值的選取 100
5.3.4 動(dòng)態(tài)閾值的選取 103
5.4 特色閾值方法 103
5.4.1 多分辨率閾值 103
5.4.2 過(guò)渡區(qū)閾值 105
5.5 特征空間聚類 107
5.5.1 基本聚類方法 107
5.5.2 均移確定聚類中心 108
總結(jié)和復(fù)習(xí) 109
6、 目標(biāo)表達(dá)和描述 111
6.1 基于邊界的表達(dá) 111
6.1.1 鏈碼 111
6.1.2 邊界段和凸包 113
6.1.3 邊界標(biāo)記 114
6.2 基于區(qū)域的表達(dá) 117
6.2.1 四叉樹 117
6.2.2 金字塔 118
6.2.3 圍繞區(qū)域 119
6.2.4 骨架 119
6.3 基于邊界的描述 122
6.3.1 邊界長(zhǎng)度和直徑 122
6.3.2 邊界形狀數(shù) 123
6.3.3 輪廓形狀矩陣 124
6.4 基于區(qū)域的描述 124
6.4.1 區(qū)域面積和密度 124
6.4.2 區(qū)域形狀數(shù) 125
6.4.3 區(qū)域不變矩 126
6.4.4 拓?fù)涿枋龇?28
總結(jié)和復(fù)習(xí) 129
7、 紋理分析 131
7.1 統(tǒng)計(jì)描述方法 131
7.1.1 灰度共生矩陣 131
7.1.2 基于共生矩陣的描述 133
7.1.3 基于能量的描述 133
7.2 結(jié)構(gòu)描述方法 135
7.2.1 結(jié)構(gòu)描述原理 135
7.2.2 紋理鑲嵌 137
7.2.3 局部二值模式 138
7.3 頻譜描述方法 140
7.3.1 傅里葉頻譜描述 140
7.3.2 貝塞爾-傅里葉頻譜描述 141
7.3.3 蓋伯頻譜描述 142
7.4 紋理圖像分割 144
7.4.1 有監(jiān)督紋理分割 144
7.4.2 無(wú)監(jiān)督紋理分割 146
總結(jié)和復(fù)習(xí) 148
8、 形狀分析 150
8.1 形狀緊湊性描述符 150
8.2 形狀復(fù)雜性描述符 157
8.3 基于多邊形的形狀分析 159
8.3.1 多邊形計(jì)算 159
8.3.2 多邊形描述 160
8.4 基于曲率的形狀分析 162
8.4.1 輪廓曲率 162
8.4.2 曲面曲率 165
8.5 拓?fù)浣Y(jié)構(gòu)參數(shù) 166
總結(jié)和復(fù)習(xí) 167
9、 立體視覺 169
9.1 立體視覺模塊 169
9.2 雙目成像和視差 171
9.2.1 雙目橫向模式 171
9.2.2 雙目橫向會(huì)聚模式 173
9.2.3 雙目縱向模式 174
9.3 基于區(qū)域的立體匹配 175
9.3.1 模板匹配 175
9.3.2 雙目立體匹配 177
9.4 基于特征的立體匹配 183
9.4.1 點(diǎn)對(duì)點(diǎn)的方法 183
9.4.2 動(dòng)態(tài)規(guī)劃匹配 185
總結(jié)和復(fù)習(xí) 186
10、三維景物恢復(fù) 189
10.1 由光移恢復(fù)表面朝向 189
10.1.1 表面反射特性 189
10.1.2 目標(biāo)表面朝向 192
10.1.3 反射圖 193
10.1.4 光度立體學(xué)求解 195
10.2 從影調(diào)獲取形狀信息 196
10.2.1 影調(diào)與形狀 196
10.2.2 求解亮度方程 198
10.3 紋理變化與表面朝向 200
10.3.1 三種典型變化 200
10.3.2 確定線段的紋理消失點(diǎn) 203
10.4 根據(jù)焦距確定深度 206
總結(jié)和復(fù)習(xí) 207
11、運(yùn)動(dòng)分析 209
11.1 運(yùn)動(dòng)分類和表達(dá) 209
11.2 全局運(yùn)動(dòng)檢測(cè) 212
11.2.1 利用圖像差的檢測(cè) 213
11.2.2 基于模型的檢測(cè) 215
11.3 運(yùn)動(dòng)目標(biāo)檢測(cè)和分割 217
11.3.1 背景建!217
11.3.2 運(yùn)動(dòng)目標(biāo)跟蹤 220
11.3.3 運(yùn)動(dòng)目標(biāo)分割 224
11.4 運(yùn)動(dòng)光流和表面取向 225
11.4.1 光流約束方程 225
11.4.2 光流計(jì)算 225
11.4.3 光流與表面取向 229
總結(jié)和復(fù)習(xí) 232
12、景物識(shí)別 234
12.1 統(tǒng)計(jì)模式分類 234
12.1.1 模式分類原理 234
12.1.2 最小距離分類器 235
12.1.3 最優(yōu)統(tǒng)計(jì)分類器 236
12.1.4 自適應(yīng)自舉 239
12.2 感知機(jī) 240
12.2.1 感知機(jī)原理 240
12.2.2 線性可分類感知機(jī) 241
12.2.3 線性不可分類感知機(jī) 242
12.3 支持向量機(jī) 243
12.3.1 線性可分類支持向量機(jī) 243
12.3.2 線性不可分類支持向量機(jī) 245
12.4 結(jié)構(gòu)模式識(shí)別 246
12.4.1 字符串結(jié)構(gòu)識(shí)別 246
12.4.2 樹結(jié)構(gòu)識(shí)別 249
總結(jié)和復(fù)習(xí) 251
13、廣義匹配 253
13.1 目標(biāo)匹配 253
13.1.1 匹配的度量 254
13.1.2 字符串匹配 257
13.1.3 慣量等效橢圓匹配 258
13.1.4 形狀矩陣匹配 259
13.2 動(dòng)態(tài)模式匹配 260
13.3 關(guān)系匹配 263
13.3.1 關(guān)系表達(dá)和距離 263
13.3.2 關(guān)系匹配模型 264
13.4 圖同構(gòu)匹配 266
13.4.1 圖論基礎(chǔ) 266
13.4.2 圖同構(gòu)和匹配 268
總結(jié)和復(fù)習(xí) 270
14、時(shí)空行為理解 272
14.1 時(shí)空技術(shù) 272
14.2 時(shí)空興趣點(diǎn) 273
14.3 動(dòng)態(tài)軌跡學(xué)習(xí)和分析 275
14.3.1 自動(dòng)場(chǎng)景建!276
14.3.2 路徑學(xué)習(xí) 277
14.3.3 自動(dòng)活動(dòng)分析 279
14.4 動(dòng)作分類和識(shí)別 280
14.4.1 動(dòng)作分類 280
14.4.2 動(dòng)作識(shí)別 281
14.5 活動(dòng)和行為建!285
14.5.1 動(dòng)作建!285
14.5.2 活動(dòng)建模和識(shí)別 288
總結(jié)和復(fù)習(xí) 291
15、場(chǎng)景解釋 293
15.1 線條圖標(biāo)記解釋 293
15.2 體育比賽視頻排序 296
15.2.1 基于內(nèi)容檢索 296
15.2.2 視頻節(jié)目精彩度排序 298
15.3 計(jì)算機(jī)視覺系統(tǒng)模型 302
15.3.1 多層次串行結(jié)構(gòu) 302
15.3.2 知識(shí)庫(kù)為中心的輻射結(jié)構(gòu) 303
15.3.3 知識(shí)庫(kù)為根的樹結(jié)構(gòu) 303
15.3.4 多模塊交叉配合結(jié)構(gòu) 304
15.4 計(jì)算機(jī)視覺理論框架 305
15.4.1 馬爾視覺計(jì)算理論 305
15.4.2 對(duì)馬爾理論框架的改進(jìn) 308
15.4.3 新理論框架的研究 309
總結(jié)和復(fù)習(xí) 311
部分練習(xí)題解答 313
參考文獻(xiàn) 318
索引 324