本書著重機(jī)器機(jī)視覺的基本理論和技術(shù),介紹各種智能圖像處理與機(jī)器視覺技術(shù)的相關(guān)應(yīng)用;具備解決智能化檢測(cè)與識(shí)別、控制等應(yīng)用問(wèn)題的初步能力,為以后從事模式識(shí)別與智能控制、機(jī)器人技術(shù)、智能制造等領(lǐng)域的研究與開發(fā)工作打下扎實(shí)的基礎(chǔ)。
機(jī)器視覺是一項(xiàng)綜合技術(shù),其內(nèi)容涉及數(shù)字信號(hào)處理、機(jī)械工程技術(shù)、控制與光源照明技術(shù)、傳感器技術(shù)、計(jì)算機(jī)軟件技術(shù)和人機(jī)接口技術(shù)等。典型的機(jī)器視覺應(yīng)用系統(tǒng)包括圖像捕捉模塊、光源模塊、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊。因此,機(jī)器視覺就是為智能設(shè)備安裝的眼睛。機(jī)器視覺系統(tǒng)的魯棒性、實(shí)時(shí)性、高速度和高精度是其實(shí)用性的重要指標(biāo)。近年來(lái),計(jì)算機(jī)的運(yùn)算速度逐年提高,人們的生活消費(fèi)方式、生產(chǎn)制造方式有了很大的變化,這給機(jī)器視覺應(yīng)用技術(shù)帶來(lái)了新的需求和挑戰(zhàn)。
上海交通大學(xué)的機(jī)器視覺與應(yīng)用課程開始于2001年,早是面向該校機(jī)械工程學(xué)院機(jī)械電子工程專業(yè)研究生開設(shè)的選修課,是作為機(jī)器人學(xué)配套課程出現(xiàn)的。該課程主要在圖像處理的基礎(chǔ)上重點(diǎn)介紹機(jī)器視覺理論與算法,如圖像預(yù)處理、立體視覺建模、運(yùn)動(dòng)視覺(或稱為序列圖像分析)、由圖像灰度恢復(fù)三維物體形狀、物體建模與識(shí)別方法,以及距離圖像分析方法等。本書規(guī)避了圖像處理涉及的大量數(shù)學(xué)公式,而是從應(yīng)用案例入手,幫助讀者掌握機(jī)器視覺技術(shù)并解決實(shí)際問(wèn)題。
20年來(lái),機(jī)器視覺應(yīng)用技術(shù)一直在向更深、更高層次發(fā)展,特別是2010年以來(lái)深度學(xué)習(xí)解決了圖像識(shí)別的一系列瓶頸問(wèn)題,機(jī)器視覺應(yīng)用也從單一視覺檢測(cè)走向視覺定位、環(huán)境建模和對(duì)象識(shí)別的實(shí)用化方向。由于非電類專業(yè)出身的工程技術(shù)人員迫切希望掌握機(jī)器視覺技術(shù)并期待能靈活應(yīng)用該項(xiàng)技術(shù)提高機(jī)器人和裝備的智能化性能,因此,本書在系統(tǒng)地描述機(jī)器視覺的基本理論與方法時(shí),重點(diǎn)介紹機(jī)器視覺應(yīng)用系統(tǒng)涉及的新技術(shù)、新方法、新器件以及機(jī)器視覺的典型應(yīng)用實(shí)例。本書內(nèi)容包含計(jì)算機(jī)視覺與機(jī)器視覺的基本概念、光源技術(shù)、鏡頭技術(shù)、攝像機(jī)技術(shù)和典型接口技術(shù),以及構(gòu)成機(jī)器視覺系統(tǒng)的標(biāo)定技術(shù)。同時(shí),結(jié)合Matlab圖像處理工具和OpenCV開源代碼平臺(tái),繞開了煩瑣的公式,介紹了機(jī)器視覺涉及的圖像處理和模式識(shí)別技術(shù)。書中的主要應(yīng)用案例分別來(lái)自作者指導(dǎo)過(guò)的張昊若、林敏捷、楊理欣幾位研究生的學(xué)位論文,研究生倪培遠(yuǎn)和張悅也參與了本書的整理和編輯工作,在此表示感謝!
由于作者的水平有限,書中難免存在不足之處,請(qǐng)大家就如何完善本書提出寶貴意見,我們的聯(lián)系方式是:qxcao@sjtu.edu.cn。
曹其新,上海交通大學(xué)機(jī)械與動(dòng)力工程學(xué)院教授,博士生導(dǎo)師。主要研究方向?yàn)闄C(jī)器視覺、機(jī)器人控制技術(shù)。曾發(fā)表EI&SCI論文150多篇,獲得國(guó)家發(fā)明專利90多項(xiàng)、國(guó)家科技進(jìn)步二等獎(jiǎng)1項(xiàng)、吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)1項(xiàng)、省部級(jí)科技獎(jiǎng)項(xiàng)5項(xiàng)。
莊春剛,上海交通大學(xué)機(jī)械與動(dòng)力工程學(xué)院副研究員,博士生導(dǎo)師。主要研究方向?yàn)闄C(jī)器視覺與控制。曾發(fā)表EI&SCI論文30多篇,獲得國(guó)家發(fā)明專利10多項(xiàng)、上海市技術(shù)發(fā)明一等獎(jiǎng)1項(xiàng)。
前言
第1章緒論1
11機(jī)器視覺的發(fā)展及系統(tǒng)構(gòu)成1
111機(jī)器視覺的發(fā)展1
112機(jī)器視覺系統(tǒng)的構(gòu)成2
12Marr的視覺理論框架4
121視覺系統(tǒng)研究的3個(gè)層次4
122視覺信息處理的3個(gè)階段5
13機(jī)器視覺任務(wù)和機(jī)器視覺與其他領(lǐng)域的關(guān)系7
131機(jī)器視覺任務(wù)7
132機(jī)器視覺與其他領(lǐng)域的關(guān)系8
14參考文獻(xiàn)9
第2章成像與圖像采集10
21亮度與成像10
211光度學(xué)10
212亮度成像模型12
22鏡頭13
221針孔成像模型13
222鏡頭畸變16
223遠(yuǎn)心與景深17
23攝像機(jī)19
231CCD傳感器19
232CMOS傳感器20
233彩色成像22
234攝像機(jī)性能28
235深度攝像機(jī)30
24攝像機(jī)計(jì)算機(jī)接口31
25參考文獻(xiàn)32
第3章圖像預(yù)處理基礎(chǔ)33
31數(shù)據(jù)結(jié)構(gòu)33
311傳統(tǒng)的圖像數(shù)據(jù)結(jié)構(gòu)33
312分層數(shù)據(jù)結(jié)構(gòu)38
32圖像預(yù)處理41
321灰度值變換41
322幾何變換44
323圖像濾波器53
324形態(tài)學(xué)操作65
33參考文獻(xiàn)70
第4章圖像分割和特征匹配71
41圖像分割71
411閾值分割71
412連通域與邊緣提取77
413亞像素精度閾值分割86
414基于區(qū)域的分割87
415基于3D圖的圖像分割98
42特征匹配103
421區(qū)域特征103
422幾何元素的提取110
423輪廓特征112
424特征檢測(cè)子115
425特征描述子122
426匹配優(yōu)化算法125
427模板匹配132
43參考文獻(xiàn)136
第5章立體視覺與三維重建140
51立體視覺概述140
52立體視覺的基本原理142
53三維重建146
531攝像機(jī)標(biāo)定146
532機(jī)器人手眼標(biāo)定150
533射影幾何152
534多視圖重建場(chǎng)景158
535雙目攝像機(jī)與多目攝像機(jī)164
536深度圖168
54參考文獻(xiàn)169
第6章模式識(shí)別算法171
61支持向量機(jī)171
62貝葉斯分類器173
63聚類算法175
64神經(jīng)網(wǎng)絡(luò)基礎(chǔ)177
641感知機(jī)與神經(jīng)網(wǎng)絡(luò)基礎(chǔ)177
642參數(shù)學(xué)習(xí)方法179
643GPU并行技術(shù)179
65深度卷積神經(jīng)網(wǎng)絡(luò)181
651LeNet182
652GoogLeNet183
653ResNet185
66參考文獻(xiàn)187
第7章機(jī)器視覺在物體識(shí)別與測(cè)量中的應(yīng)用188
71檢測(cè)物體的特征提取188
711區(qū)域特征188
712灰度值特征189
713輪廓特征191
72模式分類與識(shí)別191
73機(jī)器視覺中形狀大小的測(cè)量194
731長(zhǎng)度測(cè)量194
732線段測(cè)量196
733面積測(cè)量196
734圓測(cè)量197
74機(jī)器視覺表面缺陷檢測(cè)198
741印刷檢測(cè)199
742封裝檢測(cè)200
743鋸齒檢測(cè)201
75參考文獻(xiàn)203
第8章視覺伺服的基礎(chǔ)205
81視覺伺服控制簡(jiǎn)介205
82概念說(shuō)明與標(biāo)定技術(shù)206
821坐標(biāo)變換與剛體運(yùn)動(dòng)206
822攝像機(jī)模型與標(biāo)定208
823手眼標(biāo)定技術(shù)212
83視覺伺服控制理論213
831基于位置的視覺伺服213
832基于圖像的視覺伺服215
84應(yīng)用案例232
85參考文獻(xiàn)238
第9章機(jī)器視覺從容器中抓取零件的應(yīng)用240
91散亂零件識(shí)別的基本方法240
92抓取操作的機(jī)器人技術(shù)243
93散亂零件的識(shí)別與操作應(yīng)用246
94參考文獻(xiàn)251
第10章機(jī)器視覺在無(wú)源導(dǎo)航與定位中的應(yīng)用255
101移動(dòng)機(jī)器人與導(dǎo)航255
102定位與地圖構(gòu)建256
103各類傳感器的初始化與預(yù)處理263
104即時(shí)定位與地圖構(gòu)建272
1041使用魚眼攝像機(jī)的視覺SLAM系統(tǒng)277
1042基于多攝像機(jī)系統(tǒng)的視覺SLAM系統(tǒng)277
105參考文獻(xiàn)278