交通環(huán)境感知是實現(xiàn)智能駕駛的關鍵,我國駕駛環(huán)境的復雜性和不確定性給環(huán)境感知帶來很多困難。本書從車外環(huán)境和車內(nèi)環(huán)境兩方面對交通環(huán)境感知的相關問題進行了研究。全書共11章,介紹了神經(jīng)網(wǎng)絡及其優(yōu)化方法的基礎知識,并進一步介紹了基于深度神經(jīng)網(wǎng)絡的駕駛環(huán)境感知中的關鍵問題,包括交通場景中的行人、地面標志線、交通信號燈及車輛的目標檢測任務,以及車內(nèi)駕駛員的疲勞駕駛檢測任務,涉及的主要技術包括數(shù)字圖像處理、深度神經(jīng)網(wǎng)絡、視覺認知與計算等方面。
更多科學出版社服務,請掃碼獲取。
鐵路與國民經(jīng)濟各部門的技術經(jīng)濟聯(lián)系研究(二等獎),2013年,排名第1
鐵路運價與定價數(shù)學模型研究(二等獎),2015年,排名第1
目錄
“信息科學技術學術著作叢書”序
前言
第1章 緒論1
1.1 人工智能1
1.2 視覺智能1
1.3 交通場景環(huán)境感知2
1.3.1 交通場景的定義2
1.3.2 交通場景中的視覺認知2
1.4 本章小結3
參考文獻3
第2章 神經(jīng)網(wǎng)絡5
2.1 感知機5
2.2 基于梯度下降的學習方法6
2.3 隱層單元8
2.4 反向傳播算法9
2.5 本章小結10
參考文獻10
第3章 卷積神經(jīng)網(wǎng)絡11
3.1 網(wǎng)絡的基本部件11
3.1.1 卷積層11
3.1.2 池化層12
3.1.3 激活函數(shù)13
3.1.4 全連接層14
3.2 經(jīng)典網(wǎng)絡模型14
3.2.1 Alex-Net網(wǎng)絡模型14
3.2.2 VGG-Nets網(wǎng)絡模型15
3.2.3 GoogLeNet網(wǎng)絡模型17
3.2.4 殘差網(wǎng)絡模型18
3.3 經(jīng)典目標檢測網(wǎng)絡19
3.3.1 基于two-stage的算法20
3.3.2 基于one-stage的算法21
3.4 本章小結23
參考文獻23
第4章 深度神經(jīng)網(wǎng)絡的優(yōu)化方法25
4.1 深度網(wǎng)絡優(yōu)化中的問題25
4.1.1 局部極小值25
4.1.2 高原、鞍點和其他平坦區(qū)域26
4.1.3 梯度消失和梯度爆炸28
4.1.4 優(yōu)化的理論限制28
4.2 隨機梯度下降29
4.3 自適應學習率算法29
4.4 優(yōu)化策略30
4.5 本章小結32
參考文獻32
第5章 深度神經(jīng)網(wǎng)絡模型壓縮34
5.1 深度網(wǎng)絡模型壓縮的研究現(xiàn)狀34
5.2 網(wǎng)絡模型的壓縮策略37
5.2.1 低秩近似37
5.2.2 量化與二值網(wǎng)絡38
5.2.3 剪枝與裁剪38
5.3 基于殘差結構的輕量化卷積模型39
5.3.1 殘差網(wǎng)絡及其變體39
5.3.2 輕量化卷積模型的設計41
5.3.3 實驗及結果分析46
5.4 面向輕量化模型的知識遷移方法48
5.4.1 基于注意力的知識遷移模型48
5.4.2 面向輕量化模型的知識遷移方法50
5.4.3 實驗結果及分析51
5.5 駕駛環(huán)境下的實時目標檢測方法55
5.5.1 基于深度學習的目標檢測模型56
5.5.2 基于知識遷移的實時目標檢測方法60
5.5.3 實驗及結果分析62
5.5.4 真實道路數(shù)據(jù)集測試63
5.6 本章小結66
參考文獻66
第6章 行人檢測70
6.1 行人檢測數(shù)據(jù)集71
6.2 評估方法72
6.3 基于YOLO多尺度空間特征融合的道路區(qū)域行人檢測方法73
6.3.1 多尺度特征提取模塊73
6.3.2 基于注意力機制的特征融合模塊74
6.3.3 特征分類和坐標回歸75
6.3.4 模型訓練和驗證76
6.4 多階段級聯(lián)網(wǎng)絡行人檢測算法79
6.4.1 多階段級聯(lián)網(wǎng)絡算法概述79
6.4.2 第一階段網(wǎng)絡設計80
6.4.3 第二階段網(wǎng)絡設計85
6.4.4 第三階段網(wǎng)絡設計87
6.5 網(wǎng)絡模型訓練與測試88
6.5.1 困難樣本挖掘88
6.5.2 損失函數(shù)設計89
6.5.3 模型訓練與測試配置90
6.6 多階段級聯(lián)網(wǎng)絡模型的有效性分析91
6.6.1 不同算法性能對比91
6.6.2 各模塊消融實驗94
6.7 本章小結96
參考文獻97
第7章 地面標志線檢測100
7.1 地面標志定義100
7.2 地面標志結構化處理101
7.2.1 逆透視變換102
7.2.2 車道線自適應擬合處理104
7.2.3 地面指示箭頭結構化處理109
7.3 基于傳統(tǒng)算法的地面標志檢測110
7.3.1 車道線檢測111
7.3.2 斑馬線檢測121
7.3.3 停止線檢測124
7.4 基于深度學習的地面標志檢測126
7.4.1 基于編碼器-解碼器的算法127
7.4.2 基于整合上下文信息的算法128
7.5 基于改進Mask R-CNN實例分割網(wǎng)絡的地面標志檢測方法130
7.5.1 Mask R-CNN實例分割網(wǎng)絡架構130
7.5.2 Mask R-CNN實例分割網(wǎng)絡的改進及優(yōu)化133
7.5.3 基于改進Mask R-CNN的分割實驗結果133
7.6 地面標志檢測綜合實驗結果及應用134
7.6.1 實驗數(shù)據(jù)集介紹134
7.6.2 評定標準135
7.6.3 實驗結果及分析136
7.7 本章小結141
參考文獻141
第8章 交通信號檢測145
8.1 交通信號介紹145
8.2 基于特征融合的交通信號檢測151
8.2.1 算法結構設計151
8.2.2 實驗結果與分析154
8.3 基于深度級聯(lián)網(wǎng)絡的交通標識檢測156
8.3.1 級聯(lián)網(wǎng)絡結構156
8.3.2 精準分類網(wǎng)絡157
8.3.3 實驗結果分析與參賽測試證明161
8.4 本章小結163
參考文獻163
第9章 前方車輛位置監(jiān)測165
9.1 基于Faster R-CNN的2D車輛檢測165
9.1.1 整體框架結構165
9.1.2 RPN結構與錨點生成165
9.1.3 尺度歸一化166
9.1.4 損失函數(shù)167
9.1.5 測試結果167
9.2 基于關鍵點回歸網(wǎng)絡的3D車輛檢測169
9.2.1 算法整體流程169
9.2.2 關鍵點回歸169
9.2.3 回歸網(wǎng)絡170
9.2.4 損失函數(shù)171
9.2.5 3D包圍框估計171
9.2.6 測試結果174
9.3 基于車輛下邊沿和逆透視變換的車距測量175
9.3.1 算法整體流程175
9.3.2 車輛下邊沿及關鍵點計算175
9.3.3 逆透視變換模型176
9.4 本章小結180
參考文獻180
第10章 疲勞駕駛檢測181
10.1 駕駛員的人臉檢測181
10.1.1 人臉檢測概述181
10.1.2 基于級聯(lián)卷積神經(jīng)網(wǎng)絡的人臉檢測182
10.1.3 基于ShuffleNet改進的MTCNN人臉檢測模型185
10.1.4 實驗結果與分析188
10.2 駕駛員去人臉遮擋的人臉關鍵點檢測189
10.2.1 基于生成對抗網(wǎng)絡與自編碼器的人臉去遮擋189
10.2.2 基于深度回歸網(wǎng)絡與去人臉遮擋網(wǎng)絡的人臉關鍵點檢測191
10.2.3 實驗結果與分析192
10.3 本章小結196
參考文獻197
第11章 視覺智能在駕駛安全中的應用198
11.1 行人意圖分析198
11.1.1 行人意圖預測的難點198
11.1.2 行人與周圍環(huán)境的交互198
11.1.3 行人與其他人的交互199
11.1.4 行人與本車的交互199
11.1.5 意圖預測方法199
11.2 車道偏離檢測199
11.3 駕駛員疲勞檢測系統(tǒng)設計和實現(xiàn)200
11.4 本章小結201
參考文獻202