機器人、無人駕駛汽車、無人機和智慧工廠將顯著改變數(shù)字社會中人類的生活方式。無線機器人中的人工智能介紹了無線通信和網(wǎng)絡技術如何促進機器人中的人工智能,它在機器人中的人工智能、無線通信、計算和控制之間架起了基礎的多學科知識的橋梁。本書的一個獨特性是提出應用通信和信號處理技術來增強機器人和多智能體系統(tǒng)中的傳統(tǒng)人工智能。
本書的技術內容包括機器人基礎知識、信息物理系統(tǒng)、人工智能,統(tǒng)計決策和馬爾可夫決策過程,強化學習,狀態(tài)估計,定位,計算機視覺和多模態(tài)數(shù)據(jù)融合,機器人規(guī)劃,多智能體系統(tǒng),網(wǎng)絡化多智能體系統(tǒng),網(wǎng)絡化機器人的安全性和魯棒性,以及超可靠和低延遲的機器對機器的網(wǎng)絡。提供的例題和練習有助于簡單和有效的理解本書的內容。
希望拓展在機器人、人工智能和無線通信等方面的知識的工程師將從這本書中受益。同時,本書也適用于電氣工程、計算機工程、計算機科學和一般工程專業(yè)的高年級本科生或一年級研究生的教材。讀者需要具備本科概率論和線性代數(shù)的基礎知識,以及基本的編程能力,來享受深入閱讀的樂趣。
譯者序
前言
作譯者簡介
第1章 人工智能和機器人概述1
1.1 人工智能、控制論和機器人學的基礎知識1
1.2 智能體4
1.2.1 合理性的概念5
1.2.2 系統(tǒng)動力學6
1.2.3 任務環(huán)境8
1.2.4 機器人和多智能體系統(tǒng)9
1.3 推理11
1.3.1 約束滿足問題13
1.3.2 通過搜索來求解CSP15
參考文獻20
第2章 基本搜索算法21
2.1 問題求解智能體21
2.2 搜索求解24
2.3 統(tǒng)一搜索28
2.3.1 廣度優(yōu)先搜索28
2.3.2 動態(tài)規(guī)劃30
2.3.3 深度優(yōu)先搜索35
2.4 有信息搜索37
2.5 優(yōu)化41
2.5.1 線性規(guī)劃41
2.5.2 非線性規(guī)劃42
2.5.3 凸優(yōu)化42
參考文獻44
第3章 機器學習基礎45
3.1 監(jiān)督學習46
3.1.1 回歸46
3.1.2 貝葉斯分類53
3.1.3 KNN54
3.1.4 支持向量機55
3.2 無監(jiān)督學習57
3.2.1 K均值聚類57
3.2.2 EM算法58
3.2.3 主成分分析58
3.3 深度神經(jīng)網(wǎng)絡61
3.4 數(shù)據(jù)預處理64
參考文獻68
第4章 馬爾可夫決策過程69
4.1 統(tǒng)計決策69
4.1.1 數(shù)學基礎72
4.1.2 貝葉斯決策73
4.1.3 雷達信號探測78
4.1.4 貝葉斯序貫決策80
4.2 馬爾可夫決策過程81
4.2.1 馬爾可夫決策過程的數(shù)學基礎82
4.2.2 最優(yōu)策略84
4.2.3 開發(fā)貝爾曼方程的解85
4.3 決策及規(guī)劃:動態(tài)規(guī)劃87
4.4 MDP的應用:搜索移動目標92
4.5 多臂賭博機問題95
4.5.1 ε-貪婪算法97
4.5.2 上置信界98
4.5.3 湯普森采樣99
參考文獻106
第5章 強化學習107
5.1 強化學習基礎107
5.1.1 重訪多臂賭博機問題108
5.1.2 強化學習基礎111
5.1.3 基于馬爾可夫過程的強化學習112
5.1.4 貝爾曼最優(yōu)性原理115
5.2 Q學習116
5.2.1 部分可觀測狀態(tài)116
5.2.2 Q學習算法117
5.2.3 Q學習示例119
5.3 無模型的學習125
5.3.1 蒙特卡羅方法126
5.3.2 時序差分學習129
5.3.3 SARSA132
5.3.4 Q學習與TD學習的關系133
參考文獻135
第6章狀態(tài)估計136
6.1 估計基礎136
6.1.1 基于觀測的線性估計量137
6.1.2 線性預測139
6.1.3 貝葉斯估計140
6.1.4 極大似然估計142
6.2 遞歸狀態(tài)估計144
6.3 貝葉斯濾波146
6.4 高斯濾波149
6.4.1 卡爾曼濾波149
6.4.2 標量卡爾曼濾波150
6.4.3 擴展卡爾曼濾波154
參考文獻156
第7章 定位157
7.1 傳感器網(wǎng)絡定位158
7.1.1 到達時間技術158
7.1.2 到達角技術160
7.1.3 到達時間差技術162
7.2 移動機器人定位164
7.3 同時定位與建圖165
7.3.1 概率SLAM166
7.3.2 擴展卡爾曼濾波SLAM168
7.3.3 立體攝像機輔助的SLAM169
7.4 網(wǎng)絡定位和導航172
參考文獻175
第8章 機器人規(guī)劃176
8.1 知識表示和分類邏輯176
8.1.1 貝葉斯網(wǎng)絡178
8.1.2 語義表示184
8.2 離散規(guī)劃184
8.3 自主移動機器人的規(guī)劃和導航187
8.3.1 規(guī)劃和導航示例188
8.3.2 強化學習的系統(tǒng)闡述189
8.3.3 定長規(guī)劃191
8.3.4 條件窮舉規(guī)劃191
參考文獻196
第9章多模態(tài)數(shù)據(jù)融合197
9.1 計算機視覺197
9.1.1 計算機視覺基礎198
9.1.2 邊緣檢測199
9.1.3 圖像特征和目標識別201
9.2 基于視覺功能的多模態(tài)信息融合203
9.3 決策樹206
9.3.1 決策示例207
9.3.2 正式處理209
9.3.3 分類樹210
9.3.4 回歸樹211
9.3.5 規(guī)則和樹212
9.3.6 定位機器人213
9.3.7 帶決策樹的強化學習214
9.4 聯(lián)邦學習219
9.4.1 聯(lián)邦學習基礎220
9.4.2 通過無線通信進行聯(lián)邦學習221
9.4.3 無線網(wǎng)絡上的聯(lián)邦學習222
9.4.4 多接入通信上的聯(lián)邦學習224
參考文獻225
第10章多機器人系統(tǒng)227
10.1 多機器人任務分配227
10.1.1 最優(yōu)分配228
10.1.2 多旅行商問題230
10.1.3 工廠自動化231
10.2 無線通信和網(wǎng)絡236
10.2.1 數(shù)字通信系統(tǒng)236
10.2.2 計算機網(wǎng)絡239
10.2.3 多址通信241
10.3 網(wǎng)絡多機器人系統(tǒng)243
10.3.1 曼哈頓街道上的聯(lián)網(wǎng)自動駕駛汽車243
10.3.2 網(wǎng)絡協(xié)同多機器人系統(tǒng)251
參考文獻257
技術縮略語258
索引263