本書從多角度覆蓋了多智能體自主協(xié)同技術的內容,分5篇共18章,包括多智能體系統(tǒng)的協(xié)同基礎、集群控制、通信優(yōu)化、任務協(xié)同及目標追蹤,旨在將多智能體自主協(xié)同技術中的方法和理論結合起來,并強調協(xié)同基礎的重要性,具有基礎性、應用性、綜合性和系統(tǒng)性等特點。
本書可以作為多智能體系統(tǒng)領域研究的入門指南,或者作為協(xié)同無人系統(tǒng)工程師的自學教材,還可以用作高年級本科生以及研究生教材。另外,本書也可以作為協(xié)同無人系統(tǒng)、無人飛行系統(tǒng)以及無人系統(tǒng)的補充閱讀材料。
多智能體自主協(xié)同技術是近年來熱門的研究方向,本書兼顧了基礎知識和前沿算法,使讀者可以根據(jù)自身的實際情況由淺入深地了解多智能體自主協(xié)同技術。目前市面缺乏系統(tǒng)闡述多智能體自主協(xié)同理論算法和應用的書籍,尤其是缺少中文版的參考資料。本書及時填補了這一空白。本書介紹了多智能體在協(xié)同搜索、災難救援、自主避障、海洋探測等領域的應用,對于促進多智能體自主協(xié)同技術的應用研究有積極的推動作用,為不同領域的研究人員提供了橋梁。本書并不是純粹的理論創(chuàng)作,在提出多智能體自主協(xié)同概念的同時,在方法及實現(xiàn)路徑上展開進一步探討,具有很高的學術價值和應用價值。開展多智能體自主協(xié)同技術研究,對于推動我國軍事智能、智能產業(yè)高質量發(fā)展、加快工業(yè)轉型升級具有重要意義。
本書創(chuàng)造性地提出了謝賓斯基集群、圓環(huán)控制集群等概念來形象地闡述發(fā)展完善的智能體協(xié)同產業(yè)的基本原理,提煉了多智能體協(xié)同、控制、通信三大核心本質,更提出了無人系統(tǒng)產業(yè)在協(xié)同集群后的未來發(fā)展方向,智能化、無人化產業(yè)將超越當前傳統(tǒng)產業(yè),真正實現(xiàn)新要素、新產品、新業(yè)態(tài)的創(chuàng)造,節(jié)省了人力,行業(yè)增量加大。
本書與市面上的智能體相關書籍相比,有兩大顯著的優(yōu)勢,已有書籍主要闡述的是智能體的產生背景、發(fā)展歷史、概念、模式、功能等,而本書一是探討了多智能體協(xié)同的未來發(fā)展方向,包括已經逐步實現(xiàn)的無人機自主集群和協(xié)同執(zhí)行任務,二是濃墨重筆地闡述了多智能體協(xié)同的實踐經驗,可操作性強,彌補了市面書籍對于多智能體協(xié)同集群實操指南的空白。隨著人工智能產業(yè)項目的落地需求,本書所涵蓋的理論知識將會越來越具有指導性,也將會越來越受讀者歡迎。
智能體是人工智能領域中一個很重要的概念,它是指駐留在某一環(huán)境下,能持續(xù)自主地發(fā)揮作用,具備駐留性、反應性、社會性、主動性等特征的計算實體。任何獨立的能夠思考并可以同環(huán)境交互的實體都可以抽象為智能體。
多智能體協(xié)同系統(tǒng)是指多個自主智能體通過信息交互和行為交互所構成的在時間、空間、模式和任務等多維度進行協(xié)同的智能系統(tǒng)。這類智能系統(tǒng)通常包含兩個及以上的單機,呈現(xiàn)出的整體功能、性能超過各單機之和。多機協(xié)同智能不僅拓展了單機的物理域、信息域和作業(yè)范圍,也顯著提升了單機面對復雜環(huán)境和任務的感知-執(zhí)行綜合效能。
作為沈陽航空航天大學協(xié)同無人系統(tǒng)研究室多年科學研究成果的總結,本書可以作為多智能體系統(tǒng)領域研究的入門指南,或者作為協(xié)同無人系統(tǒng)工程師的自學教材,還可以用作高年級本科生以及研究生教材。另外,本書也可以作為協(xié)同無人系統(tǒng)、無人飛行系統(tǒng)以及無人系統(tǒng)的補充閱讀材料。本書共18章,包括多智能體系統(tǒng)的協(xié)同基礎、集群控制、通信優(yōu)化、任務協(xié)同及目標追蹤五個部分,多角度覆蓋多智能體自主協(xié)同技術內容。
1)協(xié)同基礎篇,主要包括智能體概述、多無人機系統(tǒng)和目標運動建模、水下復雜任務環(huán)境建模等內容,它是后續(xù)多智能體協(xié)同技術的基礎及理論支撐。
2)集群控制篇,主要包括角度控制集群、圓環(huán)控制集群、MADDPG集群控制,以及風流對集群控制的影響等內容,是對多智能體的集群控制問題進行研究。
3)通信優(yōu)化篇,主要包括多無人機安全通信機制、引入飛行控制因子增加通信鏈路、引入虛擬洋流及自適應步長改進人工魚群算法、設計層式虛擬通信圓環(huán)及移動算法提高通信安全,如何減小不安全通信范圍并增加無人機通信鏈路等技術內容,是對多智能體的通信性能進行優(yōu)化研究。
4)任務協(xié)同篇,主要包括未知環(huán)境下的目標點搜索及路徑優(yōu)化、任務分配機制,基于距離進化N-PSO的多智能體能源優(yōu)化路徑搜尋方法,基于強化學習角度積累營救區(qū)回報值,通過尋找回報最大值得到執(zhí)行營救過程的最優(yōu)行為等技術,是對多智能體自主協(xié)同目標搜索及任務分配問題進行研究。
5)目標追蹤篇,主要包括多無人機在追蹤單目標或多目標時如何實時自適應地調整自身運動狀態(tài),如何在追蹤過程中始終保持網絡動態(tài)連通及避免碰撞,并快速跟蹤到目標等技術內容,是對多智能體協(xié)同目標追蹤問題進行研究。
本書的編寫和準備是一個漫長的過程,也是我們多年研究工作的積累與總結。非常感謝我的研究生馬堅、李丹陽、于元哲、鄒良開、王景志、宋成鑫、孫亞男、楊京輝等,他們?yōu)楸緯木帉憸蕚淞瞬牧,并參與了部分整理工作。特別感謝本書的策劃編輯李曉波老師,他對本書的每個章節(jié)都認真審閱,積極給出改進意見。
多智能體自主協(xié)同技術發(fā)展迅速,涉及領域廣泛。作者學識、時間和精力有限,書中難免存在不妥之處,若蒙讀者諸君不吝告知,將不勝感激。
吳杰宏
2024年3月
吳杰宏,沈陽航空航天大學教授,博士生導師,協(xié)同無人系統(tǒng)研究室主任。美國萊特州立大學訪問學者,遼寧省教育廳創(chuàng)新人才。主要從事多智能體協(xié)同集群、安全通信、路徑規(guī)劃、博弈決策、智能對抗及跨介質光通信路由方面的研究工作。主持國家自然科學基金、國防基礎科研等基金項目20項,一作在IEEE Transactions on Intelligent Transportation Systems、IEEE Transactions on Vehicular Technology、IEEE Transactions on Mobile Computing、Computer Networks、《計算機研究與發(fā)展》等期刊發(fā)表科研論文50余篇;第一發(fā)明人申請發(fā)明專利18項(已授權11項);獨立撰寫學術專著2部;榮獲第三屆源創(chuàng)杯創(chuàng)新創(chuàng)意大賽全國賽區(qū)二等獎1項、航空學會科技進步獎1項。
序
前言
協(xié)同基礎篇
第1章 智能體概述/
1.1智能體的范疇/
1.2多無人機控制模型/
1.2.1Reynolds模型/
1.2.2Vicsek模型/
1.2.3Couzin模型/
1.3多無人機運動模型/
1.3.1常用坐標系/
1.3.2單無人機運動模型/
1.3.3無人機間相對運動模型/
第2章 多無人機系統(tǒng)和目標運動建模/
2.1無人機系統(tǒng)模型/
2.2多無人機系統(tǒng)一致性理論/
2.3目標運動模型/
2.4目標捕獲模型/
2.5本章小結/
第3章 水下復雜任務環(huán)境建模/
3.1AUV六自由度運動模型/
3.2水下環(huán)境模型搭建/
3.2.1Lamb渦流/
3.2.2區(qū)域海洋模型系統(tǒng)洋流數(shù)據(jù)集/
3.2.3障礙物模型/
3.3水下任務分配算法/
3.3.1水下任務分配算法描述/
3.3.2水下任務分配模型/
3.4本章小結/
集群控制篇
第4章 角度控制集群/
4.1輕量級植絨運動模型/
4.2基于角度控制的移動算法/
4.2.1護航無人機移動策略/
4.2.2輕量級植絨模型求解/
4.2.3ACHF算法/
4.3ACHF算法實驗分析/
4.3.1算法參數(shù)設置/
4.3.2ACHF算法效果分析/
4.3.3ACHF算法防碰分析/
4.3.4ACHF算法護航無人機狀態(tài)分析/
4.3.5ACHF實驗數(shù)據(jù)分析/
4.4本章小結/
第5章 圓環(huán)控制集群/
5.1三層區(qū)域的植絨算法模型/
5.2基于圓環(huán)控制的移動算法/
5.2.1算法介紹/
5.2.2VRCHF算法/
5.3無人機群體分離和群體聚合策略/
5.3.1無人機群體分離策略/
5.3.2無人機群體聚合策略/
5.4VRCHF算法實驗分析/
5.4.1VRCHF算法中的實驗參數(shù)配置/
5.4.2VRCHF算法效果/
5.4.3VRCHF算法數(shù)據(jù)分析/
5.4.4無人機集群分離聚合結果分析/
5.4.5異構無人機植絨集群的必要性/
5.5本章小結/
第6章 G-MADDPG集群控制/
6.1編隊集群設計/
6.1.1子編隊/
6.1.2異構編隊集群/
6.2基于G-MADDPG的異構編隊集群控制算法/
6.3G-MADDPG實現(xiàn)/
6.3.1狀態(tài)空間和動作空間/
6.3.2獎勵函數(shù)設計/
6.4實驗結果與分析/
6.4.1子編隊實現(xiàn)與分析/
6.4.2集群實現(xiàn)與分析/
6.4.3G-MADDPG與MADDPG和DDPG的比較/
6.5本章小結/
第7章 A-MADDPG集群控制/
7.1編隊集群設計/
7.1.1子編隊/
7.1.2異構編隊集群/
7.2基于A-MADDPG的子編隊聚集控制算法/
7.2.1A-MADDPG算法描述/
7.2.2狀態(tài)空間和動作空間/
7.2.3獎勵函數(shù)設計/
7.3多子編隊聚集/
7.4實驗結果與分析/
7.4.1子編隊實現(xiàn)與分析/
7.4.2集群實現(xiàn)與分析/
7.5本章小結/
第8章 風流對集群控制的影響/
8.1風流數(shù)據(jù)/
8.1.1單一方向的風流數(shù)據(jù)/
8.1.2多方向時序風流數(shù)據(jù)/
8.2風流對無人機飛行的軌跡影響/
8.2.1風流對無人機飛行軌跡影響/
8.2.2基于無人機位置糾偏的風流糾偏方法/
8.3風流環(huán)境下糾偏軌跡的異構無人機植絨算法/
8.4實驗分析/
8.4.1單一方向風流環(huán)境下異構無人機植絨算法實驗分析/
8.4.2多方向時序風流環(huán)境下異構無人機植絨算法實驗分析/
8.5本章小結/
通信優(yōu)化篇
第9章 群聚避障通信優(yōu)化/
9.1相關技術/
9.1.1多無人機系統(tǒng)模型/
9.1.2多無人機協(xié)同控制算法/
9.1.3多無人機運動模型的構建/
9.2基于飛行控制因子的群聚算法/
9.2.1無人機飛行速度優(yōu)化方法/
9.2.2實驗分析/
9.3群聚避障算法/
9.3.1常見避障算法介紹/
9.3.2無人機飛行位置優(yōu)化方法/
9.3.3實驗分析/
9.4本章小結/
第10章 改進人工魚群通信優(yōu)化/
10.1問題描述/
10.2多無人機系統(tǒng)模型/
10.2.1無人機拓撲結構模型/
10.2.2無線通信模型/
10.2.3無人機動力學模型/
10.3改進人工魚群算法/
10.3.1多無人機通信范圍/
10.3.2自適應步長和視野/
10.3.3虛擬洋流概念/
10.3.4改進人工魚群算法/
10.4仿真實驗/
10.4.1仿真工具MATLAB簡介/
10.4.2仿真場景與結果分析/
10.5本章小結/
第11章 改進OLSR協(xié)議的通信優(yōu)化/
11.1網絡模型/
11.2MPR選擇優(yōu)先度以及搜索流程/
11.2.1MPR選擇優(yōu)先度/
11.2.2MPR搜索流程/
11.3仿真實驗與分析/
11.3.1仿真工具NS2簡介/
11.3.2仿真場景/
11.3.3仿真結果分析/
11.4多無人機安全通信策略/
11.5本章小結/
第12章 減小不安全區(qū)域通信優(yōu)化/
12.1多無人機的通信拓撲結構/
12.2減小不安全區(qū)域的安全通信策略/
12.2.1概念定義/
12.2.2層式虛擬通信圓環(huán)策略/
12.3實驗分析/
12.3.1實驗效果分析/
12.3.2性能分析/
12.4本章小結/
任務協(xié)同篇
第13章 多目標點搜索及路徑優(yōu)化/
13.1基于ACSQL的無人機目標點搜索與路徑優(yōu)化算法/
13.1.1狀態(tài)空間和動作空間的設計/
13.1.2獎勵函數(shù)的設計/
13.1.3初始化Q表/
13.1.4ACSQL算法的實現(xiàn)/
13.2子區(qū)域搜索算法/
13.3實驗驗證及效果分析/
13.3.1仿真環(huán)境的設計/
13.3.2算法分析/
13.3.3與傳統(tǒng)動作空間的對比分析/
13.3.4與其他算法對比分析/
13.4仿真環(huán)境驗證/
13.5本章小結/
第14章 協(xié)同搜索及任務分配/
14.1多無人機協(xié)同任務分配模型/
14.2基于ISOM的多無人機協(xié)同任務分配算法/
14.3注意力機制解決突發(fā)情況/
14.4實驗驗證及效果分析/
14.4.1實驗條件的設計/
14.4.2ISOM算法的測試與驗證/
14.4.3ISOM算法在復雜多任務場景下與其他算法的對比/
14.4.4ISOM算法在大任務量環(huán)境下與其他算法的對比/
14.4.5突發(fā)情況處理驗證/
14.5仿真環(huán)境驗證/
14.6本章小結/
第15章 R-RLPSO實時多營救任務分配/
15.1R-RLPSO算法描述/
15.1.1營救區(qū)與吸引營救區(qū)/
15.1.2R-RLPSO算法可行性分析/
15.1.3營救回報值c_reward/
15.2實驗結果與分析/
15.2.1R-RLPSO算法實現(xiàn)營救任務分配結果/
15.2.2c_reward實驗結果與分析/
15.2.3驗證多營救任務完成/
15.2.4R-RLPSO、ISOM、IACO算法對比分析/
15.3本章小結/
第16章 DENPSO能量優(yōu)化路徑規(guī)劃/
16.1DENPSO算法描述/
16.1.1非線性慣性權重與非線性學習因子/
16.1.2距離進化因子/
16.1.3能量評估/
16.2仿真實驗對比分析/
16.2.1DENPSO算法在三維渦流場中的能量優(yōu)化/
16.2.2DENPSO算法在區(qū)域海洋系統(tǒng)中的能量優(yōu)化/
16.2.3DENPSO算法在多AUV實時營救任務中的能量優(yōu)化/
16.3本章小結/
目標追蹤篇
第17章 切換式協(xié)同目標追蹤/
17.1切換式追蹤策略描述/
17.1.1卡爾曼一致性濾波算法/
17.1.2多無人機協(xié)同控制方程/
17.1.3追蹤策略流程/
17.2理論分析/
17.3實驗結果與分析/
17.3.1既定軌跡仿真及對比/
17.3.2逃逸仿真及對比/
17.3.3性能分析/
17.4本章小結/
第18章 局部信息交互多目標追蹤/
18.1算法描述/
18.1.1傳統(tǒng)協(xié)同控制算法/
18.1.2虛擬領導者選取/
18.1.3多無人機協(xié)同控制算法/
18.1.4算法流程/
18.2實驗結果與分析/
18.2.1分群追蹤效果/
18.2.2不同算法對比驗證/
18.3本章小結/
參考文獻/