深度強化學習理論的提出為機器人控制中的動力學模型建立、環(huán)境狀態(tài)信息感知等問題提供了豐富的解決思路。本書在現(xiàn)有的深度強化學習算法基礎上,針對機器人控制中的機器人姿態(tài)平衡控制、機器人持物平衡控制、機器人抓取控制3個方面的問題展開研究,為基于深度強化學習的機器人控制問題提供一定的理論指導和技術支撐。
姚世選,男,1976年5月出生,工學博士,副教授,研究生導師,兼大連理工計算機控制工程有限公司總工程師,全國工業(yè)過程測量控制和自動化標準化技術委員會可編程序控制器分技術委員會(SAC/TC124/SC5)委員。主要從事工業(yè)互聯(lián)網、智能控制、運動控制和機器人控制等技術方面研究,負責國家科技支撐計劃課題"面向電子制造裝備的可編程運動控制器研發(fā)與應用(2015BAF20B02)”1項、國家科工局項目"復合材料旋翼加工數(shù)控系統(tǒng)設計與軟件開發(fā)”1項和企業(yè)委托項目多項。負責了國家科技支撐計劃項目"面向電子制造裝備的關鍵技術開發(fā)與應用示范(2015BAF20B00)”的項目整合、申報書編寫和項目答辯等工作。取得發(fā)明專利6項,實用新型2項,軟件著作權5項,發(fā)表學術論文11篇,參與編寫國家標準3項,審核國家標準多項。
目錄