欧美亚洲另类精品视频 ,一区三区精品在线观看

*控制是現(xiàn)代控制理論中的重要課題。近年來，隨著工程應(yīng)用的需求和人工智能的興起，在系統(tǒng)模型未知或部分未知的情況下尋求近似*控制的方法逐漸嶄露頭角。本書上冊(cè)包括*控制基礎(chǔ)和*控制的數(shù)學(xué)理論兩部分，著重介紹經(jīng)典變分法、龐特里亞金極小值原理以及動(dòng)態(tài)規(guī)劃方法；下冊(cè)側(cè)重*控制的智能方法，包括強(qiáng)化學(xué)習(xí)與自適應(yīng)動(dòng)態(tài)規(guī)劃、*控制的數(shù)值方法、模型預(yù)測(cè)控制、微分博弈以及平行控制。為了適應(yīng)智能時(shí)代的人才需求，我們?cè)谥袊茖W(xué)院大學(xué)計(jì)算機(jī)與控制學(xué)院和人工智能學(xué)院開設(shè)了包含*控制數(shù)學(xué)理論與智能方法的研究生專業(yè)課，并在課程講義的基礎(chǔ)上整理得到本書。本書上冊(cè)可作為高年級(jí)本科生或研究生的*控制課程教材，上下冊(cè)的結(jié)合可供控制論、人工智能、管理學(xué)等領(lǐng)域的學(xué)生、科研人員和專業(yè)技術(shù)人員參考。

最優(yōu)控制與最優(yōu)教學(xué)

三十多年前，最優(yōu)控制曾是我由力學(xué)轉(zhuǎn)入控制后的首選方向。記得第一個(gè)課題就是橋梁和高層

建筑的主動(dòng)減振控制，屬分布參數(shù)系統(tǒng)問題；第二個(gè)是非線性問題的次優(yōu)控制，試圖利用最小二乘

方法和勒讓德特殊函數(shù)進(jìn)行遞歸求解 Hamilton-Jacobi-Bellman（HJB）方程�？上б蚱渌芯咳蝿�(wù)

最后都沒持續(xù)下去，成為心中至今的遺憾。喜歡最優(yōu)控制的一個(gè)重要原因是大學(xué)和碩士期間著迷于

變分法、力學(xué)和物理中各種各樣的變分原理、泛函分析及其在希爾伯特空間的幾何表示方式。我一

直希望能利用泛函從代數(shù)幾何空間的角度去解釋最優(yōu)控制，并進(jìn)而在流形上近似求解各種非線性最

優(yōu)控制問題。

赴美留學(xué)之后，研究方向立刻轉(zhuǎn)入以人工智能為基礎(chǔ)和以智能機(jī)器人系統(tǒng)為對(duì)象的智能控制。1986年，上導(dǎo)師 George N.Saridis教授的自組織系統(tǒng)之隨機(jī)控制（Stochastic Control of Self-organizing Systems）課時(shí)，一度曾有機(jī)會(huì)回頭從事最優(yōu)控制的研究，但由于對(duì)于如何利用熵（entropy）表示與導(dǎo)師有嚴(yán)重的分歧，一番爭(zhēng)吵之后，最后少果而終，僅留下一篇會(huì)議論文和一篇雜志論文 1。有幸的是，這讓我有機(jī)會(huì)獨(dú)立地提出了早期自適應(yīng)動(dòng)態(tài)規(guī)劃（ adaptive dynamic

programming，ADP，最初稱為 approximate dynamic programming）的思想。更可喜的是，今天，

以劉德榮教授和魏慶來研究員為代表的復(fù)雜系統(tǒng)管理與控制國家重點(diǎn)實(shí)驗(yàn)室團(tuán)隊(duì)在此領(lǐng)域碩果累

累，已成為國際上研究 ADP的先鋒與重鎮(zhèn)。

其實(shí)，至今我仍認(rèn)為熵表示可能是統(tǒng)一各種最優(yōu)控制方法，特別是將自適應(yīng)和預(yù)測(cè)控制統(tǒng)一起

來的可行途徑，甚至更廣泛的平行控制也可以納入熵表示的框架之中。特別是跟隨副導(dǎo)師 Robert

F. McNaughton教授上完自動(dòng)機(jī)、形式語言和理論計(jì)算機(jī)課程之后，更感到控制熵與信息熵、計(jì)算復(fù)雜性之間有著深刻的內(nèi)在關(guān)聯(lián)，再加上學(xué)習(xí)控制和機(jī)器學(xué)習(xí)（當(dāng)時(shí)稱為學(xué)習(xí)機(jī)器，learning

1關(guān)于爭(zhēng)吵的部分描述見 2001年出版的 Modeling Uncertainty: An Examination of Stochastic Theory, Methods, and Applications第 16章最后一節(jié)。會(huì)議論文之后于 1992年發(fā)表于圖森召開的 IEEE控制與決策會(huì)議，題為 Suboptimal Control for Nonlinear Stochastic Systems。雜志論文于 1994年發(fā)表于 Control Theory and Advanced Technology第 10卷第 4期，題為 Suboptimal Control of Nonlinear Stochastic Systems。

machines）方法，或許能夠創(chuàng)出一條從最優(yōu)控制的數(shù)學(xué)理論到最優(yōu)控制的智能方法之新路 2。這三十余年來未熄的夢(mèng)想，就是驅(qū)動(dòng)創(chuàng)作本書的原始動(dòng)機(jī)。

當(dāng)然，本書的寫作還有一個(gè)十分顯然的現(xiàn)實(shí)動(dòng)機(jī)。近十年來，周圍愿以控制理論和控制工程專業(yè)為第一選擇的學(xué)生相對(duì)大大減少，學(xué)生們都希望轉(zhuǎn)入其他以算法為主更時(shí)興、見效更快的專業(yè)。相對(duì)而言，控制付出大，回報(bào)卻不見得大。然而，控制是硬科技，更是智能技術(shù)中的硬智能。沒有過硬的控制，許多想法和算法無法落地。而且，最優(yōu)控制是控制之中的硬課程，是硬中之硬。正如國家與社會(huì)的發(fā)展不能只發(fā)展虛擬經(jīng)濟(jì)，必須有強(qiáng)硬的實(shí)體經(jīng)濟(jì)支撐，技術(shù)的健康發(fā)展，一定也不可忽略控制技術(shù)，必須有高質(zhì)量的人才不斷加入控制技術(shù)的研究與開發(fā)之中才可持續(xù)。因此，一部與時(shí)代技術(shù)和應(yīng)用要求合拍的最優(yōu)控制教程，是吸引更多優(yōu)秀學(xué)生從事控制專業(yè)的重要一步，這就是本書寫作的現(xiàn)實(shí)動(dòng)機(jī)。

因此， 2015年秋，我答應(yīng)承擔(dān)起中國科學(xué)院大學(xué)（以下簡稱國科大）計(jì)算機(jī)與控制學(xué)院的

最優(yōu)控制研究生教學(xué)任務(wù)，并籌劃寫一本新的最優(yōu)控制教材。最初有兩個(gè)計(jì)劃，一是按以學(xué)習(xí)者為中心的教育（learner-centered education，LCE，其中老師和學(xué)生都是學(xué)習(xí)者）之思想教學(xué)，并按照教學(xué)三境界方式安排教學(xué)內(nèi)容和進(jìn)度；二是變編年體式的教科書為紀(jì)傳體的教材，就像《史記》開創(chuàng)中國史書的撰寫新方式，希望使最優(yōu)控制這門課的課本盡量生動(dòng)有趣，與時(shí)代相宜。

所謂教學(xué)三境界是仿王國維關(guān)于詞之三層境界之說，讓教學(xué)也有三階段或三境界：

）開始：滴水見大海， See the whole ocean from a drop of water。用開始的幾堂課，把最優(yōu)控制的核心問題、主要概念和關(guān)鍵方法以最簡單的例子講清楚。目的就是帶學(xué)生登頂看城，讓學(xué)生有一個(gè)整體觀。

）過程：借用蘇軾的《題西林壁》，橫看成嶺側(cè)成峰，遠(yuǎn)近高低各不同。不識(shí)廬山真面目，只緣身在此山中。Difficulty and confused, but not lost, still know where you are and enjoy.滴水階段之后，根據(jù)學(xué)生水平和興趣及教學(xué)要求，放開地去講，但不斷地與滴水的內(nèi)容回連和關(guān)聯(lián)。學(xué)生可以不懂，但必須知道懂了什么、不知什么，內(nèi)容的意義或意味著什么。這就如同帶領(lǐng)學(xué)生手機(jī)地圖探城，大街小巷任游。

）結(jié)局：借用杜甫的《望岳》，蕩胸生層云，決眥入歸鳥。會(huì)當(dāng)凌絕頂，一覽眾山小。 In the end you feel like an expert in Optimal Control：Be there，done that，and so what!課的后期，以一個(gè)綜合的題目或項(xiàng)目，把滴水階段的問題、概念、方法再回頭以廬山階段學(xué)到的手段一網(wǎng)打盡，讓學(xué)生從心理上感覺到自己了解掌握了最優(yōu)控制的精髓，上升到泰山境地，今后可以

2見 1989年王飛躍在 NASA/RPI空間探索智能機(jī)器人系統(tǒng)中心提交的題為 Information-based Complexity and Its Application in Intelligent Machines的工作報(bào)告。

有信心地使用或補(bǔ)習(xí)最優(yōu)控制的方法和技術(shù)。這就像游城之后，讓學(xué)生講述經(jīng)歷和體會(huì)，讓他們有這座城市我去過，是一個(gè)活生生的地方，消除心理障礙，不再抽象神秘了。

這是我在美教授二十年機(jī)器人與自動(dòng)化（Robotics and Automation）課程的實(shí)踐與經(jīng)驗(yàn)的總結(jié)，曾獲得很好的效果，使學(xué)生對(duì)內(nèi)容的理解從原來大約 20%的程度提高到差不多 70%3。最優(yōu)控制差不多是控制課程中最難的，我希望以三境界的方法教授國科大的最優(yōu)控制。

新型教材的撰寫更是自己很久以來的想法。讀過許多領(lǐng)域的專業(yè)著作，多數(shù)初讀時(shí)的感覺很難擺脫枯燥無味四字，往往對(duì)書中一些內(nèi)容不知為什么、干什么，更不知誰提出來了，當(dāng)時(shí)的情景與動(dòng)機(jī)是什么。沒有歷史感，更無發(fā)展感。每當(dāng)此時(shí)，我就想起小時(shí)看過的文革之前的一些中小學(xué)課本：物理課本介紹牛頓定律時(shí)有牛頓的頭像和簡介，化學(xué)課本介紹元素周期表時(shí)有門捷列夫的畫像和故事，似乎自己就是因此才養(yǎng)成喜歡讀書的習(xí)慣。

一次，讀《史記》紀(jì)傳體形成過程研究的論文，深嘆司馬遷納百家眾體，創(chuàng)新出以紀(jì)傳體為中心，五體相依，體系嚴(yán)密的新史體，以致百代而下，史官不能易其法，學(xué)者不能舍其書，從此

《春秋》《左傳》《國語》等編年體史書不再主流，而紀(jì)傳體不斷發(fā)展延至今日。個(gè)人認(rèn)為，今天絕大多數(shù)的專業(yè)著作和教科書之寫作方式仍屬知識(shí)的編年體，太注重知識(shí)本身之用，卻忘了是誰去學(xué)誰去用。我們應(yīng)該學(xué)習(xí)司馬遷，重視專業(yè)知識(shí)之前、之中、之后的人，就是學(xué)習(xí)者和應(yīng)用者，用知識(shí)描述的紀(jì)傳體方式來創(chuàng)作專著和教科書，讓人在其中，故事穿之，使死知識(shí)變活知識(shí)，生動(dòng)有趣，讓 LCE以學(xué)習(xí)者為中心的教育和教學(xué)不再是口號(hào)和空話。由于時(shí)間的原因，本書的寫作，只是沿此方向的一個(gè)十分初步的嘗試，希望將來有機(jī)會(huì)結(jié)合 wiki、微信和網(wǎng)絡(luò)化、可視化等技術(shù)深入系統(tǒng)地研究紀(jì)傳體的教科書和學(xué)術(shù)著作應(yīng)如何撰寫4。

由于肩負(fù)其他科研任務(wù)，我無法以個(gè)人之力完成最優(yōu)控制的教學(xué)和教材寫作任務(wù)。這些任務(wù)的完成，特別是本書寫作，張杰博士是最主要的貢獻(xiàn)者。張杰大學(xué)在清華大學(xué)讀數(shù)學(xué)，碩士在人民大學(xué)攻經(jīng)濟(jì)，博士期間才開始在中科院自動(dòng)化所與我一起從事社會(huì)計(jì)算、計(jì)算經(jīng)濟(jì)，特別是博弈論方面的研究工作。我一直希望張杰能以閉環(huán)實(shí)時(shí)反饋的思路在平行經(jīng)濟(jì)，特別是平行博弈方向有所建樹，所以要求他再回頭補(bǔ)足一些控制的核心知識(shí)。因此，博士一畢業(yè)，就安排他與我一起教授

最優(yōu)控制，并承擔(dān)了大部分的教學(xué)和教材工作。兩年多來，我?guī)缀踔皇莿?dòng)口并反復(fù)無常地提出了許多幾近苛刻的要求，張杰博士總是全力以赴，而且給了我許多事先沒有想到的驚喜。我堅(jiān)信，張杰博士一定會(huì)獨(dú)立成為最優(yōu)控制這門課的一位非常優(yōu)秀的教師。

3見王飛躍科學(xué)網(wǎng)博客：《關(guān)于機(jī)器人課教學(xué)的三境界實(shí)踐簡憶》，http://blog.sciencenet.cn/blog-2374-860504.html。 4更多關(guān)于教學(xué)的想法，請(qǐng)見王飛躍科學(xué)網(wǎng)博客：《我的教學(xué)夢(mèng)》，http://blog.sciencenet.cn/blog-2374-6431.html；以及《將來如何教學(xué)生？》，http://blog.sciencenet.cn/blog-2374-341680.html。

2015年最優(yōu)控制課后部分師生交流合影，就座二人為授課教師，本書作者王飛躍、張杰（摘自 2015年國科大最優(yōu)控制課程紀(jì)念冊(cè)）

第一年（ 2015年）教授最優(yōu)控制時(shí)，我還請(qǐng)了北京交通大學(xué)的侯忠生教授，講授數(shù)據(jù)驅(qū)動(dòng)的控制方法；我們實(shí)驗(yàn)室的魏慶來研究員，講授自適應(yīng)動(dòng)態(tài)規(guī)劃方法。第二年（ 2016年）上課時(shí)，邀請(qǐng)了國科大的王立新教授講授模糊邏輯和模糊控制，以及美國印第安納大學(xué) -普渡大學(xué)的李靈犀教授講授強(qiáng)化學(xué)習(xí)方法。在張杰博士的精心協(xié)調(diào)和安排之下，講課效果之佳完全超出我的預(yù)想，學(xué)期結(jié)束時(shí)得到了許多同學(xué)積極正面的反饋，摘錄如下：

教學(xué)三境界第一次接觸到這般教學(xué)思想，從整體到局部，再從局部回歸整體。如今課程結(jié)束，那些知識(shí)卻深深地印在腦海之中。

幾位老師給我們描繪了一幅控制的完美歷史畫卷，張老師說他喜歡這種歷史的厚重感，敢問又有哪位同學(xué)能不被這么美妙的歷史所吸引。在這種強(qiáng)烈的興趣下我也相信每位同學(xué)都愿意深入這門課程去探索科學(xué)的真諦。

最優(yōu)控制理論是我十幾年的求學(xué)過程中上過的最優(yōu)質(zhì)的課程。課程內(nèi)容既扎根本質(zhì)又放眼前沿，高大上的微信公眾平臺(tái)也讓我得以隨時(shí)了解課堂信息，全面、客觀的考核方式更是讓我真正做到了平時(shí)努力學(xué)，考試輕松過。

在懷柔國科大，有幸能上最優(yōu)控制理論這門課，遇到那么棒的老師，認(rèn)識(shí)一群那么棒的同學(xué)，是我這輩子，學(xué)生時(shí)代，最美好的回憶！

國科大最優(yōu)控制2015年授課教師，左上為中科院自動(dòng)化所王飛躍教授，左下為北京交通大學(xué)侯忠生教授，右上為中科院自動(dòng)化所張杰副研究員，右下為中科院自動(dòng)化所魏慶來研究員（摘自 2015年國科大最優(yōu)控制課程紀(jì)念冊(cè)）

特別令我高興的是，第一年結(jié)束時(shí)，我還得到一本由最優(yōu)控制課程的教學(xué)照片和評(píng)語制作成的紀(jì)念冊(cè)，不但精美，而且難忘。這不但讓我感到自己所費(fèi)心血值得，也再次讓我想起物理學(xué)大師 John Wheeler的話：大學(xué)里為什么要有學(xué)生？那是因?yàn)槔蠋熡胁欢臇|西，需要學(xué)生來幫助解答。

國科大最優(yōu)控制2016年部分授課教師，左圖為國科大王立新教授，右圖為印第安納大學(xué) -普渡大學(xué)李靈犀教授

2016年最優(yōu)控制課后師生共游國科大后山雁棲湖，左三、左五、左六分別為本課教師張杰、王飛躍、王立新

回國后能有這樣一次令人難忘的教學(xué)經(jīng)歷，十分難得，為此我必須感謝上課的兩百余名同學(xué)和五名教授團(tuán)隊(duì)，特別是付出最大努力的張杰博士。然而，這離我最初希望以教學(xué)三境界為支撐，以平行課堂和平行教育的方式進(jìn)行最優(yōu)控制教學(xué)的設(shè)想還有很大一段距離�？上驳氖�，兩年來的教學(xué)實(shí)踐和教材撰寫已為下一步的智能化平行教學(xué)奠定了一個(gè)良好的基礎(chǔ)。衷心希望這本教材所開始的新教學(xué)理念，能在同學(xué)的幫助之下得到深入地發(fā)展和鞏固，使本書的下冊(cè)《最優(yōu)控制智能方法》更加完善和成功，也為教學(xué)改革做一次有益且有效的努力。

《最優(yōu)控制數(shù)學(xué)理論與智能方法》（上冊(cè)）是一次教學(xué)和教材的改革嘗試，一定存在許多不足之處，作為主導(dǎo)和組織者，對(duì)此我必須承擔(dān)全部責(zé)任。在此，我十分感謝王雨桐、白天翔、曾帥博士、張曉磊、顧穎城、王曉博士、高琳等幫助此課的同事和同學(xué)。希望本書面世后能夠得到相關(guān)專家和一線師生的批評(píng)指正，以便今后改正和改進(jìn)，在此表示衷心的感謝。

2017年夏末于北京靜安園中國科學(xué)院自動(dòng)化研究所復(fù)雜系統(tǒng)管理與控制國家重點(diǎn)實(shí)驗(yàn)室中國國防科技大學(xué)軍事計(jì)算實(shí)驗(yàn)與平行系統(tǒng)技術(shù)研究中心

你還可能感興趣

我要評(píng)論