前言
博弈論的思想在古代便產(chǎn)生了,只是它在初期僅研究象棋、賭博中的一些勝負問題,并未形成專業(yè)的理論系統(tǒng)。當(dāng)時的人們對于博弈的認識只停留在經(jīng)驗的認知和積累上,并未形成專業(yè)的理論基礎(chǔ),正式成為一門學(xué)科則是在20世紀初期。
20世紀20年代末期,約翰·馮·諾依曼正式證明了博弈的基礎(chǔ)原理,在此基礎(chǔ)上宣告博弈論誕生,因此,馮·諾依曼被稱為“博弈論之父”。再到20世紀40年代中期,一本跨越時代的巨著《博弈論與經(jīng)濟行為》問世,而作者正是馮·諾依曼和摩根斯坦。這兩位卓越的數(shù)學(xué)家經(jīng)過不斷研究,最終將最初的二人博弈理論推廣到了n人博弈理論,還將博弈論成功應(yīng)用到經(jīng)濟領(lǐng)域,他們奠定了博弈論的基礎(chǔ)和理論體系。
“假設(shè)現(xiàn)在有人能夠讓博弈行為接近野蠻,或者讓人類之間的友善行為和兇殘行為之間的差距無限大,那么誰就更容易在博弈中取勝!边@是《博弈圣經(jīng)》中提到的一段話。
提起博弈論,便需要說起“孤獨的天才”——約翰·納什,他更是博弈論的天才。約翰·納什在20世紀中期正式發(fā)表了一篇論文——《n人博弈的均衡點》,對博弈論起到了良好的推動作用。除此之外,哈桑尼與賽爾頓對博弈論的研究和貢獻,也為博弈論的發(fā)展起到了催化作用。再到《博弈圣經(jīng)》問世,它與原有的博弈論有著極大的區(qū)別,最大的差異在于《博弈圣經(jīng)》中論述了博弈的文化理論,突出表現(xiàn)了人類博弈占據(jù)的優(yōu)勢。
事實上,《博弈圣經(jīng)》最大的優(yōu)點是,它能夠?qū)⒃械牟┺睦碚撜綉?yīng)用到現(xiàn)實中,還能幫助普通大眾通過自身的學(xué)習(xí)和研究成為博弈的真正高手。它還能將博弈論應(yīng)用到政治、經(jīng)濟、文化等多個領(lǐng)域,對于個人的生活和發(fā)展也能起到促進和推動作用。
簡單來說,博弈的基本構(gòu)成要素分為決策人、對抗者、生物親序、局中人、策略、得失、次序。所謂決策人,指的是在博弈的賽局中率先做出選擇的一方,決策人往往會根據(jù)自己的經(jīng)驗、自身在對局中的感受、自身的狀態(tài)等,率先做出一種具有方向性的選擇。
在二人博弈對局中的對抗者,往往是選擇滯后的那個人,需要做出與決策人的行為相反的選擇,而且這個對抗者不僅選擇落后,連行為與動作也是落后的,而且他的選擇幾乎是默認的、被動的,但是這將成為他最后的優(yōu)勢。簡單說,他所做的選擇極有可能是基于決策者選擇中的劣勢而做出的,由此一來,便具有了空間優(yōu)勢,這樣看來對抗者便成了二人博弈中占優(yōu)的一方。
所謂生物親序,從字面理解,就是生物會主動尋找有序的一種親近行為。由于自然界的所有生物,當(dāng)它們處在陌生、惡劣、未知環(huán)境中時,它們會發(fā)揮出主動尋找規(guī)律和有序環(huán)境的本能。同理,在博弈對局中,所有的參與者都會自發(fā)地產(chǎn)生尋找或者等待有序的親近行為。
我們知道一場競賽會由參與者組成,而在博弈中,這些有決策權(quán)力的參與者,則被稱為博弈賽局中的一個局中人;若在博弈中有兩個局中人,那么便稱為“兩人博弈”;若在博弈中有多個局中人,則稱為“多人博弈”。
當(dāng)我們參加較為正規(guī)的比賽時,在遵守規(guī)則的前提下,還會為自己制訂一定的計劃或者策略,幫助自己取勝,博弈亦是如此。在一場博弈賽局中,任意一個局中人都會制訂自己在實際情況中所要施行的計劃或者策略,簡單來說,局中人的方案與計劃并不只是針對某一個階段,而是針對整個對局過程,即任何一個局中人的能夠貫穿整個賽局的可行計劃被稱為一個局中人的策略。假設(shè)在一個博弈賽局中,局中人的策略是有限的,便稱其為“有限博弈”,相反則稱為“無限博弈”。
在博弈賽局中,結(jié)果無非勝負兩種,這種結(jié)果便是博弈中的得失。任何一個局中人在博弈中的最終得失,都與局中人的決策密切相關(guān),甚至還與全局中的人所做出的一組決策密不可分。因此,每場博弈中的局中人的最終得失,都由全部的局中人做出的一組策略的函數(shù)決定,這組函數(shù)便是通常意義上的支付函數(shù)。
比賽次序有先后,博弈策略亦是如此。博弈中的決策方在一個賽局中需要做出多次決策,此時便會出現(xiàn)決策的次序問題。在此過程中,只有決策的次序是不同的,但是其他要素是相同的,而最后出現(xiàn)的是不同的博弈結(jié)果。
根據(jù)不同的標準產(chǎn)生了不同的博弈種類。我們可以將其大致分為兩類,即通常意義上的合作博弈和非合作博弈。二者的最大差別在于參與博弈的人并沒有達成一個相對具有約束力的協(xié)議。假設(shè)有協(xié)議可以參照,便是“合作博弈”;反之,則是“非合作博弈”。
若以時間順序為基準,博弈論可以分為兩類:靜態(tài)博弈和動態(tài)博弈。前者是指在博弈中,所有的參與者共同選擇或者非同時做出選擇,但是所有的后參與者對此并不知情,即后參與者不知道最初的參與者做出了怎樣的決策和實際行動。后者是指在博弈中,所有的參與者采取的具體行動有先后之分,而且后來加入的參與者能夠非常清晰地看到前面的參與者的具體行動。
簡言之,“囚徒困境”屬于靜態(tài)博弈,而棋牌類的博弈,或者那些行動、決策有先后的博弈則是“動態(tài)博弈”。事實上,博弈論根據(jù)不同的基準還有不同的分類,在此列舉較為基礎(chǔ)的幾種。本書《博弈論》將帶領(lǐng)讀者走進博弈的賽局中,開始一場特殊的“博弈”之旅。
譯者序
策略博弈論,我們通常將它稱為博弈論,有些時候也會用“競賽論”或者“對策論”來表示。但是,只有博弈論更符合原意,因為它能夠更好地表達出此理論所要探究的基本概念和相關(guān)問題,同時,它是在最近十幾年間逐漸發(fā)展起來的,還是運籌學(xué)的主要組成部分,本書是博理博弈論的經(jīng)典著作。
約翰·馮·諾依曼的這本思想史上的經(jīng)典之作已經(jīng)問世20年之久。本書《博弈論》不僅是成千上萬讀者的審美享受,還支撐著約翰·馮·諾依曼之后的研究者。與此同時,《博弈論》還直接推動了個人概率、統(tǒng)計決策、運籌學(xué)等諸多問題的研究進程。實際上,這本經(jīng)典著作在各個領(lǐng)域都產(chǎn)生了一定的影響。
為了讓讀者能夠更加直觀地看到博弈中的邏輯推理,馮·諾依曼先構(gòu)造出一個概念,其包含了所有參與者的策略選擇。通俗意義上說,一個參與者的一個策略選擇就是一套簡單的行動法則,同時是提供給這個參與者所有可能情況下的行動指導(dǎo)。假設(shè)任意一名參與者需要遵循給定的各種策略,那么博弈的整個過程可以說是已知的,顯而易見所有參與博弈的人在博弈結(jié)束時,能夠獲得的收益其實是確定的。
按照作者約翰·馮·諾依曼的觀點,博弈論的方法是最適合研究經(jīng)濟方面的問題的數(shù)學(xué)方法。盡管博弈論的提出沒有能夠幫助作者完成解決經(jīng)濟問題的任務(wù),但這一數(shù)學(xué)理論的提出與建立仍然是具有里程碑意義的。因為博弈論研究的是斗爭,因此,在無數(shù)的斗爭場景中,都有可能通過使用博弈論來解決相關(guān)的技術(shù)問題。例如人對自然財富的索取,人對自然災(zāi)害的抵抗,人對于未知領(lǐng)域的探索,以及軍事上的斗爭,等等。博弈論可以使人們在有限的條件和既定的要求下,從繁多的數(shù)量關(guān)系里尋找出最適宜、最高效的解決方案。
約翰·馮·諾依曼創(chuàng)作《博弈論》的初衷是推動經(jīng)濟學(xué)理論的革命,但是它在很長一段時間內(nèi)沒有完成這個偉大的目標。不過,在它的影響下,人們發(fā)起了對整個時代經(jīng)濟學(xué)理論的質(zhì)疑。從這一方面來看,《博弈論》確實是天才之作,因此它必將被世人永遠銘記。
經(jīng)濟學(xué)在未來是什么樣子的?這在《博弈論》中已經(jīng)予以回答。它必將是充滿數(shù)學(xué)符號的。對不少人來說,《博弈論》更像一部希臘文著作,只有當(dāng)我們理解它超過理解一種文化時,我們才能真正讀懂它;蛘,如果說《博弈論》是貝多芬的一部樂曲,那么還需要懂樂譜的人才能理解它。對于音盲來說,再好的音樂也無異于噪音。《博弈論》中最好的工具是數(shù)學(xué),如果有人對數(shù)學(xué)一無所知,那么他很難進入現(xiàn)代科學(xué)的大門,或邁入現(xiàn)代哲學(xué)的世界,這無疑是令人遺憾的。數(shù)學(xué)不同于街頭俗論,它關(guān)系著許多方面的思維能力。一般來說,擁有數(shù)學(xué)潛力的孩子往往具有更好的語言和邏輯能力。
能否理解博弈論可以作為衡量21世紀文化人的標準。約翰·馮·諾依曼在《博弈論》中對多人博弈和個體最大化問題進行了區(qū)分,并指出了兩者的主要差異。例如,研究一個典型的最大化問題:如何用周長1英里的籬笆圍出最大的面積?對于這個問題,我們只需要利用代數(shù)或微積分知識便可給出答案。若縮小范圍,只允許在三角形中做選擇,那么等邊三角形要比其他三角形更優(yōu);若只允許在四邊形中做選擇,那么正方形是最佳的答案。若在所有正多邊形中做選擇,那么邊數(shù)越多越接近最優(yōu)解。而如果沒有邊數(shù)限制,用周長1英里的籬笆圍出最大的面積,圓形無疑是最佳選擇。
而在多人博弈中,比如當(dāng)兩個理性頭腦為了一個目標而產(chǎn)生沖突的時候,最終的答案總是會同時依賴于兩者的決定,所以這時的形勢與個人最大化問題的形勢便不再相同。兩個人一起玩井字棋時,如果甲方先行,且行棋方式完全正確,那么乙方將永遠無法擊敗他;同樣,若乙方先行,且行棋方式完全正確,那么甲方也永遠無法擊敗他。這種博弈的方式是隨機的,它的解也是隨機的。
如果兩個人一起玩向圓桌上放硬幣的游戲:雙方輪流向桌子上放硬幣,率先放不下硬幣的人就算失敗。在這個博弈中,若A是先行者,他便可以用這樣的策略獲勝,即首先將一枚硬幣放在桌子的正中央,接著每當(dāng)對方放下一枚硬幣,就在與之對稱的位置上放上一枚硬幣,這樣一來,他便永遠不會輸。所以誰后放誰就會輸。這是一個完美的信息博弈,只要知道誰先誰后就能知道誰贏誰輸。
同樣,象棋也是一個完美信息博弈,它與上面兩種博弈一樣簡單。若兩個計算能力完美的人一起下象棋,那么只會有三種可能:一是先行者必勝,二是后行者必勝,三是平局。初看之下,我們并不知道最終的結(jié)局究竟屬于哪一個,但只要我們反向推導(dǎo),就能推算出這一博弈結(jié)局與開始信息的關(guān)系。象棋的這種簡單屬性可由博弈論予以證明。
在大多數(shù)人看來,猜硬幣與下象棋一樣都是簡單的博弈。但實際上,猜硬幣并非人們想象的那樣簡單。如果一個人要想與另一個人保持一樣,他就會在對方選擇正面時跟著選擇正面,在對方選擇背面時跟著選擇背面。但是,如果他一開始就知道對方準備選擇正面,好勝心就會驅(qū)使他去選擇背面,而若對方選擇的是背面,他就會毅然選擇正面。這就形成了一個無法跳出的循環(huán)。
約翰·馮·諾依曼在處理這個無限循環(huán)問題時表現(xiàn)出了自己的天賦。在他看來,不讓別人知道你的秘密的前提是,你自己也不知道;在投擲硬幣的時候,你只需要以正反面來決定你的行動,這樣一來,在這個隨意策略中,即使你的對手始終保持著理性,并能提前知曉你的策略,他也不可能以超過半數(shù)的概率戰(zhàn)勝你。
約翰·馮·諾依曼給我們呈現(xiàn)的是一個二人零和博弈。他用這個經(jīng)典的博弈向我們證明了他的理論:參與這個零和博弈的人都試圖使自己的利益最大化,于是他們都想盡可能地使對方的利益最小化,因為只有這樣才能最大化自己的利益。
要判斷一條鐵鏈的強度,我們首先要知道它最弱的一環(huán),要判斷一個木桶能盛多少水,首先要知道它的短板在哪里。在最壞的情況下,最可能獲得的收益取決于最脆弱的一點。這個時候,參與者只需采用一種隨機策略,就能在最壞的情況下最大化自己的收益。這一意義深遠的定理可以在撲克牌游戲中顯露其冰山一角:我們在玩撲克牌時常常會見到虛張聲勢的對手,甚至我們自己有時為了贏得最后的勝利,也會采取虛張聲勢的策略。我們發(fā)現(xiàn)一旦有人虛張聲勢就意味著他可能有一手差牌,而那些不動聲色的人則很可能拿到一手好牌。如果你的對手為了最大化自己的收益采取了隨機策略,那么你在面對這樣的對手時有一個最優(yōu)的虛張聲勢率可以確保使你的利益最大化。這種情況也出現(xiàn)在考試中,一個老師在為學(xué)生出考試題時會隨機從教科書中抽取內(nèi)容,這樣一來,學(xué)生就需要復(fù)習(xí)整本教科書才能保證自己考到最優(yōu)的分數(shù)。
除了簡單的兩人零和博弈外,其他博弈中的理論更加復(fù)雜,也更加具有不確定性。比如,賽馬、股票交易、國際談判等多參與者形式的博弈會存在更多的可能性;蛟S博弈論會給我們的生活帶來許多助益,但是是否有人愿意用博弈論來決定自己孩子的未來呢?比如,一場手術(shù)可能讓你生病的孩子完全治愈,也可能使他出現(xiàn)生命危險。這個時候,你是否還會以博弈論來給出最終的判斷呢?對于這樣的問題,人們可能會永久地爭論下去,因為它直到現(xiàn)在仍沒有答案;蛟S有人會說這是個哲學(xué)問題,所以不能用數(shù)學(xué)來予以解決。但是,在博弈論面前,如果你沒有規(guī)劃和尺度,你甚至無法成為它的觀眾。
《博弈論》一書既包含了博弈數(shù)學(xué)理論的細致說明,又包含了該理論多方面的應(yīng)用與實踐。博弈數(shù)學(xué)理論于1928年開始發(fā)展和出版,它主要應(yīng)用于博弈本身以及經(jīng)濟學(xué)和社會學(xué)問題。約翰·馮·諾依曼也希望用數(shù)學(xué)方法來研究這些問題。
如果想要應(yīng)用博弈論,我們至少要在所研究的簡單博弈中印證這個理論,隨著約翰·馮·諾依曼研究的深入,其中的相互關(guān)系表現(xiàn)得愈加明顯。不過,對約翰·馮·諾依曼來說,博弈論的最終歸宿應(yīng)該在經(jīng)濟學(xué)和社會學(xué)上。他從一些簡單博弈問題深入淺出地闡述了這個理論,盡管這些問題不如實際問題復(fù)雜,但它們都具有根本性和代表性,利用它們可以進一步證明:不管是平行利益問題和相反利益問題、完全信息問題和不完全信息問題,還是自由合理的決定、機會影響問題,等等,都能夠用一個精確的方法來加以解決。