精華熱點(diǎn) 博弈論之納什均衡
原創(chuàng) 竹園李 博弈論原理
納什均衡概念是指在一個(gè)博弈中,每個(gè)決策參與人通過選擇最優(yōu)策略來達(dá)到自身最大利益的可能性,最終整個(gè)博弈達(dá)到的穩(wěn)定狀態(tài)。
納什均衡的定義及起源
納什均衡,又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語,以約翰·納什命名,由約翰·納什(John Nash)在1951年提出的,后來也因此獲得了1994年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
納什均衡通俗地說是指在多人的"非合作博弈"中,如果每個(gè)參與人都無法單方面(在其他參與人都不改變策略的情況下,自己改變策略)改善自己的境地,此時(shí)的局面稱作"納什均衡"。馮·諾伊曼在《博弈論與經(jīng)濟(jì)行為》一書中證明了:零和博弈必定存在這樣的均衡點(diǎn)。納什的貢獻(xiàn)在于他從"零和博弈"推廣到"非零和博弈",并證明了這樣的均衡點(diǎn)依然存在。
納什均衡是博弈最終達(dá)到的一種穩(wěn)定狀態(tài),即:在包含兩個(gè)或以上參與者的非合作博弈(Non-cooperative game)中,假設(shè)每個(gè)參與者都知道其他參與者的均衡策略的情況下,沒有參與者可以透過改變自身策略使自身受益時(shí)的一個(gè)概念解。納什均衡是所有參與人的最優(yōu)策略組合,在這一組合中,沒有任何人有積極性改變自己的選擇。
納什均衡又分為:純策略的納什均衡、混合策略的納什均衡。純策略納什均衡是混合策略納什均衡的退化,是混合策略納什均衡的一種特例。如果一個(gè)博弈中不存在純策略的納什均衡,那么該博弈中一定存在一個(gè)混合策略的納什均衡。
納什均衡在博弈中出現(xiàn)的次數(shù)基本為奇數(shù)個(gè)(有數(shù)學(xué)證明),即:1個(gè)、3個(gè)、5個(gè)...,博弈最終結(jié)果會(huì)是出現(xiàn)的納什均衡中的某個(gè)(存在多個(gè)納什均衡時(shí),出現(xiàn)的那個(gè)被稱為謝林點(diǎn))或者某些。
納什均衡的意義
關(guān)于納什均衡的普遍意義和存在性定理的證明等奠定非合作博弈理論發(fā)展基礎(chǔ)的重要成果,是約翰·納什在普林斯頓大學(xué)攻讀博士學(xué)位時(shí)完成的。實(shí)際上,博弈論的研究起始于1944年馮·諾依曼(Von Neumann)和奧斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈論和經(jīng)濟(jì)行為》。然而卻是納什首先用嚴(yán)密的數(shù)學(xué)語言和簡明的文字準(zhǔn)確地定義了納什均衡這個(gè)概念,并在包含"混合策略(mixed strategies)"的情況下,證明了納什均衡在n人有限博弈中的普遍存在性,從而開創(chuàng)了與諾依曼和摩根斯坦框架路線均完全不同的"非合作博弈(Non-cooperative Game)"理論,進(jìn)而對(duì)"合作博弈(Cooperative Game)"和"非合作博弈"做了明確的區(qū)分和定義。
阿爾伯特·塔克(Albert tucker)教授評(píng)價(jià)其論文,"這是對(duì)博弈理論的高度原創(chuàng)性和重要的貢獻(xiàn)。它發(fā)展了本身很有意義的n人有限非合作博弈的概念和性質(zhì)。并且它很可能開拓出許多在兩人零和問題以外的,至今尚未涉及的問題。在概念和方法兩方面,該論文都是作者的獨(dú)立創(chuàng)造。"
生活中的實(shí)例
納什均衡不僅存在于理論研究中,也在現(xiàn)實(shí)生活中有很多實(shí)例。下面將以兩個(gè)實(shí)例來說明納什均衡的應(yīng)用。
實(shí)例1:公司競爭與定價(jià)策略
在市場競爭中,公司之間的定價(jià)策略涉及到納什均衡的應(yīng)用。假設(shè)有兩家公司在同一市場銷售相似產(chǎn)品,它們的利潤取決于自身的定價(jià)策略和對(duì)方的定價(jià)策略。每家公司都希望通過降低價(jià)格來吸引更多的消費(fèi)者,但過低的價(jià)格可能會(huì)導(dǎo)致利潤的減少。
在這種情況下,納什均衡發(fā)生在當(dāng)兩家公司都選擇合理的定價(jià)策略,使自己的利潤最大化,并且無法通過改變自己的策略來獲得更大的利益。例如,如果一家公司選擇了較低的價(jià)格,而另一家公司選擇了較高的價(jià)格,那么前者可能會(huì)失去市場份額,而后者可能會(huì)得到更高的利潤。只有當(dāng)兩家公司都選擇了合理的定價(jià)策略時(shí),納什均衡才會(huì)達(dá)到。
實(shí)例2:國際軍備競賽與軍事戰(zhàn)略
國際軍備競賽中的軍事戰(zhàn)略也涉及到納什均衡的應(yīng)用。假設(shè)兩個(gè)國家之間存在軍備競賽,每個(gè)國家都希望通過增加軍事力量來保護(hù)自己的國家安全。然而,過度的軍備可能導(dǎo)致資源浪費(fèi)和緊張局勢的升級(jí)。
在這種情況下,納什均衡發(fā)生在當(dāng)兩個(gè)國家都選擇合理的軍事戰(zhàn)略,使自己的國家安全最大化,并且無法通過改變自己的策略來獲得更大的利益。例如,如果一個(gè)國家增加了軍事力量,而另一個(gè)國家沒有做出相應(yīng)的調(diào)整,那么前者可能會(huì)在軍事上占據(jù)優(yōu)勢,而后者則可能面臨更大的安全風(fēng)險(xiǎn)。只有當(dāng)兩個(gè)國家都選擇了合理的軍事戰(zhàn)略時(shí),納什均衡才能實(shí)現(xiàn)。
重要影響
納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟(jì)建模》一書的引言中所說,“在過去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語言、概念等方面,經(jīng)歷了一場溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會(huì)計(jì)、營銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個(gè)方面(謝識(shí)予,1999):
(1)改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。
(2)擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。
(3)加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡單化處理,分析問題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題。
(4)形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。
(5)擴(kuò)大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀ǎ移胀ǖ綆缀鯚o處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。
(6)改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利(Kandori,1997)對(duì)保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過一個(gè)幽默的引申,他說,“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是‘納什均衡’”。
一些誤解
誤解1:納什均衡為"各方利益總和最大化"
實(shí)際情況:納什均衡與利益最大化沒有關(guān)系,甚至?xí)霈F(xiàn)相反的情況—當(dāng)局面處于納什均衡時(shí),對(duì)博弈的各方都不利。典型的例子是囚徒困境,其均衡解反而是"雙輸"的局面。
誤解2:納什均衡點(diǎn)是唯一的
實(shí)際情況:對(duì)某些博弈可能存在有多個(gè)納什均衡點(diǎn)
一些局限性
局限性1:
納什僅證明了均衡點(diǎn)必定存在,但沒有給出"如何找到均衡點(diǎn)"的方法論。
局限性2:
對(duì)于任何一個(gè)稍微復(fù)雜點(diǎn)的博弈,要想找到納什均衡點(diǎn),需要依賴于非常多的約束條件。在現(xiàn)實(shí)生活中,有很大的困難。
總結(jié)
納什均衡作為博弈論中的重要概念,指導(dǎo)著決策制定者在互動(dòng)環(huán)境中做出理性選擇的策略。納什均衡的應(yīng)用不僅幫助我們理解和解釋了許多現(xiàn)實(shí)世界中的決策行為,同時(shí)也為我們提供了指導(dǎo)理性決策的思路和方法。我們可以進(jìn)一步探索納什均衡的變種形式和擴(kuò)展應(yīng)用,以更好地解決互動(dòng)決策問題。
編輯:李益萍




