-猴王智庫

致力於做地緣政治、經濟、軍事和政治層麵的研究，目標是成為中國的蘭德機構。

首頁文章列表博文目錄

個人資料

憂憂國愁

給我悄悄話

博客訪問：

博弈論在政治經濟領域的運用

(2011-12-05 21:31:57) 下一個

博弈論在政治經濟領域的運用(團隊討論稿）

一、博弈論概述及基本策略說明

博弈論也被稱為“對策論”，按西方數學體係來看，其起源於二十世紀，最早是微觀經濟學的組成部分。但其實早在我國春秋戰國時期，就已經有軍事家，政治家在政治，軍事，經濟領域中使用博弈論的思想來製定策略，比如孫臏的“田忌賽馬”，蘇秦張儀的“合縱連橫”等。非常可惜的是，我國古代對數學知識不太重視，士農工商中，隻有比較底層的技工和商人才會學習算術，雖然中華文明在很早就一些輝煌的數學發現，但沒有像西方那樣重視數字邏輯及推理證明，導致我們並沒有將這些數學發現進一步歸納，形成體係，最終讓西方文明摘取了數學皇冠中的絕大部分明珠。

博弈論雖然是經濟學家提出的概念，但應該看成是數學的一個分支。博弈論的基本概念包括參與人、行動、信息約束、策略、收益(效用)、結果和均衡等，其中，參與人、策略和收益是描述一個博弈需要的最少的三要素。下麵，我們以“田忌賽馬”為例，畫出其收益矩陣，再根據其中的規律探尋如何選擇博弈策略：

上麵博弈中，參與人有2個，分別是田忌和齊威王；每個參與人各有上、中下三種策略，雙方采用同等級的策略時，田忌會輸給齊威王，而田忌的高級策略能贏過齊威王的較低級策略；每一場賽馬的結果出來後，勝者贏得收益1，負者的收益則為-1。另外，還有一個信息約束，即參與人的每種策略都必須使用一次，一共將進行三場比賽，最終總收益最多者贏得最終的勝利。

從上麵的表格中，我們可以發現，三場比賽下來，田忌隻可能取得如下結果：勝2場輸1場，勝1場輸2場，勝0場輸3場。為了讓田忌贏得最終勝利，我們隻有盡可能的讓田忌取得“勝2場輸1場”的結果。由此，我們可以遵循以下原則來選擇策略：

1、不要選擇嚴格劣勢策略（如果都是負收益的情況下就是避免選擇損失最大的策略，迭代剔除最劣策略）；

2、站在別人的立場去思考（還要思考別人在博弈時有多老練）；

對照上麵的表格，我們可以觀察到，當田忌選用下馬出戰時，不管齊威王選擇哪個等級的馬出賽，田忌都會輸，所以田忌的下馬是其最劣策略。但是，在上麵的博弈中，最劣策略必須使用，那麽我們來看，該如何通過這個最劣策略盡可能的減少損失，最後我們發現，如果我們用下馬消耗掉齊威王的上馬，可以做到損失最小化，孫臏正是這樣處理。

之後，我們還要來思考一下齊威王會采取什麽樣的策略。之前田忌和齊威王進行過多次賽馬博弈，雙方一直使用的策略是上對上，中對中，下對下。那麽這樣來看，齊威王在不知道我方打算變更策略的情況下，將有非常大的概率重複之前一直采取的出戰策略，即齊威王第一次會出上馬，第二次出中馬，第三次出下馬。這樣，我們就可以在第一場讓下馬出戰，消耗掉齊威王的上馬，之後第二場使用上馬，第三場使用中馬出戰，從而取得2勝1負的最終戰果。

當然，上麵的策略是建立在齊威王不會更換策略的前提下，當齊威王上過一次當後，他為了重新取得勝利，有可能改變自己的出戰策略。這個時候，孫臏想要取勝，最關鍵的是猜測齊威王會如何改變自己的策略，這就是我們不單單要站在別人的立場上思考，還要思考別人在博弈時有多老練的原因。如果齊威王比較笨，會按之前輸的策略調整為：第一次下馬出戰，第二場上馬出戰，第三場中馬出戰的話，那麽我們可以與之對應，第一場用中馬出戰，第二場換下馬出戰，第三場上馬出戰。結果還是田忌勝。經過多輪博弈後，齊威王可能吸收了教訓，決定隨機派遣出戰，那麽這個時候我們就不能再站在齊威王的立場上來思考，而是該轉換一條思路，嚐試從其他途徑提前獲知齊威王的出戰策略，比如從齊威王的禦馬者處下手。

介紹完博弈論的策略選擇原則後，我們接下來看看博弈論中非常重要的“納什均衡(Nash Equilibrium)”，其定義如下：在一策略組合中，所有的參與者麵臨這樣一種情況，當其他人不改變策略時，他此時的策略是最好的。也就是說，此時如果他改變策略他的收益將會降低，此時形成的策略組合被稱為納什均衡點。

要注意的是：納什均衡點在博弈中並不是唯一的，同一個博弈中，可能出現多個納什均衡點。比如出現一個讓所有參與人收益最大的納什均衡點，還有可能出現一個讓所有參與人收益較小的納什均衡點，而且這兩個均衡點是可以相互轉換的，後麵我會在經濟領域中舉例介紹一個納什均衡的例子，其中將講述如何改變納什均衡點。

最後，用一個博弈小遊戲來結束本段落，歡迎本文的讀者將這個遊戲（摘自耶魯大學開發課程：博弈論）分享給你周圍的朋友：這個遊戲的方式是，讓你周圍的人各自從1~100中選擇一個整數，你將所有人的數收集起來，然後算出其平均值，最終越靠近平均數2/3的人將獲勝，你可以拿出10元錢將其當做獲勝獎勵（如果有多個獲勝者答案相同的話，獎金將平分），看看你周圍的人中，哪些人比較有博弈頭腦。另外，你還可以讓同樣的人群重複進行這個遊戲多次，看看結果會否有所變化。

二、博弈策略的融會貫通

在人類曆史長河中，湧現了不少傑出的軍事家，戰略家，政治家，商者，這些偉人對博弈策略的理解，其實遠遠超越了目前純理論研究的博弈論數學家和經濟學家。我們學習西方的博弈論，是為了吸收其思想，借助其體係來分析實際情況，從而指導自己在現實社會中選取比較好的策略。但是，僅僅依靠上麵的博弈論模型和收益矩陣來製定策略，並將其運用到實際環境中，結果可能並不理想。原因其實很簡單，並不是所有的收益都能用數值來計算衡量的，總會有你沒考慮到的情況，或你估算錯誤的收益。

博弈水平的高低，借用我從《火鳳燎原》中看到的一句話來形容：發計，有三種。第一種，是單向而發；第二種，是雙方互發；第三種，是融會貫通。

絕大多數人學完博弈論後，還隻處於第一階段，即會建立一個策略組合的收益矩陣，根據表格迭代剔除最劣策略，最後迭代選出最優策略。這個階段的人，其思維模式是單向的，他們認為世界的規律都是非黑即白，依此心智模式選取出來的最佳策略，其實是給自己劃地為牢，最後的結局要麽是走極端，要麽是被更高階的對手來回反製，疲於奔命。

第一階段的人，其中一部分在經曆過現實社會的磨練後，能進階到第二階段，即站在別人的立場上思考。這個時候他所使用的策略是一個策略組合。其中可能有最佳策略，但是不排除還包含有次優策略，而這些策略的選擇是根據對手的動向而選擇的。比如故意讓對手知道自己的第一步策略，引導對手針對該策略選擇對策，然後在後續策略中蘊藏變招，讓對手之前累積的優勢一下子逆轉為劣勢，甚至為了防止對手猜出自己的策略，而從策略組合中隨機選擇的策略。要注意的是，雙方互發的策略是在連續博弈中運用的，如果僅進行一次博弈時，在無法獲知對手的情報時，隻能采取最佳策略或隨機選擇一個次優測了。第二階段的博弈思想，《火鳳燎原》中戰神呂布的“下一步理論”闡述的比較精辟：要讓人知道你的下一步。偶爾，可以議別人猜到你的再下一步。卻永遠不要讓別人洞悉你的真正意圖。下一步理論的極致精髓那就是，讓自己也猜不到，自己的下一步。

雖然“下一步理論”這種將計就計的博弈思維已有相當程度的博弈水平，但這並不是博弈思維的極限，戰神呂布最終命喪白門樓，恰恰因為他的對手已經到達了融會貫通的第三階段。

進入這一階段的智者，除了會站在別人的立場上思考，還能通過心理學，情報信息確定對手的老練程度外，製定相應的混合策略組合外，最關鍵的是，能將事前無法推演的不確定因素，包容到自己的策略組合中去。即使出現無法包容的不確定因素，也要能因時製宜，隨機應變，從危機找到轉機。要能達成這一階段，除了智商夠格外，情商和逆商也不可或缺，情況越危急，困難越艱難，心態越要冷靜，思維推演要越快越周密。不體驗常人不願涉及的艱難險阻，不經曆一場脫胎換骨的蛻變，是很難鍛煉出這樣的心態的。據說不死的囚徒比任何人都富有夢想。據說隻有被斥逐的人才能達到永恒。曆史長河中的大成就者，很多都有過九死一生的經曆，這段經曆對常人而言是致命的，但對他們來說，恰恰是其成長蛻變的催化劑。苦難裏麵有黃金，但是並不是所有人都能從苦難中找到黃金，但如果你想成為融會貫通的博弈智者，最重要的一條就是：絕對不要逃避苦難，而是用積極的心態去擁抱苦難，甚至要主動找苦吃。

平常情況下，這樣的智者和周圍的聰明人相比，並無出色之處，甚至會比聰明人顯得略差一點，當有捷徑可走，他人投機取巧輕鬆過關時，他反而選擇最難走的一條路。但一旦發生萬分火急的大變故，大廈將傾之際，融會貫通者將會成為最佳智囊，幫組其周圍的人一起走出困境，或利用危機成就一番大事業。

最後，要鍛煉提升自己的博弈思維，不是單單學習博弈論就足夠的，還需要了解人性，學習心理學，政治經濟學，多看曆史/軍事/政治資料，建立自己的思維體係，並將其帶入到現實生活中，不斷檢驗並完善，同時，還要密切關注外界環境的變化，根據外界環境給自己建立的思維體係和策略行為設定一個或數個閥門（對投資來說即止損點和離場）。一般對常人而言，進入博弈思維的第二階段即可讓你平安度過這一輩子，後麵的融匯貫通階段如果覺得不適合自己的話就不要強求了。用博弈思想來看也是如此，並不是最好的策略最適合你自己，每個人最重要的是找到最適合自己的策略。

三、博弈思想在政治領域中的運用

在介紹政治領域的博弈案例之前，先向大家介紹一下博弈論中的兩個最常見的博弈均衡：納什均衡和帕累托最優。

納什均衡是對參與人自身而言，各自所選取的收益最大的策略所形成的均衡點。而帕累托最優，是所有參與人收益總和最大的均衡點。其定義如下：指資源分配的一種理想狀態。假定固有的一群人和可分配的資源，如果從一種分配狀態到另一種狀態的變化中，在沒有使任何人境況變壞的前提下，使得至少一個人變得更好，這就是帕累托改善。帕累托最優的狀態就是不可能再有更多的帕累托改善的狀態；換句話說，不可能再改善某些人的境況，而不使任何其他人受損。

要注意的是，帕累托最優的經濟係統隻是在“最低”的意義上是“理想”的，並不能保證其中沒有貧困或嚴重的貧富差距。舉例說明，假如一項資源，分配給生產效率最高的人能獲得最大收益，那麽帕累托最優狀態下，所有的資源全都會分配給生產效率最高的人，生產效率較低的人將一無所獲。

在一個博弈案例中，如果有多個納什均衡點的情況下，所有博弈者通過相互合作達成總利益最大的納什均衡點即為帕累托最優。為了說明這一點，拿“囚徒困境”做為例子給大家剖析：囚徒困境是一個非零和博弈。大意是：一個案子的兩個嫌疑犯被分開審訊，警官分別告訴兩個囚犯，如果你招供，而對方不招供，則你將被立即釋放，而對方將被判刑十年；如果兩人均招供，將均被判刑兩年。如果兩人均不招供，將最有利，隻被判刑半年。其收益矩陣大致如下：

根據矩陣，我們可以發現這個博弈中存在兩個納什均衡點，分別是兩人都招供及兩人都不招供。都招供對雙方來說所獲得的總收益較小(損失最大)，而都不招供對雙方來說所獲得的總收益最大（損失最小），都不招供即為這個博弈的帕累托最優。

當囚犯之間無法溝通，且這個博弈隻進行一次的情況下，囚犯們通常會選擇都招供的策略。但如果囚犯之間有溝通或這個博弈在規則不變的情況重複進行多次時，囚犯們會選擇帕累托最優的策略組合。

對執政者而言，如果他考慮的是推行一個長期執行的，可持續的政策時，都是期望這個政策能讓所有參與人選擇帕累托最優的策略組合。另外插播一個有趣的觀點，生物學家從生物進化的模擬實驗中也發現了類似的規律，絕對利己的策略模式隻能保證生命物種個體的強大，對物種的繁衍壯大是不利的。當然，無條件的利他策略也是不可取的。為了讓種群發展壯大，最佳策略是“一報還一報”，即在一個可重複的博弈中，一開始以合作的方式對待其他參與者，如果對方不合作，則下次碰到對方時也采用不合作策略，但要給對方改正錯誤的空間，隻不合作一次，反之則繼續合作，用成語來形容的話是“以德報德，以血還血”。

下麵將繼續介紹三個政治策略及其中的博弈分析：

1）中間選民定理

中間選民定理是一個理論，用來分析選民投票的行為。雖然這個定理的建立條件有些苛刻和不切合實際，但其結論卻也能解釋現實生活中的一些政治現象，大家不妨拋開腦中的限製思考下這個定理的適用範圍。下麵詳細介紹一下這個定理的產生過程和推論：

假設在一場選舉中有兩位候選人，所有選民的偏好假設按人數平均分配，選民會把手上的選票投給離自己偏好最近的候選人。為了方便大家更清晰的理解這個模型，假設如下場景：有十一位食客（即選民），他們對菜肴的鹹味偏好值從0到10，現在有兩位廚師給這十一位食客做菜，兩位廚師做的菜式完全一樣，僅僅鹹味有差別。食客會選擇離自己鹹味偏好最近的菜，請問廚師該選擇鹹味值為多少，才能在比賽中獲得最多食客的青睞？

如果廚師A選擇鹹味9，廚師B選擇鹹味3。結果將是：廚師A得到鹹味喜愛度10,9,8的食客的選票，廚師B則能獲得餘下食客的選票取得勝利。看到這裏，相信大家都能想到，兩位廚師為了獲勝都會選擇鹹味5。如果把鹹味偏好的刻度修改一下，變成從1到10，那麽會出現廚師A選擇鹹味5，廚師B選擇鹹味6的情況，不管如何，都是平局，兩位候選人為了獲得勝利，其選擇都會盡量向中間靠攏。如果隻有一個中點，那麽兩位候選人的政見都對稱羅列，如果沒有中點的話，候選人的政見將會在中點左右兩邊對稱分布，這就是中間選民定理。

在現實政治中，大家會發現，相對中立的政治家比較容易得到大多數人的認同，並且我國推崇的中庸之道，帝王的權衡之術，無不和中間選民定理有一絲淡淡的聯係。再更進一步，當下的左右之爭，我個人的觀點是，如果想要實現中華民族的再次崛起，極左或極右都不可取，隻有走中間線路，團結各階層一切可團結的力量才是唯一的途徑。這個定理從數學模型上來分析比較簡單，但如何根據現實情況賦值度量是極其困難的，中點的選取一旦不當，失敗也就是時間問題了。

2）種族隔離

種族隔離指在日常生活中，按照不同種族將人群分割開來，使得各種族不能同時使用公共空間或者服務。種族隔離是一種種族歧視行為。那麽是什麽原因導致了種族隔離呢？博弈論對此有一個非常有意義的解釋，這個分析不單單解釋了種族隔離形成的原因，還可以類比到為什麽總是“人以群分，物以類聚”。

下麵我們假設如下的博弈場景，為了簡化分析，假設10萬人分為兩個種族，種族A和種族B。現在要給這群人在一個城市中分配住所。城市分為東區和西區兩個部分。這群人在在選擇住所時的獲得收益如下所述：

絕大多數人對周圍鄰居的的心態變化大致是這樣的：如果周圍和自己同族的人越來越多（即周圍的老鄉越來越多），那麽自己的快樂收益會越來越高，但是當周圍自己的同族（老鄉）人數超過異族（非老鄉）時，快樂收益開始遞減，但即使周圍全是自己的同族（老鄉），自己的快樂收益也會高於周圍一個同族(老鄉)都沒有的情況。這個收益變化可以用下麵的一個圖表來模擬：

下麵我們來看看每個人的最佳選擇策略是什麽，而這又會導致什麽情況發生：當A族的某個人發現自己區域的同族比率較少時，他會考慮是否搬到和A族比率較多的區域去。從上麵的收益曲線來看，當他發現自己周圍同族的比率低於1/4時，他將會毫不猶豫的搬到和A族比率較多的一區去，因為當自己居所的同族比率低於1/4時，他的快樂收益怎麽都比不上全是同族的1/2。而一旦A族的少部分人開始搬家後，將會導致這一地區的A族人的比率持續下降，於是形成搬遷潮，該地區的A族人都會陸續搬離該區，最終，該區僅僅剩下B族人。於此同時，另外一區由於A族的比率增加，導致B族人的快樂收益開始下降，於是該地區的B族人也將陸續搬入到之前B族人較多的地區。最終結果是，A族人集中居住在一邊，而B族人集中居住在另外一邊。

在上麵的情景中，當每個人都選擇自己的最佳策略時，最終導致整體群體形成較差的納什均衡點（即自發形成了種族隔離），群體收益隻有完全隨機分配的一般。在現實社會中，雖然人們都不喜歡種族隔離，但在利己思想的影響下，讓人們全都自主選擇居住地址的話，最終往往形成種族隔離。如果政府完全不限製人們的居住地選擇權的話，城市中會自發形成所謂的富人區和貧民窟，如果擴大到一個國家，會形成發達地區和不發達地區。馬太效應之所以會一直存在，其根源和這個博弈過程也有相當的關聯。所以，絕對的民主和絕對自由的市場經濟並不一定能形成整個社會的效率最大化。為了防止這種自發隔離的狀況發生，一個強有力的管理集團還是有必要存在的，但是這個集權團體要保證一定的公平和隨機，才能讓整個係統迸發出最大的活力，整個群體獲得最大收益。

3）混合策略在外交談判中的運用

在完全信息博弈中，如果在每個給定信息下，隻能選擇一種特定策略，這個策略為純策略（pure strategy）。如果在每個給定信息下隻以某種概率選擇不同策略，稱為混合策略（mixed strategy）。

在不存在純策略的博弈中，為了實現混合策略的最優策略，即混合策略的納什均衡，我們的原則是保證組合中每種策略的預期收益都相等。之所以采用這樣的原則能達到最佳，是因為保證每種策略的預期收益都相等後，對博弈中的其他參與者而言，你的策略選擇就顯得隨機而不好被猜測了，在多次重複博弈過程中，對手也隻得從自己的策略組合中隨機選擇，從而達到一個博弈均衡。

為了實現這個目的，我們會根據每種策略收益的比率來調整每種策略出現的概率。拿石頭剪刀布遊戲來說，這個遊戲不存在必勝的策略，所以將采用混合策略，由於每種策略的收益都是相等的，故每種策略的概率都是1/3。

下麵我們分析更複雜些的混合策略博弈例子：兩國A,B進行一場經貿合作的談判，每個國家可以選擇貿易合作或不進行貿易合作兩種策略。其目的都是盡可能的讓自己國家的收益最大，這場談判的收益矩陣類似如下：

（B國收益在左，A國收益在右）

要計算出上麵收益列表中的混合策略均衡點，我們可以假設A國使用合作策略的概率為p，那麽使用不合作策略的概率是1-p。相對應的，B國使用合作策略的概率為q，使用不合作策略的概率是1-q。

根據上麵的收益矩陣，我們可以計算出B國選用2種不同策略時的收益

B國采取合作策略的收益：5*p + 8*(1-p)

B國采取不合作的收益；9*p + 2*(1-p)

根據求解混合策略的納什均衡原則，我們要保證B國選擇每種策略的收益都相等，即：5p+8(1-p)=9p+2(1-p)，求解得：p=0.6，反之1-p=0.4。

即A國采取合作策略的概率為0.6，采取不合作策略的概率為0.4。

我們再來通過A國的收益計算下B國的策略概率情況：

A國采取合作策略的收益：5*q + 1*(1-q)

A國采取不合作策略的收益：2*q + 8*(1-q)

同理，要使A過選擇每種策略的收益都相等，即：5q+(1-q)=2q+8(1-q)，求解得：q=0.7反之1-q=0.3。

即B國采取合作策略的概率為0.7，采取不合作策略的概率是0.3。

下麵我們看看，假如上麵的收益矩陣的某一項發生了變化，會導致博弈均衡朝什麽方向變化。假設A國修改了自己的某項經濟政策，提高了雙方合作時自己的收益，使得上麵的收益矩陣變為：

下麵我們猜測下A國采取合作的概率會增加還是會減少？

如果僅從A國自己的利益出發，新政策的實施能讓自己合作策略的收益提高，那麽為了提高自己的收益，應該是加大合作概率的概率。但從B國的角度來看，和A國合作後A國的收益增加，對應導致自己的收益減少，那麽B國應該減少自己使用合作策略的概率才對。那麽這兩種角度哪種正確或影響更大一些呢？我們可以通過計算上麵混合策略的納什均衡點來得出結論。

B國采取合作策略的收益：3*p + 8*(1-p)

B國采取不合作的收益；9*p + 2*(1-p)

根據求解混合策略的納什均衡原則，我們要保證B國選擇每種策略的收益都相等，即：3p+8(1-p)=9p+2(1-p)，求解得：p=0.5，反之1-p=0.5。

即A國采取合作策略的概率為0.5，和之前的0.6相比，其采取合作策略的概率有下降。

我們再來通過A國的收益計算下B國的策略概率情況：

A國采取合作策略的收益：7*q + 1*(1-q)

A國采取不合作策略的收益：2*q + 8*(1-q)

同理，要使A國選擇每種策略的收益都相等，即：7q+(1-q)=2q+8(1-q)，求解得：q=7/12=0.583反之1-q=0.417。

即B國采取合作策略的概率為0.583，和之前的0.7相比，其采取合作策略的概率也有下降。

由此可見，是後一種的影響更大一些：當合作後A國的收益增加，會使得B國減少合作的可能性，之後A國為了應對對手策略概率的變化，也因此調低了自己采取合作策略的概率。

在使用混合策略的博弈過程中，當其中的某一項策略收益發生變動時，也需要根據對手的變化調整自己的策略概率。所以這個均衡一直是動態的，當某一方出招時，均衡就會被打破，從而導致預期的結果產生偏差。博弈參與者會因此修改自己的策略概率，達到一個新的納什均衡。

要注意的是，使用混合策略的博弈一般都是多次重複的無限博弈。所以在後續的博弈過程中，某一項策略的收益有相當大的可能性發生變動。如果不注意到這一點，一直采用最初的策略概率來進行博弈，那麽更加聰明的對手會根據這一點修改自己的策略概率來提高自己的收益。就拿上麵的外貿合作例子來看，假如A國在修改某項經濟政策提高自己合作後的收益後，還是維持之前0.6的合作概率，那麽B國可以更多的采取不合作策略，減少A國的收益來使自己的收益增加。

這個例子衍生開來，可以用來解釋現實社會中的不少博弈現象：比如在現實政治軍事博弈，每個國家都不可能做到全知全能，前期因為手頭掌握的信息有限，製定的對策方案會隨著信息的增加，對手對自己策略的調整而逐漸改變，最終的博弈走向會和當初構想的完全不同。一般來說，戰術層麵上的博弈，預測的準確率能超過60%就算不錯了。如果製定10年左右的戰略規劃，能保證10年後的結果能實現前期80%目標就算非常完美了。所以，我們在製定策略時，不要太過在乎前期策略的準確率，隻要把握住大方向即可，一些戰術層麵上的博弈，應放手讓第一線的決策人自己把握。如果為了提高前期策略的準確率，強行要求按照的最初策略方案來執行，最終極有可能導致整個戰略層麵的失敗。

四、博弈思想在經濟領域的運用

經濟領域的博弈運用我將通過剖析幾個經濟方麵的博弈案例來闡述：

1）銀行擠兌分析

銀行擠兌是存款人集中大量提取存款的行為，是一種突發性、集中性、災難性的危機。由於消費者對銀行給付能力失去信心而產生的從銀行大量支取現金的現象。

對銀行和存款人來說，兩者之間有一個博弈過程：存款人將手上的資金存入銀行，銀行將存款人的資金部分用來放貸，獲取利潤，銀行為了吸引更多的人到其中存款，會將獲取的部分利潤以存款利息方式返還給存款人。在這樣一個博弈中，存在兩個納什均衡，好的納什均衡即存款人積極存款，銀行有足夠的資金用來貸款以獲取利潤，同時使得存款人收益持續增加，這是一個雙贏的局麵。差的納什均衡即存款人對銀行失去信心，從而集中大量提現，導致銀行資金鏈斷裂破產，使得所有存款人利益受損，於之前相對應的，這是一個雙輸的局麵。

如果一個博弈有多個納什均衡點，那麽有辦法引導參與者達成一個較好的納什均衡嗎？或者將現有較差的納什均衡點改變成為較好的納什均衡點？具體到上麵的例子，即當出現銀行擠兌時，有什麽辦法能扭轉當前的危機呢？

在美國的一部電影《生活多美好It's a Wonderful Life》中，就有一個這樣的案例。電影中，等待提現的人群中跳出一個小夥子，他給大家提供了兩種方案：一種是把把錢取出來，避免風險，但是，銀行沒有這麽多錢，最後破產，大家都損失；另外一個是隻提取滿足日常開支的資金，或者繼續存錢，那麽銀行保住了，最後通過時間來化解危機，大家都沒有損失。

雖然電影中的案例不太真實，但這個思路是沒有錯的。當博弈過程中所有參與者之間能進行溝通時，參與者們會更傾向於通過合作方式獲取更大的收益，這正是多個納什均衡點之間轉換的關鍵。反之，如果博弈的參與者之間無法順利溝通，那麽參與者會更傾向於選擇不合作方式來保障自己的最大利益，從而形成較差的納什均衡。在發生危機時，如果一方極力掩蓋事件真相，造成信息不對稱局麵，那麽另外一方會更多的選擇不合作策略，最終導致整個形勢朝著更壞的方向行進。

2）商品定價博弈

假設兩家公司生產完全同質的商品，僅僅是兩家的定價有所不同，這意味著消費者在購買這件商品時的唯一權衡指標是商品的價格。那麽這件商品的定價博弈會出現什麽情況呢？

結果將會有兩種：

結果一：兩家公司私下達成協議，雙方使用相同的價格，並保留比較高的利潤；

結果二：其中一家偷偷降價，來搶奪對方的市場份額，另外一家發現後，也下調價格，最終結果是兩家公司都把商品售價價格降低至成本價，形成另外一個均衡；

前麵一種結果即壟斷，對消費者而言是損失最大的，所以各國都製定了《反壟斷法》，來盡可能減少這種結果的發生。後一種結果對消費者最有利，但是對生產商來說，沒有利潤意味著公司無法發展壯大，且公司的抗風險能力極低，稍有差錯就可能破產倒閉，從長遠預期來看，後麵一種結果對消費者也會造成一定的損失。

那麽該如何避免這種情況的發生呢？答案是：產品差異化。即兩家公司在生產相同功能的一件商品時，各自根據部分消費者群體的需求，開發出額外附屬功能，使得消費者相信這些產品存在差異而產生不同的偏好，以此來避免同質商品的價格戰博弈發生，比較明顯的例子如手機，電腦等等。

對消費者而言，知道了產品差異化後的原因，我們在選擇同類產品時，也能根據自己的特定需求選擇更適合自己的產品，從而達到雙贏的局麵。

3）新產品發布：提前還是延後？

假設兩家公司都在研發功能相同的一項產品，該產品的目標用戶隻可能選用其中一種產品。如果先發布的產品大受歡迎，將贏得所有目標用戶，導致後麵一家公司還未發布的產品直接失敗。反之，如果先發布的產品品質很差，則用戶會集體放棄已發布的產品，轉而等待之後發布的產品，之後發布的產品一定會獲得成功。另外，較晚推出的產品，其品質肯定比之前推出的產品高。在這樣一個博弈案例中，如果你是其中一家公司的CEO，你將會如何抉擇呢？是先發製人還是等待對手的失誤取得勝利？

我們可以假設公司A發布產品成功的概率為p，公司B發布產品成功的概率為q，每過一段時間後，p和q的概率都會有一定程度的增長。下麵我們來看看如何通過這些條件製定出最優策略：

以公司A為參照點，當公司A成功的概率 < 公司B失敗的概率時，此時公司A如果率先推出自己的產品，隨後公司B也立即推出自己的產品，由於p < 1-q，可以看到，公司B此時推出產品的成功率是高於公司A的成功率的，公司A的產品由於品質敵不過公司B，將立即遭遇失敗。如果公司B不立即推出產品，而是繼續等待打磨產品，這個結果也不會改變。

同理，當公司A成功的概率 > 公司B失敗的概率時，公司A率先推出自己的產品，此時p >1-q，即使公司B立即推出自己的產品，但公司A的產品已經率先得到了用戶的認可，用戶不會轉向比公司A產品品質稍差一些的公司B的產品。即使公司B不立即推出產品，而是等待品質超過公司A的產品後再推出，但已經被對手搶占了所有目標用戶，最終公司B仍舊會失敗。

所以，這個博弈的最佳策略是：沒有到D點(即你成功的幾率<對手失敗的幾率)之前，等待是一個好策略，當到達D點之時，盡量先下手為強。

另外，在類似這樣的博弈中，人的心理作用不容忽視，心理學家通過多項心理實驗得出如下結論：人們通常傾向於高估自己的成功率和能力。所以，不妨在等待的期間給對手製造錯誤的信息，誘使對手錯誤的高估自己的能力，主動犯錯，從而給自己增加勝利的幾率。兵法有雲：預先取之必先予之也正是這個道理。

4）智豬博弈對員工激勵機製的啟發

　　智豬博弈的例子是：豬圈裏有兩頭豬，一頭大豬，一頭小豬。豬圈的一邊有個踏板，每踩一下踏板，在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一隻豬去踩踏板，另一隻豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時，大豬會在小豬跑到食槽之前剛好吃光所有的食物；若是大豬踩動了踏板，則還有機會在小豬吃完落下的食物之前跑到食槽，爭吃到另一半殘羹。

　　那麽，兩隻豬各會采取什麽策略？答案是：小豬將選擇“搭便車”策略，也就是舒舒服服地等在食槽邊；而大豬則為一點殘羹不知疲倦地奔忙於踏板和食槽之間。

原因何在？因為，小豬踩踏板將一無所獲，不踩踏板反而能吃上食物。對小豬而言，無論大豬是否踩動踏板，不踩踏板總是好的選擇。反觀大豬，已明知小豬是不會去踩動踏板的，自己親自去踩踏板總比不踩強吧，所以隻好親力親為了。

相信不少公司都有這種“小豬躺著大豬跑”的現象，即公司的一部分員工為公司帶來可觀效益，另外一部分員工沒有出力卻跟著享受收益。想要改變這種博弈結果的辦法有三種：

方案一：減少食物的投放。將投食減少僅夠一邊的豬吃完，這樣無論哪一邊去踩踏板，在讓另外一邊守候的受益，而自己得不到任何利益。這樣的結果是誰都不會有踩踏板的動力。這種辦法會導致最壞的結果發生，對公司而言結局一定是倒閉；

方案二：增加投食的分量。保證每次投放的食量能讓大豬小豬都吃飽。這種物質極大豐富的共產主義條件是很難實現的，所以也不具備可操作性；

方案三：改變投食的位置，同時減少投食的分量。將投食口改到踏板附近，同時減少投放的食量，僅保證投放的食量能讓踏動踏板的一方吃完，而不踏的一方搶不到投放的食物。這種“多勞多得”的方案最具可操作性。

　　但是，方案三照搬到現實企業中，容易在企業中形成個人英雄主義和“唯KPI論”的氛圍，所以在執行時也不能絕對化，一方麵要在公司內營造一個良好的溝通氛圍，通過員工間融洽和諧的溝通氛圍來促進員工間相互協作，另外一方麵還要保留少部分利益給不創造效益，但能促進員工相互合作的人，通過允許他們“搭便車”來培育公司的凝聚力和同心力。

舉個例子，微軟公司在創立的早期，曾經雇傭了一部分完全不會編程的女性從事項目管理方麵的工作，這些員工雖然不能從事軟件開發的工作，但她們能比較好的協調開發人員，並幫助其處理雜事，讓其專心高效協作，從而大大提高了軟件的開發效率。所以，凡事都不要走極端，最優的方案搬到現實生活工作中往往並不如分析中那麽完美，我們在設計方案時最重要的是把握住“兩利相權取其重，兩害相較取其輕”的原則。

五、總結及注意要點

博弈論研究的一些案例都簡化了相當一部分條件，同時將博弈對手削減為兩個，主要目的是通過篩選出一些基本條件，方便推斷出最佳策略，並形成結論。但現實社會中，有些條件對博弈的影響是相當大的，不恰當的刪減這些條件，將會製定出和現實環境相背離的“最佳策略”，成為紙上談兵的笑柄。

另外，參與博弈的人也不可能都是100%理性，在博弈過程中都有一定概率被非理性思維引導，從而選擇對自己的非最佳策略，所以現實社會中的博弈往往很難達成一個完美的納什均衡，通常情況下都隻是接近一個納什均衡，而且是可以通過一些外加條件的刺激來改變現有的均衡的。所以，我們在分析現實場景的博弈事件時，要盡可能的用中立的立場來思考，不要一開始就給自己定下枷鎖，認定事情的發展走向一定會朝某個方向行進，非黑即白的觀點是不可取的。舉個例子，經濟學中的貨幣政策裏，增加貨幣的發行量會提高通貨膨脹率，這一點被很多人認定是絕對真理了。但美國的兩次量化寬鬆QE，對本國的通貨膨脹提升刺激卻並不大，這其中的原因是什麽呢？類似的案例還有很多，我就不一一列舉了，希望大家以後能帶著疑問和中立的心態看待每一條結論和公理。

[ 打印 ]

[ 加入書簽 ]

閱讀 () ┆ 評論

評論

目前還沒有任何評論

登錄後才可評論.