正文

博弈論與生活中的經濟學

(2006-11-08 07:57:36) 下一個
博弈論(game theory)是由美國數學家馮·諾依曼(Von. Neumann)和經濟學家摩根斯坦(Morgenstern)於1944年創立的帶有方法論性質的學科,它被廣泛應用於經濟學、人工智能、生物學、火箭工程技術、軍事及政治科學等。1994年,三位博弈論專家即數學家納什(Nash,他的故事被好萊塢拍成電影《美麗心靈》,該影片獲得了2002年奧斯卡金像獎的四項大獎)、經濟學家海薩尼(Harsanyi)和澤爾滕(Selten)因在博弈論及其在經濟學中的應用研究上所作出巨大貢獻而獲得諾貝爾經濟學獎)

1996年,兩位將博弈論應用於不對稱信息下機製設計的經濟學家莫裏斯(Mirrlees)和維克裏(Vickrey)、以及2001年三位經濟學家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運用博弈論研究信息經濟學所取得的成就而成為這兩個年度的諾貝爾經濟學獎得主。專家預計,近幾年還會有更多的博弈論專家可能獲得諾貝爾經濟學獎。

為什麽博弈論在經濟學領域會產生如此大的影響呢?這是因為博弈論從一個獨特的視角幫助我們更加深刻地理解和把握經濟現象,並指導更加有效的經濟政策製訂。

博弈論是一門十分有趣但理論上又是十分艱深的學問,我今天打算用一些大家能夠憑直觀或簡單分析就能把握的例子為大家介紹博弈論的基本概念及應用,以引起大家對這門目前已成為熱門科學的興趣和獲得初步的了解。這些例子也是我們在日常生活中經常所遇到的問題或觀察到的現象,通過博弈論,我們能夠更加深刻地理解它們。

1. 囚徒困境
兩個小偷甲和乙聯手作案,私入民宅被警方逮住但未獲證據。警方將兩人分別置於兩間房間分開審訊,政策是若一人招供但另一人未招,則招者立即被釋放,未招者判入獄10年;若二人都招則兩人各判刑8年;若兩人都不招則未獲證據但因私入民宅各拘留1年。

盡管甲不知乙是否招供,但他認為自己選“招”最好,因而甲會選擇“招”,乙也同樣會選擇“招”,結果各判8年;但若兩人都不招,結果是兩人隻被判1年,但這種結果是不會出現的。我們可以運用“剔除劣戰略”的方法來獲得這樣的結果。

甲或乙可以作出的選擇被稱為“戰略”,如“招”或“不招”都是戰略。
對甲來說 ,盡管他不知道乙是選擇了“招”還是“不招”,他發現他自己選擇“招”都是比選擇“不招”為好的。因此,“不招”是相對於“招”的劣戰略,他不會選擇劣戰略。所以,甲會選擇“招”. 同樣,根據對稱性,乙也會選擇“招”,結果是甲乙兩人都“招”。

甲和乙是參與博弈的人,稱為“局中人”。表1中每一個小方格內的數字被稱為局中人的支付,其中左邊的數字代表甲的支付,右邊的是乙的支付。表1中的雙變量矩陣稱為博弈支付矩陣。局中人所選擇的戰略構成的組合(招,招)被稱為博弈均衡。這個組合中前後兩個戰略分別表示甲和乙所選擇的戰略。

甲和乙都不會選擇劣戰略“不招”,稱為“剔除劣戰略的占優戰略均衡”。其中“招”是占優於(優於)“不招”的占優戰略。

我們可以利用這個道理來分析日常生活中的許多不合作現象。 2. 生活中的“囚徒困境”例子例子1 商家價格戰
出售同類產品的商家之間本來可以通過共同將價格維持在高位而獲利,但實際上卻是相互殺價,結果都賺不到錢。當一些商家共謀將價格抬高,消費者實際上不用著急,因為商家聯合維持高價的壟斷行為一般不會持久,可以等待壟斷的自身崩潰,價格就會掉下來。

n譬如,2000年我國幾家生產彩電的大廠商合謀將彩電價格維持高位,他們搞了一個“彩電廠家價格自律聯盟”,並在深圳舉行了由多家彩電廠商首腦參加的“彩電廠商自律聯盟高峰會議”。當時,國家有關部門還未出台相關的反壟斷法律,對於這種在發達國家明顯屬於違法行為的所謂“自律聯盟”,國家在法律上暫時還是無能為力的。寡頭廠商在光天化日之下進行價格合謀,並且還通過媒體大肆炒作,這在發達國家是不可思議的。

但是,盡管政府當時無力製止這種事情,公眾也不必擔心彩電價格會上漲。這是因為,“彩電廠商自律聯盟”隻不過是一種“囚徒困境”,彩電價格不會上漲。在高峰會議之後不到二周,國內彩電價格不是上漲而是一路下跌。這是因為廠商們都有這樣一種心態:無論其他廠商是否降價,我自己降價是有利於自己的市場份額擴大的。

n例子2 為什麽政府要負責修建公共設施,因 為私人沒有積極性出資修建公共設施
設想有兩戶相居為鄰的農家,十分需要有一條好路從居住地通往公路。修一條路的成本為4,每個農家從修好的好路上獲得的好處為3。如果兩戶居民共同出資聯合修路,並平均分攤修路成本,則每戶居民獲得淨的好處(支付)為3-4/2=1;當隻有一戶人家單獨出資修路時,修路的居民獲得的支付為3-4=-1(虧損), “搭便車”不出資但仍然可以使用修好的路的另一戶人家獲得支付3-0=3,我們看到,對甲和乙兩家居民來說,“修路”都是劣戰略,因而他們都不會出資修路。這裏,為了解決這條新路的建設問題,需要政府強製性地分別向每家征稅2單位,然後投入4單位資金修好這條對大家都有好處的路,並使兩家居民的生活水平都得到改善。這就是我們看到的為什麽大多數路、橋等公共設施都是由政府出資修建的原因.同樣的道理,國防、教育、社會保障,環境衛生等都由政府承擔資金投入,私人一般沒有積極性承擔這方麵服務的積極性和能力。

例子3 蘇格蘭的草地為什麽消失了?公共資源經常被過度利用的原因。
在18世紀以前,英國蘇格蘭地區有大量的草地,其產權沒有界定,屬公共資源,大家都可以自由地在那裏放牧。草地屬於“可再生資源”,如果限製放牧的數量,沒有被牛羊吃掉的剩餘草皮還會重新長出大麵積草場,但如果不限製放牧規模,過多的牛羊將草吃得一光二淨,則今後不會再有新草生長出來,草場就會消失。

由於草地的產權沒有界定,政府也沒有對放牧作出規模限製,每家牧民都會如此盤算:如果其他牧民不約束自己的放牧規模,讓自己的牛羊過多地到草地上吃草,那麽,我自己一家約束自己的放牧規模規模對保護草場的貢獻是微乎其微的,不會使草場免於破壞;相反,我也加入過度放牧的行列,至少在草場消失之前還會獲得一部分短期的收益如果其他牧民約束放牧規模,我單獨一家人過度放牧不會破壞廣褒的牧場,但自己卻獲得了高額的收益。因此,任何一位牧民的結論都會是:無論其他牧民是否過度放牧,我選擇“約束自己的放牧規模”都是劣戰略,從而被剔除。大家最終都會選擇過度放牧,結果導致草地消失,生態破壞。

n類似的例子還有:
渤海中的魚愈來愈少了,工業化中的大氣及河流汙染,森林植被的破壞等。解決公共資源過度利用的出路是政府製訂相應的規製政策加強管理,如我國政府規定海洋捕魚中,每年有一段時間的“休漁期”,此時禁止捕魚,讓小魚苗安安靜靜地生長,大魚好好地產卵,並對魚網的網眼大小作出規定,禁用過小網眼的捕網打魚,保護幼魚的生存。又如在三峽庫區,為了保護庫區水體環境,關閉了前些年泛濫成災的許多小造紙廠等。

n例子4 為什麽在城市中心道路上禁止汽 車鳴喇叭?
禁鳴喇叭一方麵是為了控製城市噪聲汙染,另一方麵是基於以下的博弈論原因。見表3,當汽車司機可以鳴喇叭時,可能為汽車超速搶行提供條件。但當大家都搶行時,城市交通擁擠加重,反而都難以順利通行,獲得低支付(2,2)。

但當對方緩行時,自己搶行會占便宜,獲得支付9。
這個博弈中,“緩行”是劣戰略,剔除後得到“剔除劣戰略後的占優戰略均衡”(搶行,搶行),這不是一個好的均衡。當禁止鳴喇叭時,司機為了避免造成交通事故,隻得緩行,從而得到好的結果(緩行,緩行)。 

n例子5 為什麽要加入WTO?
WTO是一個自願性申請加入的自由貿易聯盟,即WTO成員國之間實現低關稅或零關稅的相互間自由貿易。為什麽需要一個組織來協調國家之間的自由貿易呢?這是因為,如果沒有一個協調組織,國與國之間的貿易就不會呈現低關稅或零關稅的自由貿易局麵,因為這時國與國之間的貿易是一個“囚徒困境”。給定一個國家對另一個國家的貨物實行低關稅,另一個國家反過來對這個國家的貨物實行高關稅是占優於實行低關稅的戰略的。 


二、智豬博弈:對諸多經濟現象的解釋
1. 智豬博弈
豬圈中有一頭大豬和一頭小豬,在豬圈的一端設有一個按鈕,每按一下,位於豬圈另一端的食槽中就會有10單位的豬食進槽,但每按一下按鈕會耗去相當於2單位豬食的成本。如果大豬先到食槽,則大豬吃到9單位食物,小豬僅能吃到1單位食物;如果兩豬同時到食槽,則大豬吃7單位,小豬吃3單位食物;如果小豬先到,大豬吃6單位而小豬吃4單位食物。表4給出這個博弈的支付矩陣。
小豬
按 等待
按 5,1 4,4
大豬
等待 9, -1 0,0 

n這個博弈沒有“剔除劣戰略均衡”,因為大豬沒有劣戰略。但是,小豬有一個劣戰略“按”,因為無論大豬作何選擇,小豬選擇“等待”是比選擇“按”更好一些的戰略。所以,小豬會剔除“按”,而選擇“等待”;大豬知道小豬會選擇“等待”,從而自己選擇“按”,所以,可以預料博弈的結果是(按,等待)。這稱為“重複剔除劣戰略的占優戰略均衡”,其中小豬的戰略“等待”占優於戰略“按”,而給定小豬剔除了劣戰略“按”後,大豬的戰略“按”又占優於戰略“等待”。 

在經濟生活中,有許多“智豬博弈”的例子。
例子6 股市博弈
在股票市場上,大戶是大豬,他們要進行技術分析,收集信息、預測股價走勢,但大量散戶就是小豬。他們不會花成本去進行技術分析,而是跟著大戶的投資戰略進行股票買賣,即所謂“散戶跟大戶”的現象。

n例子7 為何股份公司中的大股東才有投票權?
在股份公司中,大股東是大豬,他們要收集信息監督經理,因而擁有決定經理任免的投票權,而小股東是小豬,不會直接花精力去監督經理,因而沒有投票權。

例子8 為什麽中小企業不會花錢去開發新產品?
在技術創新市場上,大企業是大豬,它們投入大量資金進行技術創新,開發新產品,而中小企業是小豬,不會進行大規模技術創新,而是等待大企業的新產品形成新的市場後生產模仿大企業的新產品的產品去銷售。 

例子9 為什麽隻有大企業才會花巨額金錢打廣告?
大企業是大豬,中小企業是小豬。大企業投入大量資金為產品打廣告,中小企業等大企業的廣告為產品打開銷路形成市場後才生產類似產品進行銷售。

三、納什均衡與商業中心區的形成
表5給出的博弈中,甲和乙都沒有劣戰略,所以,不能通過重複剔除劣戰略獲得博弈結果
表5 存在納什均衡的博弈

L M R
U 1,1 4,2 1,3

D 2,3 1,2 2,1 

問題2:甲和乙分別會選擇什麽戰略?) 

當甲選“U”時,乙會選“R”;而當乙選“R”時,甲應該選“D”而不是“U”;但當甲選“D”時,乙會選“L”;給定乙選“L”,甲選“D”是最好的選擇,他不會改變選擇“D”;給定甲不改變選“D”,乙也不會改變其選擇“L”。所以,可以預期(D,L)是甲乙最終完成的穩定的選擇 www.6park.com

稱(D,L)為 “納什均衡”。納什均衡是局中人戰略選擇上構成的一種“僵局”,給定其他局中人的選擇不變,任何一個局中人的選擇是最好的,他也不會改變其戰略選擇。剔除劣戰略的占優戰略均衡和重複剔除劣戰略的占優戰略均衡是納什均衡,但相反的結論不成立

n在城市街道上,我們常見到一些地段上的商店十分擁擠,構成一個繁榮的商業中心區,但另一些地段卻十分冷僻,沒什麽商店。對於這種現象,我們可以運用納什均衡的概念來加以解釋。
甲乙
1/2
圖1 商業位置博弈

見圖1,有一個長度為1單位的街道,在街道兩邊均勻地分布著居民。現有兩家商店決定在街道上確定經營位置。如果甲在街道中間位置1/2處設店,則乙的最好選擇是緊靠甲的左邊或右邊設店。 

當乙在甲的右邊緊靠甲設店時,其右邊街道上的顧客都是乙的顧客;如果乙不是緊靠甲而是遠離甲設店,則其顧客隻是其右邊街道的居民,不如它緊靠甲設店時多,因而在遠離甲的位置設店是劣戰略。所以給定甲在1/2處設店,乙在緊靠甲的左邊或右邊設店是最優的。反過來,給定乙在接近1/2處設店,甲的最優選擇也是在1/2附近設店。這樣,甲和乙擠在1/2處設店就是納什均衡,這就是商業中心區的形成原理. w

四、動態博弈與承諾行動 

如果局中人在進行行動選擇時有先後順序之分,這種博弈就被稱為“動態博弈”。
在圖2中,有兩個房地產開發商A和B分別決定在同一地段上開發一棟寫字樓。由於市場需求有限,如果他們都開發,則在同一地段會有兩棟寫字樓,超過了市場對寫字樓的需求,難以完全出售,空置房太多導致各自虧損1百萬。 

當隻有一家開發商在這個地段開發一棟寫字樓時,它可以全部售出,賺得利潤1百萬。假定A先決策,B在看見A的決策後再決策
是否開發寫字樓。在圖2中,
用“博弈樹”表示博弈過程 

n在其中每一條“路徑”的末端用向量給出A和B的支付,稱為支付向量。
下麵用“逆向歸納法”可以求解這個博弈。在B進行決策的2個“決策結”上,B在左邊的決策結上選擇“不開發”;而在右邊的決策結上選擇“開發”。即給定A開發,B就不開發;給定A不開發,B就開發。B應避免同時與A都選擇開發而蒙受損失。 

n在這種情況下,A在自己的決策結上當然選擇“開發”,因為他預計當自己選擇“開發”後,B會選擇“不開發”,自己就淨賺一百萬。當B威脅A說:“不管你是否開發,我都會在這裏開發寫字樓。”倘若A將B的話當了真,A就不敢開發,讓B單獨開發寫字樓占便宜。但是,B的威脅是“不可置信”的。
當A不理會B的威脅而果斷地開發出一棟寫字樓時,B其實不會將事前的威脅付諸實施。因為“識時務者為俊傑”,在A已開發的情況下,B的最優決策是“不開發”而不是“開發”。 

但是,如果B在向A發出威脅的同時又當著A的麵與第三者C打賭一定要在該地段上開發出一棟寫字樓,否則輸給C 2百萬元。B與C為此簽定合同並加以公證有效。
這時,博弈變成圖3所示的動態博弈。

n稱B的這種行動為“承諾行動”,它使原來不可置信的威脅變為可以置信。這時,A就不得不相信B一定要開發寫字樓的威脅了,於是放棄開發寫字樓的計劃,讓B如願以償單獨開發寫字樓。B不僅未向C支付2百萬元,反而淨賺1百萬。
我們可以運用“承諾行動”的原理來分析許多經濟及軍事現象。 

例子10 項羽的“破釜沉舟”。
例子11 韓信趙國之戰,“置之死地而後生”。
例子12 歐共體在空中客車與波音公司的競爭中對空中客車公司的戰略性補貼。
歐共體為了打破美國波音公司對全球民航業的壟斷,曾放棄歐洲傳統的自由競爭精神而對與波音公司進行競爭的空中客車公司進行補貼
當雙方都未獲得政府的補貼時,兩個公司都開發新型飛機會因市場飽和而虧損,但若一家公司開發而另一家公司不開發時,則開發的那家公司會獲巨額
利潤,見表6 

n此時有兩個納什均衡,即一家開發而另一家不開發。
下麵,考慮歐共體對空中客車進行補貼20個單位的情況。此時,當兩家都開發時,空中客車仍然盈利10單位而不是虧損,博弈矩陣見表7。
這時隻有一個納什均衡,即波音公司不開發和空中客車公司開發的均衡(不開發,開發),這有利於空中客車。
在這裏,歐共體對空中客車的補貼就是使空中客車一定要開發(無論波音是否開發)的威脅變得可置信的一種“承諾行動”。 

例子13 為什麽大人物、大公司要聘請常年律師?
大人物、大公司對聲譽十分看重,因而為一些不良人物或公司通過誹謗大人物、大公司企圖迫使大人物、大公司花錢“私了”而獲利。這是因為,盡管對於一些無端的指控,大人物、大公司可望通過法律手段(打官司)而出清了結,但打官司請律師會增加他們額外的成本。如果能花稍少一些錢“私了”,則既使自己清白又省錢,同時誹謗者也獲得收入。 大人物、大公司為了避免這種無端的損失,幹脆花錢請常年律師,律師費用已經一次性支付,打官司不會帶來額外的花費。這是一個承諾行動,它告訴潛在的誹謗者,大人物、大公司一旦受到無端誹謗必定會讓他們吃官司。這樣,大人物、大公司因此承諾行動而使自己得到保護,避免了許多無端指控的發生。 

例子14 如何以弱敵強
在戰爭史上,以弱勝強的例子是很多的。在商業競爭中,以弱敵強也是經常會遇到的情形。在二戰中的諾曼底登陸戰的謀略策劃中,盟軍就麵臨以弱敵強的問題。盟軍有兩個可以選擇的登陸目標地,一是多佛,二是諾曼底。德國守軍在人數上超過了盟軍,並且就軍事進攻而言,在人數相同的情況下,攻方與守方相比會處於不利的情形。

下麵,將這種情形模型化。有一支軍隊準備進攻一座城市,它有軍力兩個師。守城軍隊有三個師。通往城市有甲、乙兩條道路或方向。兩軍相遇時,人數居多的一方取勝,當兩方人數相等時,守方獲勝。假定軍隊隻能整師調動
攻方戰略:
a=兩個師集中沿甲方向進攻
b=兵分兩路,一個師沿甲方向進攻,
另一個師沿乙方向進攻
c=兩個師集中沿乙方向進攻
守方戰略:

A=三個師集中守甲方向
B=兩個師守甲方向,一個師守乙方向
C=一個師守甲方向,兩個師守乙方向
D=三個師集中守乙方向

攻方知道守方不會選A和D,他由此知道博弈變成上圖所示。此時,攻方就有一個劣戰略b,他剔除b後得到新的博弈,見下表:
此時,兩方的形勢是相同的,即攻方盡管開始在軍力上劣於守方,但實際上它隻要運用計謀,其獲勝的可能與守方是相同的
五、不對稱信息下的博弈
六、混合戰略博弈





[ 打印 ]
閱讀 ()評論 (3)
評論
目前還沒有任何評論
登錄後才可評論.