從人際關係到國際關係經常會遇到一種利益衝突,合可雙贏,爭則兩敗,背叛者占盡尋求合作便宜的局麵。這個局麵在博弈中叫做“囚徒困境(Prisoner’s dilemma)”。那是Merrill Flood和Melvin Dresher在蘭德研究合作與衝突時構造的一個模型,普林斯頓數學家Albert W. Tucker1950年在斯坦福大學給一群心理學家說明選擇的難題時舉它作為例子,從此成為了二十世紀下半葉在社會科學中影響最大的案例。在“囚徒困境”中,背叛者獲益要比合作時大,單方麵尋求合作的人受傷害要比相爭時深。這誘使局中人在合作與背叛之間往往選擇背叛,因為無論對方選擇什麽,采用“背叛”總比“合作”對自己更有利,這在博弈中叫做“嚴格優勢策略”。雙方各自明智的選擇排斥了本來可以合作雙贏的前景,結果走到了兩敗俱傷的境地。這是自私人性悲哀的困境。
現代的教育總是讓人相信理性的力量和善意的威力。人們不禁想象:在各自決策之前,如果給局中人一個充分交流溝通的機會,是不是有可能讓他們攜手合作走向雙贏?金球賽的最後階段的遊戲(Golden Balls:Split or Steal)提供了許多非常精彩的實例。
2007到2009年風靡英國金球賽(Golden Balls)以參與者們根據各人誠實或者虛假的得球聲明,通過公開討論方式,投票淘汰可能得到差球的隊員。到了最後階段剩下兩個人,兩人前麵各有兩個金色的球,其中一個是“平分”,另一個是“騙取”。兩人私下中各選一個,如果兩個人都選了“平分”,將平分高額的獎金。如果其中一個選擇“騙取”,另外一個選擇“平分”,前者將獲取所有的獎金,後者則空手離開。如果兩個人都選擇“騙取”,則兩敗俱傷一無所得。
這最後階段的遊戲是弱化的“囚徒困境”博弈。被背叛的一方受到傷害與相爭時一樣,這略為減少一點要“平分”者的損失。但這並不改變“騙取”是一個優勢策略。因為無論對方選擇什麽,自己選擇“騙取”都比選“平分”不吃虧。如果沒有協商,雙方不大可能走向合作。但在這最後階段的遊戲中,允許他們在選擇前協商溝通。
下麵的一個視頻顯示單純善意的溝通,可能獲得的一種結果。http://www.youtube.com/watch?v=p3Uos2fzIJ0&feature=related
這個視頻,一男一女雙方都信誓旦旦地承諾選擇“平分”這個獎金,女人首先承諾自己會守信,哀婉地祈求對方要平分,兩人相握對視眼睛直達心底,那男方誠摯的態度令人動容。但是這個承諾在博弈中隻有精神作用並沒有實際約束,實際上這個溝通並沒有改變未溝通前的狀態,尋求合作者浪費了這個機會,單純的信任往往是受傷害的一方。比賽的現實證明,在幾十萬英鎊的利誘麵前,沒有約束力的承諾,並不能導致合作。這樣的事例在生活中並不少見,人們往往在道德上譴責背信一方的卑劣,但這並不改變競爭中的勝負,也不影響將來世界的麵貌。道德的譴責和標榜的作用隻不過向人們推介自己是個良好合作的對象,這一點誠實的人和騙子在表現上並沒有什麽區別。就像在這比賽中無法相信誰的承諾是可信的一樣。
另一個視頻顯示包含著善意和威懾的政治手腕,Nick強迫Ibrahim合作。http://www.youtube.com/watch?v=S0qjK3TWZE8&list=PL134E3457F7D2C2E7&index=30
視頻中的Nick表現出掌控局麵的能力,他首先強硬地宣布自己要選擇“騙取”這個優勢策略,附加上盤後平分交易的許諾。即使對方公平地建議雙方都選擇“平分”,他仍然強勢地堅持,他不會改變。並警告說如果對方也選擇“騙取”,兩人將一無所得。這就把一次博弈分成兩個階段:威脅和利誘。利誘的部分並沒有確實的保障,這和另一個視頻的承諾一樣,隻是給人一種希望。但是威脅的部分實實在在地粉碎了也許能占便宜的幻想,讓對方隻能在事後可能平分和兩敗俱傷中做選擇,把球踢到對方。這是序貫博弈中常見的威脅策略。強勢者常常堅持自己掌控命運,而不是寄希望於對方的誠信。國際關係中,例如美國“透明”的國際政策,“清晰”的戰略,中國關於在台獨時使用武力的立法等等都是使用這個策略。在社會上則是掌控局麵政治手腕。
這個視頻更精彩的是:在揭曉時Nick並沒有堅持他強硬聲明的“騙取”策略,而是選了“平分”。這是因為在威脅和利誘麵前,理性的對方應該選擇“平分”,但不排除對方意氣用事。Nick自己選擇了“平分”,在對方理性時,隻不過將許諾的部分當場對現,在對方不理性時雖然讓對方得到好處但並不增加自己的損失,還因為雙方前麵的許諾存在事後平分的可能。這時“平分”成了他的優勢策略。這是一種寬容的表現。Nick的策略包含了善意、威脅、寬容和明朗的特點。
這兩個視頻說明了:在巨大利誘麵前威脅比承諾更有效。有政治手腕能掌控局麵的人,可以利用溝通來傳遞信息,將原來兩難的選擇轉化成兩個誘導的選擇,來走出困境,這也是政治和商業競爭中已被人使用的技巧。
博弈的結果是由局中的各方來決定的,沒有一種策略能夠保證對方一定合作。學習博弈是讓自己在複雜的局勢中做個明白人,選擇最為有利的策略。
金球賽引起社會科學研究者的興趣,有一群經濟學者對這些比賽進行分析,發現選擇“平分”的人高達53%,這雖然隻導致略高於四分之一的合作結果,但這已經大大高於囚徒困境中的預期。
怎麽在重複囚徒困境博弈中走向合作,我在“從自私走向合作”的科普博文中已有詳細論述。無名氏定理證明了:含有威脅的策略是走出囚徒困境的必要條件。走向合作的最好策略特征是善意的,會報複的,寬容的和明朗的,缺一不可。這也是在人際關係中能夠維持合作的最好準則。