關於對策論的三個困惑

來源: 越吃越蒙山人 2024-05-06 09:44:36 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (16840 bytes)

對策論其實是人類行為進化過程中總結出來的互動策略,Dawkins在他所著《自私的基因》中有詳細介紹。幾年前川普和習近平會麵前,我寫過幾篇介紹對策論的文章,下麵我把它們合在一起發出來,供大家拍磚使用。

 

(一) 善良人的困惑

熟讀過《三國》的人都知道,羅貫中為了貶損曹操,講過這麽一個故事。

早年曹操為了躲避董卓的迫害,逃到了他的結義兄弟呂伯奢的家中。仁義豪爽的呂伯奢見了曹操非常高興,忙吩咐家人準備宴席殺豬款待,自己則騎了毛驢進城去沽酒。曹操坐聞堂後有磨刀之聲,疑其圖己,隨拔劍跳入殺其全家。等到呂家老小全都沒有了生息,曹操這才發現是錯怪人家了,於是他同屬下策馬出逃,行不到二裏,路遇呂伯奢驢鞍前橋懸酒二瓶,手攜果菜,操揮劍砍伯奢於驢下; 看到隨從們目瞪口呆的樣子,曹操發狠說道:寧教我負天下人,休教天下人負我也!

羅貫中筆下的曹操,生性陰險狡詐且又自負執拗,是一個人格非常極端的特例。在現實生活中,這麽殘暴凶虐的人畢竟極其罕見,但對於那種自私狹隘而又偏執蠻昧的人,我們還是要提防小心,一般情況下不要招惹他們,離他們遠遠的。這是因為,雖然自私和頑蠻都不是什麽好的品性,卻是我們每個人身上或多或少都會留有的本質。當它們單獨運作左右某個人的處世行為時,盡管不招人喜歡,但通常也不會造成什麽讓人非常憎恨惡心的局麵。隻有當事情走向極端,尤其是這兩種品性疊加運作時,事情的性質就開始變壞了。

對於非常自私的人,他們容不得別人比自己好,為人處事遵從我贏你輸的單邊法則,天天鑽營的就是要占盡天底下所有的好處,不能讓旁人得到一點便宜。即便這樣,也可能還不算不可救藥,因為所有的人都願意讓自己的利益最大化,這是本能。不過,無論如何,你還是不能走向偏執,極度自私再加上極端偏執,人就沒救了。人一偏執,意識就容易錯亂。本來刻在腦子裏的人生法則是:事事都要自己贏。結果,急火攻心時不知怎的,腦子裏的處事法則轉換成了:事事不讓別人贏。有了這樣一根筋的思維,做出的事情就容易變得簡單惡劣了,很多時候就是我不好你也別想好的雙輸邏輯。

今天看到網上有篇文章談及氣候變化帶來的影響,有人留言放話說,氣候變化地球完蛋,我們窮人不怕,要死大家一起死,這樣富人也跑不了。嗬嗬,這樣的同歸於盡不在乎雙輸的豪邁氣質,讓我感到沒有絲毫的陌生。這不就是曾經大肆泛濫過的,“無產階級大無畏的英雄主義氣概”嗎。隻不過,在這個時代這種流氓無產者的無賴蠻橫還能大行其道,讓我著實對文明道德的演變大有無奈之感。

其實人類遵從的道德規範,那些最基本的都是橫跨世界東西相通的。而且它們的出現並不僅僅是人類文明降生的附帶之物,有許多是從我們遠古祖先們,在狩獵采食過程中相互依存相互配合而感悟發展起來的。所以,無論東方還是西方,早早的就有先賢們把那些基本的善惡標準標識出來,教誨眾生了。比如說,在我們中國文化裏,兩千多年前,就有孔子總結說,具有仁德的人,應該己所不欲勿施於人。緊跟著,孟子也站出來告訴大家,老吾老以及人之老,幼吾幼以及人之幼。。。等等。這些都是人之生存活動於社會的行為規範,是聖人們認為在當時的社會環境下,要維護發展文明的生態而必須建立的道德準則。

類似這樣的善惡標識,在西方文明的演進過程中,也是有人早早地就明鑒真諦了。自公元一世紀起傳頌於世的顯現耶穌教誨的《新約》馬太福音中,就寫有這樣淺顯通白的道理:你想要別人怎麽待你,你就要怎麽對人。(Do unto others as you would have them do unto you)。把這話稍加改動, 就是我們上麵提到的孔子的名言,己所不欲勿施於人。(Do not do unto others what you would not have them do unto you)。而這樣兩句淺顯直白的語句,就是兩千多年來,西方社會勸導與人行善要遵守的金科和銀律。

不過,金科銀律再高尚再正確,它也不是法律,你沒有辦法強製所有的人都格守遵從。比如說,你的革命情操高尚,待人接物時總是懷揣聖賢的教誨,善解人意虛懷若穀。但是對方卻是一個混混,一個極其自私狡詰的家夥,或是一個像曹操那樣的奸雄。你對他好,他卻愛耍小聰明,對你反而是以己所不欲施之於人,總想著你輸他贏的最終結局。在這種情況下,你應該怎麽辦呢?不能總是讓好人不得好報吧。於是,善良的人就產生了一種困惑,一種讓人不知道是應該是以真誠為先還是以警覺為先的困惑。

(二) 囚徒的困惑

人,活在世上這一輩子,不知道要經曆多少挑戰作出多少選擇,而且每一次選擇都可能對其以後的人生軌跡有著難以盡述的影響。雖然說我們人人都有自私的基因,想把自己的利益最大化,但沒有人能有足夠好的運氣,能夠保證每一次選擇都是最為利己的。很多時候,利益最大化選項的背後隱含著的也是風險最大。所以,追求極致,未必對所有人都是一個理所當然的選擇。好在我們人類的生物思維體係中,有一個能自我修飾自我調整的回路,這就使得我們能夠在上一次的選擇之後,觀察外界的反饋,從而獲得經驗獲得教訓獲得獎勵,並以此作為下一次抉擇的依據。

上世紀五十年代有兩位美國數學家設計了一個遊戲,以期通過參與者相互之間的互動,來考察人際間交往信任合作的關係。這個遊戲就叫“囚徒的困惑”。它的設計思路是這個樣子的:假如你和你的一個朋友被警察指控犯了重罪(當然,你們可能是真幹了點什麽,也可能是被誣陷的,實際什麽都沒幹),你們被捉進了監獄。在你們還沒來得及相互詢問溝通一下情況,警察就把你們隔離開來開始單獨審訊了。

警察剛一開始要做的,肯定是依照慣例,向你交代明白了黨的坦白從寬抗拒從嚴的偉大政策, 而且厲聲告訴你,你的朋友在無產階級專政鐵拳的震懾下,早就放棄了抵抗,把所有的一切都招了,他指控你也犯了罪。(這是什麽朋友啊。不過現實中肯定是有這樣的人的。另外,警察說的可能是真的,也可能是嚇唬你的謊話,這事在哪兒都一樣)。接下來事態的發展,會根據你們不同的應對產生以下四種可能的結果:

A. 如果你不承認被指控的罪行,而且你的同伴也否認了指控,這案子就很難站得住腳,最終的判決會是很輕的,這對你和同伴來說算是雙贏的結局,在博弈理論中被稱作是合作。當然,在當時的情形下,你根本不可能知道你的同伴會怎麽做。

B. 如果你坦白承認了罪行,而且你的同伴也坦白承認了罪行,這樣,警察沒花太大的力氣就做實了案子,大功一件。被認定是犯了罪的你們兩人肯定是逃脫不掉法律的製裁的。當然,政府也是說話算話的,他們還是會落實坦白從寬的政策,讓你們實際得到的懲罰比理應得到的輕了不少。但不管怎麽說,對你和你的同伴而言,這還是算作一種雙輸的結局。

C. 但是如果你聲稱無辜拒絕認罪,而你的同伴卻在另一間屋子裏全都承認了。那麽,這樣情形帶來的結局對你最為不利,你會得到最為嚴厲的定罪懲罰,而你的同伴會得到最輕的甚至沒有處罰。於是,你會受到雙重打擊,最為悲催;而你的同伴或說是朋友,卻背叛了你,在博弈理論中,那會被稱為變節。這是你輸他贏的結局。

D. 與C類同,如果你是變節的一方,你的朋友是死不鬆口的一方,他最終會得到最倒黴的結局,是他輸你贏。

好了,知道了黨的政策,和不同情況可能帶來的結果後,讓我們再把利弊認真梳理一下。首先,如果你和你的朋友(同夥)很默契,合作得天衣無縫,無論是拒絕指控還是承認罪行都能做到步調一致,你們兩人就都能避免最壞的可能結局。但是,如果你要是想求穩妥,不追求極端的滿意結果,也避免最差的結果,就老老實實認慫,承認罪行是你們幹的,這也是條不差的選擇;而且,在這種情況下,如果你的同夥負隅頑抗,拒絕認罪,那你會得到意外獎賞,沒準最後脫離懲罰也未可知。

把這些都想清楚了,你應該能意識到,無論你的同伴怎麽做,你的最優選擇其實是變節而不是追求與他同進同退口供一致的合作。同樣,如果你的同夥不傻,他也會得到相同的推論。也就是說,按照理智的推理,追求雙贏結果的風險是最大的,它有可能對你個人的最終結果是最差,造成你輸他贏的結局。為了避免這一最糟糕的情況出現,你和同伴最可能作出的決定應該都是變節。所以,如果你們兩個人都是冷靜理性的,很大的可能,在一開始你們就已經決定要雙輸了。這就造成了所謂的“囚徒的困惑”。

接下來,讓我們進一步設想一下。如果這個博弈過程有重複做下去的可能,局中人的行為會發生什麽樣的變化呢?這樣的情形實際是增加了一個反饋機製,它讓參與者能夠根據自己受到的懲處,來推測同伴上一次的行為,並以此來反思以前的決定及調整下一步的選擇策略。於是,一方參與者的行為對另一方來說就是一個返喂伺服信號,你的變節可以造成對方下一次的變節,你一次自我犧牲,可能就會給以後的長期合作埋下伏筆。其實這也是一個隱藏著的自然規律。

三十年前,密執根大學的社會心理學教授Robert Axelrod,使用計算機把這個博弈遊戲在加多了人加多了回合的情形下推演了下去,他發現,贏得最終勝算的策略好像很簡單,無論你被別人利用了多少,被占了多少便宜,你都應該尋求合作,而不是變節,也就是按照我們上一篇講到的金色定律來出牌:你想別人怎麽待你,你就怎麽待人。高尚贏得勝利,很好。

但是,當這些參與者之中混進了像是曹操那樣的人物的時候,不管別人怎麽行善,他都按自己能得到最大利益的可能性來出牌,金色定律策略就失效了,因為曹操做出來壞事後,要是得不到負麵的反饋,他就會永遠這麽做下去,一顆老鼠屎就會壞了一鍋粥。

所以,為了讓群體係統的長期共贏局麵演變出來,必須引入另一個處事原則——銅色定律和環環相報原則。

(三)環環相報的困惑

在世人矚目的川習阿根廷晚宴還沒有開吃之前,白宮為了滿足好事者的獵奇心理,事先發布了宴席的菜單。這世界上能讓我認真的事情不多,美酒佳肴便是其中之一。當時,我仔細研究了公布出來的菜品配酒,覺得賓主在舉杯客套之後,未必就能盡興。果然,現在看了雙方放下刀叉抹了下嘴巴後說出的話,覺得盡管確是給人有不少安慰的意思,但等到芸芸大眾們熱熱鬧鬧地過完聖誕和春節,回來再看,事情會不會翻盤還很難說。

duicel其實,對這事情的推理也不複雜。像是川總,雖然說他是愛吃牛排,但你不給他備上一兩個BigMac填補一下,他肯定是覺得沒吃踏實。反觀習總,什麽沙拉牛排甜餅這些洋玩意,估計不會太合他的胃口;好在有酒,可那種洋酒也不是他的最愛,沒有一盅茅台在手邊,那能叫吃飯嗎?當然最好還得備上一盤豬肉大蔥餡包子和幾瓣糖蒜,這樣細軟溫滑的吃了才舒坦。所以,大佬們肯定是都有憋屈,沒吃好,這事情還得有反複,還得再吃。

當然,在這裏我說的是玩笑話。貿易戰這事情肯定沒有這麽簡單,梁子是早早地就結下了。我記得二十年前,美國勉強同意中國走進WTO是附帶了一些條件的,比如說,金融服務業的按時開放等等。當時中國為了早日融入國際體製,趕上那班提速發展的快車,也是下了狠心咬牙承諾了一些事情的。二十年一晃就過去了,我們有沒有說話算話兌現了承諾呢?雖然現在回頭去追究那些細節也不是什麽難事,但看看中國現在隱忍吞聲的姿態,大家就對這事情的虛實就能猜出個八九不離十了。基本上可以說,當初美國雖是滿懷狐疑,但還是打了一張信任的牌,給了中國機會。現在,川普覺得上次的善意沒能帶來回報,美國吃虧了,他要開始打第二張牌了。當然,這第二張牌的上麵,寫的肯定不是信任二字,而是報複。到目前為止,美國發動貿易戰的招式,還是基本沿襲西方道德規範中銅色定律所指定的原則的。即,把他們上次做在你身上的事,做還回給他們(Do unto others as they do unto you),剛好應了中國那句古話,以其人之道還治其人之身。

就像我們在上篇講到的,對於君子,最好的共贏之道是大家都明白金色和銀色定律,並一同去遵守它。但是,在有反饋機製存在的囚徒博弈遊戲中,如果有人不按常理出牌,使用你輸我贏的單邊取巧策略,這時候,最佳的對應手段就是祭出上述的銅色定律報複。這其實是一種環環相報(Tit-for-Tat)手段,它的目的是讓對方知道,你上一次的決定損害到我的利益了,我也要損害你一回。如果對方不是有意與你為敵,他得到這個反饋信號後,就會隨機調整策略。

別人不是執意與你為敵而作出的隨意選擇,被稱之為是一種鐵色定律指導下的行為。鐵色定律是說,在別人這麽待你之前,你隨意待人(Do unto others as you like, before they do it unto you)。但當你的隨意傷害到別人時,你得到對方的反彈,迷途知返,回到正軌,以後大家還是朋友,還能共享雙贏。但是, 怕就怕對方也是小人之心,報複的緣由不清或出手過重,這樣給出的信號到了對手這邊時,已經是漂移放大過的了。於是誤會更重,冤冤相報糾結無解,最終走向無邊無際的雙輸結局。

回來再看一下目前中美劍拔弩張的貿易戰。好的消息是說,中國好像不像以前宣傳的那樣強硬了,起碼那邊不再號召以牙還牙了。這可能是一個走出環環相報死結的契機,即中國這回做一次讓步,讓美國知道在己方祭出銅色定律報複之後,中國回到了對外使用金色定律的理性軌道上來了。以前的作為隻是對西方遊戲規則的不了解,錯誤地使用了一次鐵色規則。以後就會是你好我好大家都好的雙贏局麵了。

嗬嗬,還是那句話,事情一定沒有這麽簡單。這裏不好的消息是,美國有點不依不饒。美國的報複在中國看來,也未必就一定在道義上是完全正確的,這裏肯定是有不能自圓其說甚至自我前後矛盾的地方。你定的規則,被別人取巧利用,一方麵表明對方做事不夠誠信,另一方麵也說明你自己能力有欠缺的地方。要是一股腦把屎盆子都往別人頭上扣,持強鬥狠的後果可能就會埋下不滿和怨憤,最終到底會是走向兩情相願的合作還是走向兩情相怨的對峙或雙輸,就還真不是一個幾句話說得清楚的事情了。

 

(後記:寫完這篇後聽到新聞說,加拿大警方根據美國的要求,逮捕了華為CFO,這就讓事情的複雜性就又多了幾層。也讓人擔心中美戰略合作夥伴的關係能否繼續。總之,世界越來越不平靜!)

 

所有跟帖: 

將人與人之間的關係延伸到國與國會產生悖論 -波粒子3- 給 波粒子3 發送悄悄話 (0 bytes) () 05/06/2024 postreply 10:20:44

有可能,畢竟群體要複雜得多。但還是應該有一定的借鑒意義吧 -越吃越蒙山人- 給 越吃越蒙山人 發送悄悄話 越吃越蒙山人 的博客首頁 (0 bytes) () 05/06/2024 postreply 10:26:24

群體的利益與個人的利益可能衝突 -波粒子3- 給 波粒子3 發送悄悄話 (0 bytes) () 05/06/2024 postreply 10:35:34

講的是群體對群體,不是群體對個體。 -越吃越蒙山人- 給 越吃越蒙山人 發送悄悄話 越吃越蒙山人 的博客首頁 (0 bytes) () 05/06/2024 postreply 10:49:33

三種可能都要考慮 -波粒子3- 給 波粒子3 發送悄悄話 (0 bytes) () 05/06/2024 postreply 10:56:14

我以為中國隱忍吞聲的姿態不一定是山人猜出的那個八九不離十,美俄之間要是同樣的反應這樣猜才八九不離十:) -snowandlotus- 給 snowandlotus 發送悄悄話 snowandlotus 的博客首頁 (57 bytes) () 05/06/2024 postreply 16:57:19

哎,大國博弈有時候挺戲劇性的。這是六七年前的事了,那時候還愛關注這些,現在看都懶得看了。 -越吃越蒙山人- 給 越吃越蒙山人 發送悄悄話 越吃越蒙山人 的博客首頁 (0 bytes) () 05/06/2024 postreply 18:11:30

這類數學理論跟電軌悖論(一邊一人 ,一邊五人)之類的哲學問題的缺失是一樣的: -中間小謝- 給 中間小謝 發送悄悄話 (335 bytes) () 05/06/2024 postreply 18:43:03

我傾向認可你所說的 ,however -越吃越蒙山人- 給 越吃越蒙山人 發送悄悄話 越吃越蒙山人 的博客首頁 (216 bytes) () 05/06/2024 postreply 19:28:19

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”