榕城老應

用調侃去書寫思考,以故事來敘述理論。
個人資料
正文

也談'意想不到的老虎'(續)

(2011-05-21 21:00:15) 下一個

       榕城老應

貼出《也談“意想不到的老虎”》後,有人說:“如果這個老虎是‘意想不到的’,那麽無論麥克說什麽,國王都可以說他不對。因為能被你猜著了,就不是意想不到的。”

如果那樣,國王是不講理了。這首先必須弄清“意想不到”這個比較含糊話的含義,故事中國王的這句話其實隻是提個醒,有“諒你也想不到”的意思。並不是用它來判決麥克的答案。實際上,答案的對錯是由預先關在房間裏老虎的事實來驗證的。

所謂的悖論,指推理的結論與常識相矛盾,卻不能發現邏輯上的漏洞。破解悖論不是說明結果是多荒謬,而是要沿著推理的思路指出錯在什麽地方。悖論的價值在於促進人們思考。

這個悖論在這幾十年中外學術期刊上都有些論文來分析。在邏輯學,認知科學,哲學和博弈論上都有些討論。在英文上多數以“Surprise Examination” 或 “Unexpected Hanging Paradox”為題。

為了消除故事其他情節帶來的誤解,我將“Surprise Examination”的故事介紹如下,它們內涵是完全一樣的。

老師向學生宣布下星期一到五的某一天,有一個意想不到的考試。學生想:如果考試在星期五,那從一到四都沒有考試。到了星期五,這個考試就不是意想不到的。所以不可能在星期五。星期五被排除了,剩下四天。按照同樣的邏輯推理,星期四,三,二和一也都不可能,所以認為沒有考試。結果考試在星期三舉行,這是學生意想不到的。


上一個帖子說到,這句“意想不到的”提醒純屬忽悠,它和老虎在這五間之中命題不相容。麥克自作聰明用它作為依據來推理,結果是你要推出什麽結論都可以,不過是蒙人蒙己。世上的大道理係統也包含許多不相容的命題。所以麥克要講出“婚姻自主,民主人權”的大道理,國王也可以用“女兒幸福,家長把關”的大道理頂回去。這些都是從大道理集合中合乎邏輯中推理來的,隻要公主還愛麥克,又不想和老爸鬧翻,誰都不虧理。大道理碰到明白人都是說不出結果來的,要不世界上怎麽不缺戰爭呢?

國王和麥克都是明白人,不玩嘴皮子了,還是實力對撼來得真確。文明一些,就賭個輸贏。這個故事的議題就從邏輯的問題轉為博弈的問題了。

要最不費什麽心思的賭賽就是:國王隨便將老虎關一個房間。麥克猜一次,有20%機會中獎,純粹碰運氣,沒有誰蒙誰的問題,就是沒有什麽技術含量,對麥克也不公平。要是國王還想考究麥克的智商,那就要有個比賽規則。麥克可以猜多次,直到見著老虎。要猜著見了老虎,10分;沒猜著見了老虎,負10分;沒老虎說有,扣些分,比如說M分,接著猜。最後看積分正負定輸贏。我們來看看這個博弈該怎麽玩,扣分M該多少才公平。

國王沒什麽花招可用,必須預先將老虎放入一個房間,策略分別記為1,2,3,4,5,對應著把老虎放在那個房間。麥克當然可以從頭到尾每個房間都說有老虎,但是老虎要是在比較後的房間,猜不中扣分很多,顯得傻,未必是最好的策略。如果前麵房間都沒有,後麵有的概率就較大了,所以沒有前麵說有,沒猜中,後麵的房間又猜沒有的道理。因此麥克比較現實的策略是:1從頭開始都說有,直到猜中為止;2從第二間開始猜有,直到猜中為止;如此3,4,5類推。比如說國王的策略為4,麥克的策略為3,意味著國王把老虎放在第四個房間,麥克在第一,二房間都說沒有,從第三個房間開始說有老虎,丟了M分,第四個房間蒙著了得10。這個對局麥克的得分就是10-M,把這個數值放在博弈支付矩陣的第三行第四列中。這是一個零和的博弈,國王的得分是麥克的負值。我們可以寫出麥克博弈支付矩陣如下。

      1     2         3         4           5
1   10  10-M  10-2M 10-3M  10-4M
2  -10  10       10-M  10-2M  10-3M
3  -10 -10       10       10-M   10-2M
4  -10 -10       -10     10        10-M
5  -10 -10       -10     -10       10

從這個矩陣可以看出,除非麥克蒙錯了不受罰(M=0),不存在著優勢策略。也就是說在這個問題上別指望國王和麥克有什麽策略一定比別的高明。

公主說:“國王和麥克如果隨機選策略,他們的數學期望是這個博弈的平均分,它是矩陣裏所有分量都加起來除25。M=2.5 時這個平均分為零,這個最公平。”

國王如果同意這個數,就被公主忽悠了。因為麥克這時可以選第一個策略,就是每個房間前都說有老虎,無論老虎在哪個房間,都不會是負值,這就穩操勝卷了。

國王說:“我明白了,這第一個策略優勢太大,必須加大扣分懲罰力度才行。M=5時,這個策略的平均分是零,才合理。”

麥克說:“要那樣,我所有策略沒有一個是正的均值,這能合理嗎?真正合理的M值,必須使得你和我全部采用最好的策略時得分是零。”

對於這個博弈,我們知道,雙方都沒有優勢策略和純策略的納什均衡,隻有一個混和策略的納什均衡。這時候M=3.78,國王的最優策略是以16%,13%,11%,10%,50%的概率把老虎方進房間序號1,2,3,4,5。麥克是以50%,10%,11%,13%,16%的概率選取他的策略1,2,3,4,5。這時候的得分的數學期望為零。

這是按照博弈理論計算出來的公平記分規則和雙方最為明智的策略。

國王和麥克不論是采用什麽概率分布的混合策略,在實現時必定還是取了一個具體的策略。按照概率取定這個策略的過程意味著放棄邏輯的判斷而將命運交付給卜爻的決定,這難道就是以科學理論論證出來的最為理性的回答?

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.