1) Chevalier De Mere 問題
這位老兄提出投擲 4 次骰子數字 6 出現的概率和投擲 24 次一對骰子數字對 (6,
6) 出現的概率是相同的。要注意的是投擲一對骰子是投擲一對相互獨立集合係列。
投擲一次骰子數字 6 不出現的概率是 5/6 ,而投擲一 次一對骰子數字對 (6, 6)
不出現的概率是
35/36。由此,投擲 4 次骰子數字 6 出現的概率是:1 - (5/6)^4 = 0.516
而投擲 24 次一對骰子數字對 (6, 6) 出現的概率是:1 - (35/36)^24 = 0.491
投擲 4 次骰子數字 6 出現的概率比投擲 24 次一對骰子數字對 (6, 6) 出現的概
率高。
2) 伯特蘭盒子問題
現有三個盒子,一個裝有兩金幣(G);一個裝有一金幣(G)和一銀幣(S);一個裝有兩
銀幣(S)
-------- --------- ----------
| G G| | G S | | S S |
-------- -------- ----------
一個人隨機地抽到一個盒子,從中隨機地摸出一個硬幣。如果是一個金幣(G),請問
在相同盒子拿到金幣(G)的概率有多大?
有人認為 概率是 1/2。理由是:接下來 隻有 GG盒子和GS盒子含有金幣,對於兩盒
子能拿到金幣(G)的概率是相同的,都是 1/2。
有人認為 概率是 2/3。理由是: GG盒子和GS盒子含有金幣,原始時對於兩盒子能
拿到金幣(G)的概率是相同的,都是 1/2。但是,如果你選了GG盒子,事實上已經確
定能拿到金幣(G)的概率是1; 而如果你選了 GS盒子,能拿到金幣(G)的概率仍是 1/2。
用貝葉斯公式計算:
P(GG|seeG)=P(seeG|GG)*(1/3) / (P(seeG|GG)*(1/3) + P(seeG|SS)*(1/3) + P(seeG|GS)*(1/3)) = 1 / (1 + 0 + 1/2 ) = 2/3
概率論的“幾何概率”(幾何概型)曾給早期數學家帶來麻煩:如投標(或射擊)擊中
2環,3環等導致概率為 1/無窮大 或 無窮大/無窮大。不得不將離散型隨機變量概
率分布改為連續型隨機變量概率均勻分布。
參考書:
A M Mathai, "An Introduction to Geometrical Probability: Distributional
Aspects with Applications"
3) 布豐投針問題
設我們有一個以平行且等距木紋鋪成的地板,現在隨意拋一支長度比木紋之間距離
小的針,求針和其中一條木紋相交的概率。
| |
|---- t ----|
| |
設針的長度為 l ,平行線之間距離 t 。x 為針的中心與最近平行線的距離。a 為
針和線之間夾角(銳角)。
x -- [0, t/2] , 均勻分布,其概率密度函數為 2/t
a -- [0, pi/2], 均勻分布,其概率密度函數為 2/pi
x, a 兩者結合,概率密度函數為兩者的積:4/(t* pi)
當 x <= l/2 sin(a), 針和線相交。
積分後 可得概率P: 2l/(t* pi)
(“短針”情況,l <= t )
P = integration (0, pi/2) integration (0, l/2 sin(a)) (4/(t* pi) dx da)
= 2l/(t* pi)
據說計算結果與坐標係有關(直角坐標係或極坐標係)。
4)伯特蘭悖論
考慮一個內接於圓的等邊三角形。若隨機選圓上的弦,則此弦的長度比三角形的邊
較長的概率為何?
伯特蘭給出了三個方法,全是有效的,但導致的結果都不相同。
方法1
「隨機端點」方法:在圓周上隨機選給兩點,並畫出連接兩點的弦。為了計算問題
中的概率,可以想像三角形會旋轉,使得其頂點會碰到弦端點中的一點。可觀察到,
若另一個弦端點在弦會穿過三角形的一邊的弧上,則弦的長度會比三角形的邊較長。
而弧的長度是圓周的三分之一,因此隨機的弦會比三角形的邊較長的概率為1/3。
方法2
「隨機半徑」方法:選擇一個圓的半徑和半徑上的一點,再畫出通過此點並垂直半
徑的弦。為了計算問題的概率,可以想像三角形會旋轉,使得其一邊會垂直於半徑。
可觀察到,若選擇的點比三角形和半徑相交的點要接近圓的中心,則弦的長度會比
三角形的邊較長。三角形的邊會平分半徑,因此隨機的弦會比三角形的邊較長的概
率亦為1/2。
方法3
「隨機中點」方法:選擇圓內的任意一點,並畫出以此點為中點的弦。可觀察到,
若選擇的點落在半徑隻有大圓的半徑的二分之一的同心圓之內,則弦的長度會比三
角形的邊較長。小圓的麵積是大圓的四分之一,因此隨機的弦會比三角形的邊較長
的概率亦為四分之一。
因博文不好畫圖,要看插圖請參考原LINK:
https://en.wikipedia.org/wiki/Bertrand_paradox_(probability)
引起悖論的原因:有人認為是概率分布的問題。上述三種方法會給出不同弦的中點
分布。
方法3 給出一個均勻分布。
有人認為提出問題應該 WELL-POSED 。必須具有轉換不變量。
這問題也發生在統計力學和氣體物理學。
5) 酒/水悖論
先來介紹一個智力測試題: 酒和水混合問題。
我們有兩個桶,桶1裝有酒,桶2裝有相等容量的水。我們從桶1取出一杯酒,放到桶
2。然後我們從桶2取出一杯混合酒水,放到桶1使兩桶有相等容量的液體。請問這時,
桶1酒的含量百分比,桶2水的含量百分比,哪個更高? 答案是相等的。並且,不管
上述過程進行了多少次,是否有攪拌,杯的大小,隻要結果是兩桶有相等容量的液
體,答案都是相同的。
有一桶酒和水混合的液體,設 x 為酒和水之比,即 x = 酒/水。已知 x 的範圍是
1/3 <= x <= 3 。我們尋找 x <= 2 概率 P。
因為沒有足夠信息可找到嚴格的解答,我們采用“無區別原則”,假定 x 均勻分布。
對 x 來說,中點值是 5/3,兩邊間隔是 4/3 。
1/3---5/3---3
等間隔有相同50%的概率
Prob ( x <= a ) = 1/8 * (3a - 1)
P = Prob ( x <= 2 ) = 5/8
當然也可以設 y = 水/酒,y = 1/x 。y 的範圍是
1/3 <= y <= 3 。
對 y 來說,中點值也是 5/3,兩邊間隔也是 4/3 。
但是 x 的等間隔有相同50%的概率成問題;x 的 5/3 對應於 y 是 3/5 。
1/3--1/2--3/5---5/3---3
Prob ( y => a ) = 3/8 * (3 - a)
P = Prob ( x <= 2 ) = Prob ( y >= 1/2 ) = 15/16
很明顯,兩個 P 有不同的值。
“均勻分布”意味累積分布是線性的,但 y = 1/x 不能同時是線性,因此 x, y 不
能同時是均勻分布。
6)最大似然估計法與太陽是否明天升起?
最大似然估計法就是根據試驗結果估計參數最大可能值。
袋中有白球和黑球(不知數量),從中取出 80 個球,發現 白球出現 49 次,W = 49;
而黑球出現 31 次,B = 31。最大似然估計為
L(p | W = 49, B = 31 ) = P(W = 49, B = 31| p) = combination(80, 49) * p^49
* (1-p)^31
將上式對 p 求導,令求導式等於 0,得到
p^48 * (1-p)^30 * (49(1-p) -31p)) = 0
p 的最大似然估計為 49/80
對伯努利試驗,成功次數為 k ,試驗總數為 n ,p 的最大似然估計 p'
p' = k/n (a)
拉普拉斯提出另一種最大似然估計法,考慮到下一次期望概率就是以前 p 的期望值。
P (Xn+1 = 1 | X1 =x1, X2 = x2, ..., Xn = xn) = E( f(p| X1 =x1, X2 = x2, ..., Xn = xn))
= (k+1)/(n+2) (b)
k = x1+ x2+ ... + xn ,
因此上述取球試驗,根據 (b),p 的最大似然估計為 50/82 。
拉普拉斯提出了太陽明天升起問題。他認為在過去的 5000 年(5000 * 365.25 天),
太陽每天升起。根據 (b),太陽明天升起的概率大約為 1826200 比 1 。
在我以前寫的博文“你的判斷正確嗎?”曾提到“基礎概率繆誤"。
這裏補充一個與此有關的
7) 法庭取證問題
一起凶殺案,現場證據不多,但死者掙紮時疑似抓到了來自凶手身上的皮膚,實驗
室鑒定結果發現被抓到的嫌疑犯與之相符,於是嫌疑犯被起訴。檢察官說,這種檢
驗準確率為 99.9% 因此嫌疑犯有罪的概率是999/1000。
正確的計算方法要使用貝氏定理。
P(I|E)=P(E|I) * P(I)/P(E)
P(E) = P(E|I) * P(I) + P(E|~ I) * (1 - P(I))
P(E|I) :當嫌疑犯是無辜的 嚴重的證據被發現的概率
P(I|E) :盡管有證據嫌疑犯是無辜的概率
P(I) :嫌疑犯是無辜的先驗概率
P(E):證據被發現的先驗概率
P(E|~ I) :證據證實嫌疑犯有罪的概率
嫌疑犯有罪的先驗概率若為P(I),則嫌疑犯確實有罪的概率為(0.999*P)/(0.999*P+0.001*
(1-P)),而P(I)值是變的。這是“引用類問題”,即不同的人可能提供不同的P(I)。
假定對嫌疑犯不利的 P(I)為1/1,000,000,代入上式可知嫌疑犯確實有罪的概率低
於1/1000。