閑聊概率論

來源: chenm 2022-12-11 14:16:30 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (10844 bytes)


1) Chevalier De Mere 問題

這位老兄提出投擲 4 次骰子數字 6 出現的概率和投擲 24 次一對骰子數字對 (6, 
6) 出現的概率是相同的。要注意的是投擲一對骰子是投擲一對相互獨立集合係列。

投擲一次骰子數字 6 不出現的概率是 5/6 ,而投擲一 次一對骰子數字對 (6, 6) 
不出現的概率是
35/36。由此,投擲 4 次骰子數字 6 出現的概率是:1 - (5/6)^4 = 0.516
而投擲 24 次一對骰子數字對 (6, 6) 出現的概率是:1 - (35/36)^24 = 0.491
投擲 4 次骰子數字 6 出現的概率比投擲 24 次一對骰子數字對 (6, 6) 出現的概
率高。

2) 伯特蘭盒子問題

現有三個盒子,一個裝有兩金幣(G);一個裝有一金幣(G)和一銀幣(S);一個裝有兩
銀幣(S)

--------    ---------    ----------
| G G|     | G S |     | S  S  |
--------    --------     ----------

一個人隨機地抽到一個盒子,從中隨機地摸出一個硬幣。如果是一個金幣(G),請問
在相同盒子拿到金幣(G)的概率有多大?

有人認為 概率是 1/2。理由是:接下來 隻有 GG盒子和GS盒子含有金幣,對於兩盒
子能拿到金幣(G)的概率是相同的,都是 1/2。

有人認為 概率是 2/3。理由是: GG盒子和GS盒子含有金幣,原始時對於兩盒子能
拿到金幣(G)的概率是相同的,都是 1/2。但是,如果你選了GG盒子,事實上已經確
定能拿到金幣(G)的概率是1; 而如果你選了 GS盒子,能拿到金幣(G)的概率仍是 1/2。

用貝葉斯公式計算:

P(GG|seeG)=P(seeG|GG)*(1/3) / (P(seeG|GG)*(1/3) + P(seeG|SS)*(1/3) + P(seeG|GS)
*(1/3))
= 1 / (1 + 0 + 1/2 ) = 2/3
 
概率論的“幾何概率”(幾何概型)曾給早期數學家帶來麻煩:如投標(或射擊)擊中
2環,3環等導致概率為 1/無窮大 或 無窮大/無窮大。不得不將離散型隨機變量概
率分布改為連續型隨機變量概率均勻分布。

參考書:

A M Mathai, "An Introduction to Geometrical Probability: Distributional 
Aspects with Applications"

3) 布豐投針問題

設我們有一個以平行且等距木紋鋪成的地板,現在隨意拋一支長度比木紋之間距離
小的針,求針和其中一條木紋相交的概率。
     |             |
     |---- t ----|
     |             |
設針的長度為 l ,平行線之間距離 t 。x 為針的中心與最近平行線的距離。a 為
針和線之間夾角(銳角)。
x -- [0, t/2] ,  均勻分布,其概率密度函數為 2/t
a -- [0, pi/2], 均勻分布,其概率密度函數為 2/pi

x, a 兩者結合,概率密度函數為兩者的積:4/(t* pi)

當 x <= l/2 sin(a),   針和線相交。
積分後 可得概率P: 2l/(t* pi)

(“短針”情況,l <= t )
P = integration (0, pi/2) integration (0,  l/2 sin(a)) (4/(t* pi) dx da) 
= 2l/(t* pi)

據說計算結果與坐標係有關(直角坐標係或極坐標係)。

4)伯特蘭悖論

考慮一個內接於圓的等邊三角形。若隨機選圓上的弦,則此弦的長度比三角形的邊
較長的概率為何?

伯特蘭給出了三個方法,全是有效的,但導致的結果都不相同。

方法1
「隨機端點」方法:在圓周上隨機選給兩點,並畫出連接兩點的弦。為了計算問題
中的概率,可以想像三角形會旋轉,使得其頂點會碰到弦端點中的一點。可觀察到,
若另一個弦端點在弦會穿過三角形的一邊的弧上,則弦的長度會比三角形的邊較長。
而弧的長度是圓周的三分之一,因此隨機的弦會比三角形的邊較長的概率為1/3。

方法2
「隨機半徑」方法:選擇一個圓的半徑和半徑上的一點,再畫出通過此點並垂直半
徑的弦。為了計算問題的概率,可以想像三角形會旋轉,使得其一邊會垂直於半徑。
可觀察到,若選擇的點比三角形和半徑相交的點要接近圓的中心,則弦的長度會比
三角形的邊較長。三角形的邊會平分半徑,因此隨機的弦會比三角形的邊較長的概
率亦為1/2。

方法3
「隨機中點」方法:選擇圓內的任意一點,並畫出以此點為中點的弦。可觀察到,
若選擇的點落在半徑隻有大圓的半徑的二分之一的同心圓之內,則弦的長度會比三
角形的邊較長。小圓的麵積是大圓的四分之一,因此隨機的弦會比三角形的邊較長
的概率亦為四分之一。

因博文不好畫圖,要看插圖請參考原LINK:
https://en.wikipedia.org/wiki/Bertrand_paradox_(probability)

引起悖論的原因:有人認為是概率分布的問題。上述三種方法會給出不同弦的中點
分布。
方法3 給出一個均勻分布。
有人認為提出問題應該 WELL-POSED 。必須具有轉換不變量。
這問題也發生在統計力學和氣體物理學。

5) 酒/水悖論
先來介紹一個智力測試題: 酒和水混合問題。
我們有兩個桶,桶1裝有酒,桶2裝有相等容量的水。我們從桶1取出一杯酒,放到桶
2。然後我們從桶2取出一杯混合酒水,放到桶1使兩桶有相等容量的液體。請問這時,
桶1酒的含量百分比,桶2水的含量百分比,哪個更高? 答案是相等的。並且,不管
上述過程進行了多少次,是否有攪拌,杯的大小,隻要結果是兩桶有相等容量的液
體,答案都是相同的。

有一桶酒和水混合的液體,設 x 為酒和水之比,即 x = 酒/水。已知 x 的範圍是
 
1/3 <= x <= 3 。我們尋找 x <= 2   概率 P。
因為沒有足夠信息可找到嚴格的解答,我們采用“無區別原則”,假定 x 均勻分布。

對 x 來說,中點值是 5/3,兩邊間隔是 4/3 。

1/3---5/3---1/3

等間隔有相同50%的概率

Prob ( x <= a ) = 1/8 * (3a - 1)

P = Prob ( x <= 2 ) = 5/8

當然也可以設  y = 水/酒,y = 1/x 。y 的範圍是 
1/3 <= y <= 3 。
對 y 來說,中點值也是 5/3,兩邊間隔也是 4/3 。
但是 x 的等間隔有相同50%的概率成問題;x 的 5/3 對應於 y 是 3/5 。

1/3--1/2--3/5---5/3---1/3

Prob ( y => a ) = 3/8 * (3 - a)

P = Prob ( x <= 2 ) =  Prob ( y >= 1/2 ) = 15/16

很明顯,兩個 P 有不同的值。
“均勻分布”意味累積分布是線性的,但 y = 1/x 不能同時是線性,因此 x, y 不
能同時是均勻分布。

6)最大似然估計法與太陽是否明天升起?
最大似然估計法就是根據試驗結果估計參數最大可能值。
袋中有白球和黑球(不知數量),從中取出 80 個球,發現 白球出現 49 次,W = 49;
而黑球出現 31 次,B = 31。最大似然估計為
陽城
L(p | W = 49, B = 31 ) = P(W = 49, B = 31| p) = combination(80, 49) * p^49 
* (1-p)^31

將上式對 p 求導,令求導式等於 0,得到

p^48 * (1-p)^30 * (49(1-p) -31p)) = 0

p 的最大似然估計為 49/80

對伯努利試驗,成功次數為 k ,試驗總數為 n ,p 的最大似然估計 p'

 p' = k/n                     (a)

拉普拉斯提出另一種最大似然估計法,考慮到下一次期望概率就是以前 p 的期望值。


P (Xn+1 = 1 | X1 =x1, X2 = x2, ..., Xn = xn) = E( f(p| X1 =x1, X2 = x2, 
..., Xn = xn)) 
= (k+1)/(n+2)                  (b)
k = x1+ x2+ ... + xn ,

因此上述取球試驗,根據 (b),p 的最大似然估計為 50/82 。
拉普拉斯提出了太陽明天升起問題。他認為在過去的 5000 年(5000 * 365.25 天),
太陽每天升起。根據 (b),太陽明天升起的概率大約為 1826200 比 1 。

在我以前寫的博文“你的判斷正確嗎?”曾提到“基礎概率繆誤"。
這裏補充一個與此有關的

7) 法庭取證問題

一起凶殺案,現場證據不多,但死者掙紮時疑似抓到了來自凶手身上的皮膚,實驗
室鑒定結果發現被抓到的嫌疑犯與之相符,於是嫌疑犯被起訴。檢察官說,這種檢
驗準確率為 99.9% 因此嫌疑犯有罪的概率是999/1000。
正確的計算方法要使用貝氏定理。

P(I|E)=P(E|I) * P(I)/P(E)

P(E) = P(E|I) * P(I) + P(E|~ I) * (1 - P(I)) 

P(E|I) :當嫌疑犯是無辜的 嚴重的證據被發現的概率

P(I|E) :盡管有證據嫌疑犯是無辜的概率

P(I) :嫌疑犯是無辜的先驗概率

P(E):證據被發現的先驗概率

P(E|~ I) :證據證實嫌疑犯有罪的概率

嫌疑犯有罪的先驗概率若為P(I),則嫌疑犯確實有罪的概率為(0.999*P)/(0.999*P+0.001*
(1-P)),而P(I)值是變的。這是“引用類問題”,即不同的人可能提供不同的P(I)。
假定對嫌疑犯不利的 P(I)為1/1,000,000,代入上式可知嫌疑犯確實有罪的概率低
於1/1000。

 




更多我的博客文章>>>

加跟帖:

  • 標題:
  • 內容(可選項): [所見即所得|預覽模式] [HTML源代碼] [如何上傳圖片] [怎樣發視頻] [如何貼音樂]