正文

閑聊概率論1

(2023-01-10 13:56:20) 下一個

(1)  St. Petersburg 問題

有兩位玩家 A 和 玩家 B,同意玩一遊戲。玩家 A 被要求擲一公平硬幣,直到擲到
出現正麵為止。假設 玩家 A  擲了 k 次,玩家 B  同意付 2^(k-1) 美元。
很明顯,期望值 E = (1/2)*1 + (1/4)*2 + (1/8)*4 + (1/16)*8 + ... = 1/2 + 
1/2 + 1/2 + ... = 無窮大
問題是 玩家 A 願意付多少錢玩這個回報期望值為無窮大的遊戲?
這是一個隻有不太可能發生的事件會產生導致無限期望值的高獎的遊戲。
玩家 A 當然要考慮風險等因素。這說明僅僅根據期望收益最大進行決策是不盡合理。

這個問題牽涉到效用(Utility)概念。
例如,假設某消費者的消費集為X ={無,1個蘋果,1個橙子,1個蘋果和1個橙子,
2個蘋果,2個橙子},他的效用函數為u (無)=0,u (1個蘋果) = 1, u (1 orange) 
= 2, u (1 apple and 1 orange) = 5, u (2 apples) = 2 and u (2 oranges) = 
4. 那麽這個消費者更喜歡 1 orange 和 1 apple, 喜歡 1 個到 2 個橙子。
貨幣的效用值是指人們主觀上對貨幣價值的衡量。數學家根據貨幣的數量來估計貨
幣,而理性的人則根據他們對貨幣的使用來估計貨幣。確定一件物品的價值不能以
價格為基礎,而是以它產生的效用為基礎。$1000 的收益對窮人來說比對富人更重
要,盡管兩者都有相同的數量。

伯努利提出一種對數效用模型:U ( w ) = ln ( w ),U ( w ) 是效用函數,ln 是
對數函數,w 是玩家總財富。他提出下列公式來計算玩上述遊戲的費用 c

E(U) = Sigma((k=1, 無窮大),  ((1/(2^ k)) * (ln (w + 2^k - c) - ln(w))
Sigma((i=a, b), f(i))  表示連加(summation) 運算符。

根據上述公式,百萬富翁, U (1 M), 需要付 20.88,隻有$1000 的窮人, U (1000),
 需要付 10.95 。
實際上,上述方法是從每個可能的結果中找到效用的概率加權平均值。

EU=[P(z) * U(z)]+[P(y) * U((y))]       P(z)  是效用的概率    

假設有兩個方案,方案A ;穩獲100美元;
方案B:獲250美元的概率是41%,獲0美元的概率是59%。計算一下兩個方案的期望效

E(B) = 0.41 * U( 250) + 0.59 * U(0) = 102.5 > 100 = E(A) , 設 U ( x ) = 
x
很多人會采用方案A ,因為它是0風險。
關於效用,可見 LINK
https://en.wikipedia.org/wiki/Utility

(2)  凱利準則

木頭姐( Cathie Wood) 說過,這世界上沒有股神,隻有睹神。

凱利準則是一個確定下注最佳理論規模的公式。凱利賭注大小是通過最大化財富對
數的期望值得到的,相當於最大化期望的幾何增長率。早年,伯努利曾建議,當一
個人可以選擇賭注或投資時,應該選擇結果幾何平均值最高的那個。這在數學上等
同於凱利準則。見 本文的 (1) 。

投資公式

凱利公式的一般形式允許部分損失,這與投資相關:

   fo = p/a - q/b                  (a)

式中

fo 是應用於證券的資產部分;
p 是資產價值增加的概率;
q 是資產價值下降的概率;.( q = 1 - p )
a 是資產損失的比例;如果證券價格下跌 10%,則 a = 0.1
b 是資產增值的比例;如果證券價格上漲 10%,則 b = 0.1

我們從 1 個單位的資產開始並投入一小部分資產 f 。 獲利的概率是 p,在這種情
況下,所得資產等於 1 + f * b 。 輸的概率是 q ,在這種情況下,所得資產等於
 1 - f * a 。因此,預期的幾何增長率 r 是:

r = (1 + f*b)^p * (1 - f*a)^q

先取每一邊的對數

E = log(r) = p log(1 + f*b) + q log(1 - f*a)

E 表示對數資產增長。
對上式取導和令得到的等式為零:

dE/df| (f = fo) = pb/(1+ fo*b) + (-qa )/(1- fo * a) = 0 

最後得到凱利公式:

fo = p/a - q/b  

fo 是使價值增長率最大化的投入資產。
據說巴菲特也采用此法。

賭博公式

令上麵(a) 式中的 a = 1,即“輸率”是 100%,我們得到賭博遊戲凱利公式

 fo = p - q/b                  (b)

式中

fo 是部分睹注;
p 是獲勝的概率;
q 是損失的概率;.( q = 1 - p )
b 是贏得賭注的比例;也叫“賠率”(odds)。賠率是結果發生的概率與結果不發生
的概率之比;odds = p/(1-p) ,時常是獎金與本金的比率。
如果 b = q/p , 那麽該準則建議賭徒什麽都不下注。

例子

有$25 投入一賭博。每次投入睹注的20%(超出$25可以暫借)。這時

r = (1 + f*b)^p * (1 - f*a)^q = (1 + 0.2 * 1)^0.6 * (1- 0.2 * 1)^0.4 , 
      b = 1, a = 1

每輪平均收益為 2.034%。300 輪後的理論預期財富為 10,505 美元 ( = 25 * (1.02034)
^300 ) 。

(3) 鞅策略(Martingale)

 鞅策略是一類投注策略,該策略讓賭徒在每次失敗後加倍下注,這樣在連續失敗後
的第一場勝利將彌補之前的所有損失。但在輸的概率 q > 1/2 時,在整個過程結束
時睹徒還是輸錢(下麵有證明)。在贏的概率 p 和輸的概率 q 都等於 1/2,賭徒擁
有無限的財富、賭注和時間的情況下,鞅是一種獲勝策略。
注意:這裏介紹的鞅策略是一類投注策略,不是鞅論;那是討論一種隨機過程,詳
見 LINK
https://en.wikipedia.org/wiki/Martingale_(probability_theory)

單輪數學分析

將一輪定義為一係列連續的失敗,然後是賭徒獲勝或破產。贏了之後,賭徒“重置”,
被認為開始了新一輪。因此,可以將連續的鞅投注序列劃分為一係列獨立的回合。
下麵分析一輪的期望值。

令 q 為輸的概率(例如,對於美式雙零輪盤賭,下注黑色或紅色的概率為 20/38)。
令 B 為初始投注金額。設 n 是賭徒可以輸的有限賭注數。

賭徒將輸掉所有n 個賭注的概率是q^n 。當所有賭注都輸時,總損失為

 Sigma((i=1, n), B * 2^(i-1)) = B(2^n - 1)
Sigma((i=a, b), f(i))  表示連加(summation) 運算符。

賭徒沒有輸掉所有n 個賭注的概率是 1- q^ n 。在所有其他情況下,賭徒贏得初始
賭注 ( B )。因此,每輪 的預期利潤為

(1 - q^n) * B - q^n * B(2^n - 1) = B(1 - (2q)^n ) 

當q > 1/2 時,對於所有n > 0  ,表達式 1 - (2 q )^n  <  0。因此,對於所有
給定賭注,賭徒輸的可能性大於贏的可能性的所有遊戲,平均來說,每一輪該賭徒
預計會輸錢。

(4) 巴拿赫的火柴盒問題

一位先生隨身攜帶兩個火柴盒:一個在他的左口袋裏,一個在他的右口袋裏。每次
他需要一根火柴時,他都可能從任一口袋中取出。假設他把手伸進口袋,第一次發
現撿到的盒子是空的。如果假設各個火柴盒最初包含N根火柴,問在另一個盒子裏恰
好有 k 根火柴概率是多少?
不失一般性,考慮他右口袋裏的火柴盒有無限數量的火柴的情況,令M是在發現左口
袋裏的火柴盒為空之前從該火柴盒中取走的火柴數。當發現左邊的口袋是空時,這
先生已取了那個口袋N + 1 次。則M是 伯努利試驗N + 1 次失敗之前 成功的次數,
該試驗為負二項分布,於是:

P(M = m) = Combination( N + m, m)  * (1/2)^ ( N + 1 + m)
Combination(a, b) 表示組合運算符。

我們看到左邊的口袋先被發現是空的概率是 P(M < N + 1),它是等於1/2,因為兩
者的可能性相同。
我們看到數K另一個口袋裏剩下的火柴是

P(K = k ) = P(M = N - k | M < N + 1) =2P(M = N - k)=Combination(2N - k, 
N - k)  * (1/2)^(2N-k)

分布的期望值約為 2 * SquareRoot(N/PI) - 1 。(這是使用斯特林近似式)。
所以火柴盒最初N = 40 根火柴,另一個火柴盒中的預期火柴數是 6。.

(5) 兩個信封問題

給一個人兩個無法區分的信封,每個信封裏都有一筆錢。一個信封的錢是另一個的
兩倍。該人可以選擇一個信封並保留其中的錢。他們隨機挑選一個信封,但在打開
信封之前,他們可以更換信封,取走另一個信封。你應該更換嗎?

更換理由: 假設這個人的理由如下:

1。用A表示玩家所選信封中的金額。
2。A是較小金額的概率是 1/2,A 是較大金額的概率也是 1/2。
3。另一個信封可能包含 2 A或A /2。
4。如果A是較小的金額,則另一個信封包含 2 A。
5。如果A較大,則另一個信封包含A /2。
6。因此,另一個信封包含概率為 1/2 的 2 個A和概率為 1/2的 A /2。
7。所以另一個信封裏的錢的期望值是:

(1/2) * (2A) + (1/2) * (A/2) = (5/4) A

8。這大於A,因此,人們認為他們可以通過更換獲利。
9。更換後,用B表示該信封中的金額。與上述完全相同的方式推出另一個信封裏的
錢的期望值是(5/4)B。
10。該人得出結論,最理性的做法是再次換回。
11。因此,這個人最終將無限次地交換信封。

一種簡單方法解決這個悖論。

兩個信封中的總量是一個常數 3x, x 在一個信封和 2x 在另一個信封。
如果您選擇帶有x 的信封, 通過交換你獲得金額 x。如果您選擇帶有 2x 的信封, 
通過交換你失去了金額 x。所以通過交換,你平均獲得

G = (1/2) x + (1/2)(-x) = 0

交換並不比保留好。期望值 E = (1/2) (2x) + (1/2)x = (3/2)x  對兩個信封都一
樣。因此不存在矛盾。
還有很多方法決這個悖論,見LINK:
https://en.wikipedia.org/wiki/Two_envelopes_problem

(6) 伯克森謬誤

某醫院研究檢查了來自醫院住院患者的統計樣本中疾病的風險因素。由於樣本是從
醫院住院患者中采集的,而不是從普通公眾中采集的,這可能會導致疾病與風險因
素之間出現虛假的負相關。例如,如果風險因素是糖尿病,而疾病是膽囊炎,統計
結果表明:與公共社會統計比較,沒有糖尿病的住院病人患有膽囊炎可能性更高。
實際上,因為病人必須有某種非糖尿病(可能是膽囊炎引起)才能住進醫院。
設有兩個獨立事件 A 和 B (如,測試疾病與風險因素之間關係),我們有:

P(A|B) = P(A), then  P(A|B ^ (A & B)) = P(A), 這裏,^ 是交,而 & 是並。然

P(A|(A & B)) > P(A)
上式的結果是因為 (A & B) 事件組不再是完備的,它排除了 ~A & ~B,~ 是非(not)。


舉例1:如果有一個樣本100,A 和 B 獨立發生,對總體來說,P(A) = P(B) = 1/2 


      |   A     |   ~A       |                         |   A     |   ~A 
      |              
---------------------------                 ----------------------------
B   | A&B   | ~A&B   |                    B   | 25     | 25          |
---------------------------                 ----------------------------
~B |A&~B  | ~A&~B|                  ~B   | 25     |   25        | 
---------------------------                ----------------------------
            
但是,對上麵表格的三個子單元來說, P(A|(A & B)) = 50/75 = 2/3

舉例2:一收藏家有 1000 張郵票,其中 300 張是精美的,100 張是稀有的,其中
 30 張既精美又稀有。他的所有郵票中有 10% 是稀有的,而他的精美郵票中有 10% 
是稀有的,所以精美並不能說明稀有性。他展出了370枚精美或稀有的郵票。展出郵
票中有100枚稀有郵票,雖然仍然隻有 10% 的精美郵票是稀有郵票,但展出的 70 
枚不精美郵票全是稀有郵票 (100枚稀有郵票中有30枚既精美又稀有郵票,剩下70 
枚稀有郵票全是不精美郵票)。如果觀察者隻考慮展出的郵票,由於“選擇偏差”,
他們會觀察到精美和稀有之間虛假的負相關關係(也就是說,不精美強烈表明陳列
中的稀有性,而不是整個收藏中的稀有性)。
與“選擇偏差”(Selection bias) 有關的還有“ 辛普森悖論”( Simpson's paradox),
“幸存者偏差”( Survivorship bias ) 等等。

(7) 點數分配問題

兩名玩家玩一遊戲,每輪獲勝的機會均等。玩家平均貢獻一個獎池,並事先約定第
一個贏得商定回合數的玩家將獲得全部獎金。現在假設遊戲在任一玩家取得勝利之
前被意外事件打斷。那麽如何公平地分配獎金呢?憑直覺可以知道,劃分應該以某
種方式取決於每個玩家贏得的回合數,這樣接近獲勝的玩家將獲得更大的獎池部分。
但問題不僅僅是計算問題;它還涉及決定什麽是“公平”劃分。
有人提出按照每個玩家獲勝的回合數來分配賭注。如果比賽隻進行了一輪就被打斷,
這個規則會將整個獎池獎勵給該單輪的獲勝者,顯然是不合理。有人構建了一種方
案,通過根據領先優勢的大小來分配獎金。然而,這個解決方案仍然存在問題。假
設有兩場商定回合數為 100 的比賽,它在以 65-55 領先和在以 99-89 領先時分別
中斷。如果認為以 65-55 領先和以 99-89 領先是相同優勢(都是領先10 點),依此
方式劃分賭注顯然是不合理。因為前者仍然是一個結果不明確的遊戲,而對於後者,
領先玩家的勝利幾乎是肯定的. 。
所以劃分不應該過多地依賴於實際發生的被中斷博弈部分的曆史,而應該依賴於博
弈在沒有被中斷的情況下可能繼續進行的可能方式。很明顯,在一場比賽中以 7-5 
領先(商定回合數 10) 的選手最終獲勝的機會與在一場比賽中以 17-15 領先 (商定
回合數20) 的選手最終獲勝的機會相同。
因此帕斯卡和費馬認為中斷上述這兩種情況應該導致相同的賭注分配。換句話說,
重要的不是每個選手到目前為止贏了多少局,而是每個選手還需要贏多少局才能取
得全麵勝利。
費馬這樣推理:如果一個玩家需要 r 更多回合獲勝和另一個玩家需要 s 更多回合
, 以後肯定有人 在大於 (r + s - 1) 回合贏了這場比賽。因此,假設玩家要玩 r 
+ s - 1更多回合;這些回合總共有 2 ^ ( r + s - 1)  不同的可能結果,每一個
 2^ ( r + s - 1)可能性是同等。在其中一些可能的未來中,遊戲實際上會在不到
  r + s - 1 回合結束。費馬因此能夠計算出每個玩家獲勝的概率,一個玩家獲勝
的概率是 p ,另一個玩家獲勝的概率是 1 - p 。隻需簡單地列表 2^ ( r + s - 1) 
所有可能並計算其中有多少會導致每個玩家獲勝。費馬現在認為按賠率比例分配賭
注顯然是公平的。
帕斯卡在幾個方麵進行了改進。通過操縱帕斯卡三角的恒等式和組合運算等,帕斯
卡得到:

玩家獲勝的概率是  Sigma((k=r, r + s-1), Combination( r + s - 1, k))  * (1/(2^ 
( r + s - 1))
Sigma((i=a, b), f(i))  表示連加(summation) 運算符。Combination(a, b) 表示
組合運算符。

帕斯卡的結果和費馬的相同。
       
例子: 兩名玩家A和B玩一遊戲,商定回合數為 4 。玩家各人的睹注為32。在被意
外事件打斷前,玩家A已贏 2 點,玩家B已贏 1 點。r + s - 1 = 2 + 3 -1 = 4 。
在下一個 4 回合,玩家A至少要贏 2 點。現計算出玩家A再贏 2 點的概率。
設 玩家A 的成功為 S (Success) ,失敗為F (Failure) 。2 ^ ( r + s - 1)  = 
16 。16 種結果列出如下:
SSSS*,SSSF*,SSFS*,SSFF*,SFSS*,SFFS*,SFFF,FSSS*,FSSF*,FSFS*,FSFF,
FFSS*,FFSF,FFFS,FFFF
其中,至少有2個S 有 11 次 (帶星號 * 的)。所以玩家A再贏 2 點的概率是 11/16 
= 0.6875 。
玩家A應得到賭注為 0.6875 * 64 = 44 。
用帕斯卡的計算(實際上就是二項分布計算):   
Sigma((k=2, 4), Combination( 4, k))  * (1/(2^ 4) = 6 * (1/2^4) + 4 *  (1/2^4)
 +  (1/2^4) = 11/16 = 0.6875 
帕斯卡的結果和費馬的相同。

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.