貝葉辛概率推理雖是一門迥異於常規概率學的理論,卻是我們大腦的潛在自然思維方式。
不盡客觀精確的本底意識
對一件你有所了解的事物,關於其今後將如何發生,你會有一個本底意識,譬如人群裏有某疾病存在,你會否也患上該病;譬如電車已在市場占有一定比例,會否10年後基本驅逐燃油車;譬如本地曆史上有多次地震的記錄,最近會否發生地震。重申 - 往下提到本底意識,都隻狹義地關於事物的發生,不涉及事物的其他方麵。
本底意識並不時時占據你的大腦,通常是當某事物引起了你的關注,本底意識才浮現出來。之所以稱為本底,就是當前該事物引起你關注後,你尚沒有專門為此去獲取新的認知。
本底意識來自於方方麵麵:
× 自己的相關經曆(譬如人群裏另一些病你也患過)
× 聽聞來的相關知識(譬如本地處於兩大地質板塊的分裂帶上)
× 對相關因子的了解(譬如電車電池技術突破,政府電車補貼)
說上麵這些時,已經意味著兩點, (1) 本底意識帶有學習遞進的性質,最原初,對一件複雜事物你不會有任何本底意識,除非有第六感。(2) 本底意識不是完全客觀的,可能因人而異,你獲取知識的渠道和容量,分析綜合能力,事物與你的相關程度,甚至你對事物的好惡,及至世界觀價值觀這樣的主觀因素,都會影響你的本底意識。
獲取最新證據校正本底意識
本底意識支持你對事物的判斷和預測,但現實裏,如果你是一個理智的人,一旦某事物引起你做預測的欲望,你總會對其做些更深入的了解,獲取一些更近期的資訊,譬如對疾病做個醫學檢測,了解一下政府電車補貼的最新政策,收集一下專家對本地地震更全麵的分析。另外,你也不會將預測絕對化,除非你獲得了確鑿無比的證據,或者隻是和人打賭,你會用有轉寰餘地的判斷性語言來表達你的預測,這不是狡猾或不自信,而是理性承認我們的認知是有限的。
當你更新了對所關注事物的認知後,也許你更堅信你本來的判斷,也許會對本來的判斷做較大調整,哦,患這個病的風險比本來想的要大,電車市場按過去那樣強勁勢頭發展的前景很不明朗,兩年內本地發生強震具有現實可能性。
我們大腦的另類貝葉辛表達
這樣一個在本底意識上通過獲取新知識來更新判斷的過程,其實就是貝葉辛Bayesian 過程,在我們的日常生活規劃或關鍵決策中都是常見的,也許因為我們的大腦天然是貝葉辛的。下麵將用稍微數學化一點的語言來進一步展示。
上麵的過程用公式來表示:
更新認知後的判斷 J(後)= 基於新認知的校正因子 A × 基於本底意識的判斷 J(前)【1】
前麵我們同意用可能性語言來表述我們的判斷,在數學上就是概率。如果將某事物的發生記為S, 新認知基於的證據記為E,於是公式【1】有兩種概率性表達:
其一
P(S/E) = A1 × P(S) 【2】
上麵P(S)為基於本底意識判斷出的事物發生概率, P(S/E)為結合進新證據E後判斷出的事物發生概率。
其二
R(S/E) = A2 × R(S) 【3】
其中R不是發生概率,而是發生概率與不發生(記作 !S)概率之比:
R(S) = P(S) ÷ P(!S) = P(S) ÷ (1 - P(S)) 【3】
R(S/E) = P(S/E) ÷ P(!S/E) = P(S) ÷ (1 - P(S/E) )【4】
暫且擱下第一表達(【2】)不表,先看一下第二表達(【3】),為何要用發生和不發生概率的比率?如【3】【4】所示,發生概率和不發生概率是完全反演互補的,40%可能性發生等於60%可能性不發生,兩者等價,知其一必知其二,何必多此一舉?
這在認知上有兩個好處,第一,譬如地震,發生往往有發生的證據支持,而不發生也往往有不發生的證據支持,放棄考慮任何一方都是不明智的。第二,R=P/(1-P)是關於P的一個非線性變量,當 P很小, R對P的變化不敏感,當P 增大, R將隨P 的小幅增加越來越急劇增加, 這有助增強風險所係的大概率區域的變化辨識度,糾正人們的低敏高疑的心理誤差。
既然第二表達用概率比率,校正因子A2也應如此
A2 = P(E/S)÷ P(E/!S) 【5】
P(E/S)是如果事物最終真的發生了,這前提下證據出現的概率,體現了證據的準確率; 反之,P(E/!S)是如果事物最終沒有發生前提下,證據出現的概率,代表了證據的誤判率。這是證據的兩個完全不同的特性,考慮證據時缺一不可。
Bingo! 我們就得到了大名鼎鼎的貝葉辛公式,切慢,的一個另類表達:
這不是貝葉辛公式的常規表達,但懂些條件概率的馬上可從上麵的公式推演出貝葉辛定理的常見形式:
眼尖的會立馬指出,這不就是上麵的第一表達嗎(【2】),簡潔多了,為何舍簡求繁搞個第二表達?
沒錯,看起來【7】是比【6】簡潔,問題是【6】中的P(E), 新證據發生的概率,是無法直接知道的,除非你又搞個關於證據的本底意識,但它的不可靠性和事物本身的本底意識沒啥兩樣。
最後提一下,基於本底意識判斷出的概率在貝葉辛定理裏稱為先驗概率Prior ,根據新證據校正後的概率稱為後驗概率Posterior 。
一個不具實用的例子
公式【6】是個極其有用的幫助對日常事物進行判斷和決策的工具,舉個例子。
關於某疾病,人群的發病率根據醫學記錄是1/1000,平均1000人有一人患上,沒患的就是999/1000,這是本底或先驗,R(S) = 1/999, 我們每個人都包括其中。由於擔憂某些健康狀況,你去做了一個關於該病的醫學檢測,該檢測的準確率是93%,誤判率是3%,就是說100個真真患者有93個會被正確檢出,但100個健康者會有3個被誤檢為有病,你的檢查結果是陽性的,這是新證據, A2 = 93 / 3 = 31。因而,你的R(S/E) = 32/999。比起本底,你的風險提高了近33倍,應該警惕了,但僅憑一次檢測還不至於太過大驚小怪,畢竟患病概率和不患病概率之比還隻在大約3%。如果你去做了第二次檢測結果也是陽性,那情況就很不同了,此時第一次的R(S/E),32/999,成了本底,第二次的R(S/E) = 32 × 32/999 = 1.025,患病的概率剛剛高過不患病的概率。注意:這是個極度簡化的貝葉辛概率的例子,絕不能用做任何醫學參考。