薑樹生:新冠疫情中的一個影響巨大的數學欺騙

來源: 皮皮蝦 2020-08-06 19:37:08 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (18244 bytes)

新冠疫情中的一個影響巨大的數學欺騙

作者:薑樹生

1. 引子

前一段時間, 關於新冠疫情, 一個頗有爭議的話題是“死亡率”: 一開始報道的“死亡率”, 各國相差很大, 於是出現了很多各種各樣的解釋, 這些解釋不但未能釋疑, 反而令人更加糊塗; 後來的情況更糟, 發現大量的漏診, 加強了檢測後, 這個“死亡率”大大降低, 在有的國家甚至降到早先報道的十分之一以下, 於是乎又出現了很多盲目樂觀的論調, 說新冠肺炎並不嚴重, 甚至說其實還是“大號流感”, 還有人說隔離、戴口罩等都是反應過度, 甚至主張學習“群體免疫”的“成功經驗”, 等等。

上麵將“死亡率”都加了引號, 是為了提醒讀者它很不靠譜。

但這並不是批評這個數據, 而是說, 它被濫用了。這就是標題所說的“數學欺騙”, 而且它造成了巨大的負麵影響。

簡言之, 這個“死亡率”是一個在研的專業數據, 對於一般人並沒有用處。一般人所需要的數據, 我們在下麵將詳細說明。

 

2. 一個重要的專業數據

在醫學領域, 每種疾病的死亡率, 是一個重要的專業數據, 它有助於醫生的診斷, 特別是對於預後的判斷。而若該種疾病是流行病, 則其死亡率有重要的流行病學意義。

這是一個醫學科學課題。科學的探索一般都不是一帆風順的, 更不是一蹴而就的。即使僅僅為了死亡率這一個數據, 也需要付出很多艱辛的勞動, 當然也就需要較長的時間才能得到較為可靠的結果。因此, 如果一開始得到的數據誤差很大, 甚至超過一個數量級, 也不必大驚小怪, 更不應責罵專業研究人員。

這裏所說的艱辛勞動也包括檢測和統計。某國一開始檢測的人數很少, 後來檢測人數逐漸增多, 竟然出現確診率越高死亡率越低的奇怪現象, 這足以說明早先的“死亡率”有多不靠譜。

於是又有人說, 早先的“死亡率”高是由於檢測數量太少導致的。但這種說法也缺乏可信性, 因為沒有給出被確診者感染的時間分布, 很可能新確診的病人大部分是新近感染的。

如果沒有有效的控製, 流行病的感染人數會以近於指數的速度上升。對於新冠疫情, 這種狀況已經有跡象顯示。另一方麵, 新冠病人即使最終死亡, 一般也會拖延較長的時間。隻有用最終病死人數除以感染總人數, 才是可靠的死亡率。如果用現在已病死的人數除以現在確診的感染人數, 所得到的“死亡率”可能低得離譜, 如果大部分的確診者是新感染的話。

這裏需要專業研究者有較好數學素質。如果檢測嚴重不足 (例如設置了很高的檢測門檻), 則根本不應該根據所得的數據計算死亡率, 因為這樣得到的“死亡率”嚴重偏高, 毫無參考價值。而若檢測充足, 則應采用正確的統計方法, 例如可以統計早期確診的病人最終死亡的人數, 除以早期確診人數; 若把後期感染的病人人數也加到分母裏, 則所得的“死亡率”可能嚴重偏低, 仍是毫無參考價值。

由此可見, 研究死亡率需要有較高的專業素質, 非專業人員一般沒有能力直接判斷、理解和運用。遺憾的是現在有太多“無知無畏”的人, 連數據的可靠性都沒有能力判斷, 卻敢於做非常外行的解釋和演繹, 誤導著他們的“粉絲”。

您如果不是專業人員, 為了避免被忽悠, 最簡單的辦法就是“遵醫囑”。如果您想知道一個專業數據的意義, 隻能找專業人員谘詢。那些外行連同他們的“粉絲”所造成的喧囂, 無論聲音多大, 您也應該充耳不聞。

就新冠而言, 目前關於死亡率, 仍在研究階段。要過較長的一段時間, 甚至數年的時間, 才會有可以給公眾使用的權威數據。您如果不是專業人員, 現在就甭操這份心了。

 

3. 所謂“預測”

然而在網上卻看到不少大V, 從這個尚在研究的專業數據出發做了很多推導, 然後做出“預測”。其實這些大V的推導很多並非原創, 而是“進口”的。然而卻可以欺騙很多數學素質較差的人, 這就是那些大V粉絲多的原因。

天文學可以預測日食, 而氣象學給出天氣預報。前者是有非常精確的證明的, 後者卻隻是“大概率”地保證。兩者都是有科學根據的, 但有所不同, 用數學的語言, 可以說是定理和推測的區別。

在數學領域有很多定理和“猜想”。哥德巴赫猜想 (Goldbach's conjecture) 和黎曼猜想 (Riemann hypothesis) 都是著名的猜想, 盡管所用的術語不同 (Riemann hypothesis 忠實於原文的譯文是“黎曼假設”, 但 hypothesis 和 conjecture 在意義上並無不同)。費爾馬大定理 (Fermat Last Theorem) 原來也是猜想, 直到上個世紀末才得到證明, 所以現在可以稱為定理。

定理都是有證明的。尚未證明的斷言隻能稱為猜想。但在數學中乃至其他科學中, 猜想並不是毫無根據的斷言, 雖然沒有證明 (proof) 卻有“證據” (evidence)。就以上述兩個猜想為例。哥德巴赫猜想是: 任何大於2的偶數都可以分解為兩個素數 (即質數) 的和; 黎曼猜想是: zeta 函數的每個非平凡零點的實部都是 0.5。這兩個猜想都有兩方麵的證據: 一是大量的計算都未發現錯誤; 二是研究得到很多對猜想斷言的“逼近”結果。對於哥德巴赫猜想, 目前最接近的結果是陳景潤的“1+2”, 即任何大於2的偶數都可以分解為兩個數的和, 其中一個數是素數而另一個是至多兩個素數的積; 對於黎曼猜想, 目前最接近的結果是至少有 1/3 的非平凡零點的實部是 0.5。

舉這些例子是為了說明, 即使“推測”也需要有根據, 否則就和欺騙沒有區別了。例如斷言“感染率達到60%-70% 可形成群體免疫”就毫無根據 (不僅沒有證明也沒有證據)。

從一個誤差很大的前提出發, 經過推導所得到的斷言不僅未必有意義, 甚至可能是荒謬的。舉個例子: 如果通過調查判斷甲公司的資產約為 110萬元, 乙公司的資產約為 120萬元, 誤差不會超過50% , 那麽這兩個數據都是有用的; 但如果由此推斷乙公司的資產約比甲公司多10萬元, 就完全不靠譜了, 實際上的差別很可能遠比10萬元大, 甚至可能乙公司的資產比甲公司多一倍或少一半。

所以上麵所說的那些大V對於新冠的“推測”都加了引號。

舉個這類推理的例子: 新冠的死亡率“據推測”可能隻有 1% , 那麽隔離很多人是不明智的, 應該讓大家都感染, 等到那 1% 都死了就沒事了。這就是“群體免疫”的“理論根據”。

隻要是初中數學素質達標的人, 稍微想想就會發現這個推理過程漏洞百出。首先, “死亡率 1% ”隻是研究過程中 (某篇論文中) 提出的一種可能性, 不能作為推理的前提; 其次, “1% 死了剩下的就沒事了”的所謂“群體免疫”完全沒有科學根據, 隻是與曆史上的幾次大流行病的情況類比而已, 然而醫學領域已經發現新冠與以往的各次流行病有非常顯著的不同, 所以類比未必成立, 就如由費爾馬大定理可證明推斷哥德巴赫猜想或黎曼猜想也可證明; 再次, 即使 1% 的人死亡也是現代社會無法承受的。

這裏采用了不止一個不可靠的前提, 即使推導出“1+1=3”或“太陽從西邊出”也不奇怪。

遺憾的是能迅速發現這個數學欺騙的人太少, 這說明數學素質的提升仍任重道遠。

盡管“群體免疫”之類的主張是沒有科學根據的, 某些大V們卻津津樂道, 張口閉口“據推測”如何如何, 而且還有更進一步的推導, 例如: 既然有“群體免疫”論, 那麽中國沒搞“群體免疫”就是根本性的錯誤, 將來全世界除了中國都“群體免疫”了, 那麽中國就是唯一害怕新冠的國家, 甚至因此亡國, 等等等等。然而很多數學盲粉絲被騙到這個地步還執迷不悟。

有的大V甚至張口閉口“我推測”如何如何, 一時間仿佛驟然冒出很多預言家, 難免令人驚歎“厲害了我的國”。

具有強烈諷刺意義的是: 這些大V能夠這樣亂噴, 恰恰是因為他們住在中國, 避免了“群體免疫”的危險, 否則它們隻會忙於如何逃避那“1%”的“死亡率”。

還是那句老話: “中國現在最不缺的就是騙子”。

普遍提高公民的數學素質, 一個效果將是形成對於騙子的“群體免疫”。

 

4. 一般人所需要的一個數據: 危險因子

現在回到前麵所說的對於疫情“一般人需要的數據”。

其中一個重要的數據是因新冠死亡的人數占總人口的比例。一些文獻中將這樣的比例數稱為“危險因子”, 我們下麵采用這個術語。

先說武漢。武漢人口約有 1700 萬人 (其中有約 500 萬人在春節期間離開了武漢), 後來因感染新冠死亡的約有 3600 人, 新冠危險因子約為萬分之 2.1。

如果您覺得這是個很小的數, 那您的心真大。我們下麵舉幾個例子來幫助您理解死亡因子的大小。

先看交通事故。我國每年因交通事故死亡的人數占總人口數的萬分之0.6-0.7, 這顯著高於很多國家, 例如德國每年因交通事故死亡的人數占總人口數不到萬分之0.4。所以我們還需要繼續完善交通法規建設, 改進道路和交通設施, 加強交通安全教育, 提升交通執法水平等等, 任重道遠。如果您還想比較一下其他地方, 包括您認為交通更不安全的地方, 也可以在網上查到。例如印度每年因交通事故死亡的人數占總人口數的萬分之1.1-1.2 (信不信由你)。

請注意這裏說的是一年的交通死亡人數, 而武漢新冠大約在兩個月中就達到了上述死亡人數。

再來看戰爭。美國在3年朝鮮戰爭中死亡的人數, 約占當時美國總人口的萬分之3; 在14年越南戰爭中死亡總人數, 占當時美國總人口不到萬分之3。在17年阿富汗戰爭中, 美軍死亡總人數占美國總人口不到萬分之0.1; 另一方麵, 阿富汗平民死亡的總人數占總人口的萬分之8-9。

與此比較一下就可以理解, 對於流行病, 危險因子若達到萬分之2是大得可怕的。

何況交通事故和戰爭都沒有傳染性。

請注意每一個人死亡都會傷害一家人, 而且一般會有至少數十個親友感到悲痛。如果危險因子達到萬分之2, 社會的醫療體係和一些其他方麵會不堪重負甚至崩潰。我們知道武漢的新冠疫情是靠全國支援才得以控製住, 否則很快就會走到不得不“選擇性放棄”的悲慘境地。

對於安全, 常言道“不防一萬, 隻防萬一”。如果某個地方新冠危險因子已超過萬分之一, 建議您千萬別去了。

遺憾的是, 在網上經常見到的很多數據對一般人沒什麽用, 例如上麵說的“死亡率”。而很重要的危險因子卻難以查到, 一般隻能自己計算。這不很難, 因為能查到的死亡人數多半比較可靠, 總人口數就更可靠, 剩下的隻需要小學數學即可。

例如在那個最早實行“群體免疫”的國度, 新冠危險因子已接近萬分之6; 而一個被很多大V吹捧為“群體免疫完全成功”的“榜樣”, 新冠危險因子也已超過萬分之4。

 

5. 尾聲

苦口婆心地講了那麽多數學, 如果您對本文所說的數學欺騙仍然執迷不悟, 而且勇敢地奔赴某個您認為“先進”的地區參加“群體免疫”的壯舉, 那麽萬一 (其實概率不止萬分之一) 您因感染新冠而“光榮”了, 拜托您在遺言中別說您的數學是語文老師教的 ------ 語文老師不背這個鍋。

 

附注

這篇文章寫於 5 月 15 日。隨著時間的推移, 越來越多的人認識到危險因子才是對於新冠應該特別關注的指標, 而文中所說的利用“死亡率”數學欺騙也越來越不靈了。例如近日記者喬納森·斯旺采訪特朗普時, 堅持用危險因子衡量新冠疫情的嚴重程度, 而特朗普堅持用“死亡率”被斯旺屢屢駁斥。

文中所說的兩個多月前的新冠數據, 近日的進展是: 英國的危險因子從將近萬分之 6 上升到超過萬分之 7; 瑞典的危險因子從萬分之 4 上升到近萬分之 5.7; 美國的危險因子從不到萬分之 3 上升到超過萬分之 4.8, 總人數超過 16 萬。而美國因二戰死亡的人數 (主要是軍人) 約為 38 萬, 其中在亞太地區死亡人數約為 12 萬。




更多我的博客文章>>>

加跟帖:

當前帖子已經過期歸檔,不能加跟帖!