黃海懿 - www.huanghaiyi.com

加國財務顧問（保險、基金）

首頁文章列表博文目錄

個人資料

黃海懿

給我悄悄話

博客訪問：

(2)為何多國疫情圖都簡化到了直線 or 簡單曲線？

(2020-05-15 16:41:43) 下一個

先猜一道題：總聽專家們說“拐點”“拐點”，但哪個才算拐點呢？

數學定義上的拐點 inflection point，可能要讓朋友們失望了：

如果就拐點處紅色箭頭的角度做個鏡像，就縱軸的上漲幅度而言，拐不拐，也許對傳染病專家的建模有些不同的含義，但對普通民眾來說，它又有什麽關係呢？同樣會經曆一個縱軸的快速攀升，和之後雖稍緩但仍舊保持爬坡的狀態。就在Y軸上的增長幅度看，與從X軸起勢的階段也沒有太大區別。若以爬山來舉例，“拐點”有點兒像是在半山腰喘口氣，然後接著爬……

三、多國疫情圖的形態

平時讀專業文章時，我也是一鼓作氣、再而衰、三而竭，讀完立即就昏睡了，就像當機了。所以我寫的時候，盡量來寫成好理解的~~

前篇說過，可以將半對數圖近似看作“加速度”，為什麽說“近似”呢？因為lg=log 10的作用是降指數。能降多少層級指數呢？可以說有多少降多少：比如1億是10的8次方，lg完就剩下常數8了，好比一隻花枝招展的孔雀正轉著圈伸展著顫動的翎毛，lg一下就褪了毛了，啥都不剩隻留下光禿禿一隻肉雞。加速度隻是比速度濃縮一個級別，相當於求導dt，而lg能還原掉所有的指數級，作用更厲害呢~~

咱們來猜個謎，下麵這些國家的圖形有哪些相近，又有哪些不同呢？

我們會略有些吃驚地看到，最令人矚目的兩個國家，英國和瑞典，都斯巴達勇士般在推廣“群體免疫”的概念，它們的圖與醫療資源遭受擠兌的意大利，與感染人數最多的美國，與緊跟其後的法國、加拿大的圖形其實沒有太大的差別。

上圖可見，三個島國中，澳大利亞和新西蘭圖形也是非常像。日本與它們不同，算是很頑強的了，疫情一開始就參與其中，一直維係著較慢的升幅，眼看著不少國家紛紛超過了它（當然也有其他的一些原因，後麵會談到）。

怎麽上下圖結合著看呢？可以近似理解為：

- 半對數圖（上圖）衝得快時，算術坐標圖（下圖）會像下弦月一樣朝天翹上去了。

- 當半對數圖（上圖）爬坡緩慢趨於平緩時，算術坐標圖（下圖）的增長沿著原先的趨勢，速度會越來越快，但至少沒原先衝的那麽厲害。

- 當半對數圖（上圖）向右上趨緩漸平，算術坐標圖（下圖）接近於勻速上升。

數學是個工具，用來幫助我們理解事物的主要結構，可多用近似的方法來推測，別被那些具體的術語把思路限定在了細微處。

四、多國疫情圖，一次二次的簡單形態

從這些圖的算術坐標圖（下圖）看，它們或者是直線，或者是“曲線+部分段落的直線”。

很多科學家正就新冠感染總人數建模，隻是這種形態的建模不是有些太簡單了嗎？若沿用近似的演繹方法，一次線性 + 二次曲線，看似就可以模擬了。

建模中，計算量大些的是“回歸”的計算，就是動態地根據趨勢的每步進展（根據最新發生的真實數據）來一天天地調整對未來趨勢的預測。特別是“多元回歸”，簡單地說就是假設了多個可變量，X、Y、Z，還有H、J那些，各個假設量都在變……但按目前這樣形態的疫情圖，回歸計算也就沒什麽必要了，線性+弧形曲線就足夠了，即使退而求其次，打個簡單的區間段出來，也足夠實現預測功能了。殺雞焉用牛刀，哪裏還用得上“回歸”呢？

五、多國疫情圖被線性因素限製住了——“新冠檢測量”

多國疫情圖為何如此相似呢？推測其中的原因，我覺得是在疫情的發展中，一些線性因素在主導著感染總人數的曲線，比如“新冠檢測量”成為了瓶頸因素，使得“事實感染總人數”所應呈現的指數增長那種一飛衝天的形態不能被顯現、無法被計數，於是新冠疫情圖上的所謂的感染總人數曲線，因為瓶頸的存在，事實上已悄然被"累計總檢測人數”、以及“總檢測人數中的感染密度”這兩個概念的複合效果所替代。

形象一點兒，想象我們正處於一片廣闊的大陸上，這裏的人數多乎其多，我們正在尋找人群中有某類特點的人。但由於我們隻能以步行的速度去探索這塊未知的大陸地，所以在紙上所能記下的，都受限於我們步履所能達到的有限區域，與真實數字之間會存在一個差異缺口......（至於這個缺口到底有多大？這是又一個數學題了，等寫完主要的結構，若還有時間也還有必要，那我們再來推一推）......

於是，當每日的新冠檢測量還受限於線性或有限幅度的增長，當然是無法追上真實感染總人數那種雲在天上的指數增長形態了，各國疫情圖於是就成了現在這種簡單趨同的形態了。

如果這一推論正確，按說逆否命題也會同樣正確，而令人更好奇的是它的逆命題可否成立？也就是說當某些國家的COVID-19確診總人數的算術坐標圖（下圖）如果呈現了簡單的“線性+二次曲線”形狀時，我們可否斷定它的檢測量/確診方式一定數量不足，已成為了瓶頸因素而無法真正顯現指數級的感染趨勢？

下篇更精彩，未完待續~~

以往文章：

(1)新冠疫情圖的數字奧秘

https://blog.wenxuecity.com/myoverview/67349/

相當樂觀的魁省“悲觀預測”

https://blog.wenxuecity.com/myblog/67349/202004/20157.html

交叉感染之源，Montreal市中心COVID-19檢測點的選址問題

https://blog.wenxuecity.com/myblog/67349/202004/4468.html

Montreal女市長的神操作—新冠病毒檢測點設在了市中心

https://blog.wenxuecity.com/myblog/67349/202003/40265.html

[ 打印 ]

[ 加入書簽 ]

閱讀 () ┆ 評論 (4)

評論

黃海懿 2020-05-16 14:48:58 回複悄悄話回複 '武勝' 的評論 : 是啊，現在哪種檢測方法相對更準確些，以及能檢測的量有多大...

武勝 2020-05-16 10:27:02 回複悄悄話回複‘黃海懿’：隨機抽樣測試最早斯坦福有報告。密度估計隨抽樣方式和測試準確率會有較大誤差。德國用的是抗體測試，從血庫抽樣－都是相對健康的捐血者，2、3期重災區及廣泛抽樣。武漢正在全民核酸測試－感覺試劑多得用不完，但也隻反映一個時間點，且核酸試劑也存在錯率。

黃海懿 2020-05-16 04:48:05 回複悄悄話回複 '武勝' 的評論 : 是，另外德國的隨機抽查也是個很好的方法，測密度

武勝 2020-05-16 00:29:15 回複悄悄話我也在追蹤疫情發展。正像樓主說的，本應指數上升的曲線受到了製約，如檢測瓶頸，還有更重要的是封閉措施。所以除了開始爆發階段，後麵的對數曲線已沒有太大意義。目前最常用的是新增病例曲線，它的峰值就對應累計病例曲線上的拐點。過了拐點增幅就趨小，非常直觀。理想形態是正態曲線，但現在受到封閉拖延，峰值削矮、推後，下降不會像上升那麽迅速。並且實際曲線並不光滑，所以有一些平滑手段如移動均值、回歸擬合和FFT。它們是有用的，可去除很多影響趨勢判斷的尖峰（同信號降噪）。另外病死數比病例數要可靠，但反映疫情滯後一些。

登錄後才可評論.