黃海懿 - www.huanghaiyi.com

加國財務顧問(保險、基金)
正文

(2)為何多國疫情圖都簡化到了直線 or 簡單曲線?

(2020-05-15 16:41:43) 下一個

先猜一道題:總聽專家們說“”“拐點”,但哪個才算拐點呢?

數學定義上的拐點 inflection point,可能要讓朋友們失望了:

如果就拐點處紅色箭頭的角度做個鏡像,就縱軸的上漲幅度而言,拐不拐,也許對傳染病專家的建模有些不同的含義,但對普通民眾來說,它又有什麽關係呢?同樣會經曆一個縱軸的快速攀升,和之後雖稍緩但仍舊保持爬坡的狀態。就在Y軸上的增長幅度看,與從X軸起勢的階段也沒有太大區別。若以爬山來舉例,“拐點”有點兒像是在半山腰喘口氣,然後接著爬……

 

三、多國疫情圖的形態

 

平時讀專業文章時,我也是一鼓作氣、再而衰、三而竭,讀完立即就昏睡了,就像當機了。所以我寫的時候,盡量來寫成好理解的~~

 

前篇說過,可以將半對數圖近似看作“加速度”,為什麽說“近似”呢?因為lg=log 10的作用是降指數。能降多少層級指數呢?可以說有多少降多少:比如1億是108次方,lg完就剩下常數8了,好比一隻花枝招展的孔雀正轉著圈伸展著顫動的翎毛,lg一下就褪了毛了,啥都不剩隻留下光禿禿一隻肉雞。加速度隻是比速度濃縮一個級別,相當於求導dt,而lg能還原掉所有的指數級,作用更厲害呢~~

 

咱們來猜個謎,下麵這些國家的圖形有哪些相近,又有哪些不同呢?

 

我們會略有些吃驚地看到,最令人矚目的兩個國家,英國和瑞典,都斯巴達勇士般在推廣“群體免疫”的概念,它們的圖與醫療資源遭受擠兌的意大利,與感染人數最多的美國,與緊跟其後的法國、加拿大的圖形其實沒有太大的差別。

 

 

 

 

 

上圖可見,三個島國中,澳大利亞和新西蘭圖形也是非常像。日本與它們不同,算是很頑強的了,疫情一開始就參與其中,一直維係著較慢的升幅,眼看著不少國家紛紛超過了它(當然也有其他的一些原因,後麵會談到)。

 

怎麽上下圖結合著看呢?可以近似理解為:

 

- 半對數圖(上圖)衝得快時,算術坐標圖下圖)會像下弦月一樣朝天翹 上去了。

 

- 當半對數圖(上圖爬坡緩慢趨於平緩時,算術坐標圖下圖的增長沿著原先的趨勢,速度會越來越快,但至少沒原先衝的那麽厲害。

 

- 當半對數圖(上圖向右上趨緩漸平,算術坐標圖下圖接近於勻速上升。

 

數學是個工具,用來幫助我們理解事物的主要結構,可多用近似的方法來推測,別被那些具體的術語把思路限定在了細微處。

 

四、多國疫情圖,一次二次的簡單形態

 

從這些圖的算術坐標圖(下圖)看,它們或者是直線,或者是“曲線+部分段落的直線

 

很多科學家正就新冠感染總人數建模,隻是這種形態的建模不是有些太簡單了嗎?若沿用近似的演繹方法,一次線性 + 二次曲線,看似就可以模擬了。

 

建模中,計算量大些的是“回歸”的計算,就是動態地根據趨勢的每步進展(根據最新發生的真實數據)來一天天地調整對未來趨勢的預測。特別是“多元回歸”,簡單地說就是假設了多個可變量,XYZ,還有HJ那些,各個假設量都在變……但按目前這樣形態的疫情圖,回歸計算也就沒什麽必要了,線性+弧形曲線就足夠了,即使退而求其次,打個簡單的區間段出來,也足夠實現預測功能了。殺雞焉用牛刀,哪裏還用得上“回歸呢?

 

五、多國疫情圖被線性因素限製住了——“新冠檢測量”

 

多國疫情圖為何如此相似呢?推測其中的原因,我覺得是在疫情的發展中,一些線性因素在主導著感染總人數的曲線,比如“檢測量”成為了瓶頸因素,使得“事實感染總人數”所應呈現的指數增長那種一飛衝天的形態不能被顯現、無法被計數,於是新冠疫情圖上的所謂的感染總人數曲線,因為瓶頸的存在,事實上已悄然被"累計總檢測人數”、以及“總檢測人數中的感染密度”這兩個概念的複合效果所替代。

 

形象一點兒,想象我們正處於一片廣闊的大陸上,這裏的人數多乎其多,我們正在尋找人群中有某類特點的人。但由於我們隻能以步行的速度去探索這塊未知的大陸地,所以在紙上所能記下的,都受限於我們步履所能達到的有限區域,與真實數字之間會存在一個差異缺口......(至於這個缺口到底有多大?這是又一個數學題了,等寫完主要的結構,若還有時間也還有必要,那我們再來推一推)......

 

於是,當每日的新冠檢測量還受限於線性或有限幅度的增長,當然是無法追上真實感染總人數那種雲在天上的指數增長形態了,各國疫情圖於是就成了現在這種簡單趨同的形態了

 

如果這一推論正確,按說逆否命題也會同樣正確,而令人更好奇的是它的逆命題可否成立?也就是說當某些國家的COVID-19確診總人數的算術坐標圖(下圖)如果呈現了簡單的“線性+二次曲線形狀時,我們可否斷定它的檢測量/確診方式一定數量不足,已成為了瓶頸因素而無法真正顯現指數級的感染趨勢?

 

 

下篇更精彩,未完待續~~

 

 

 

 

以往文章:

 

(1)新冠疫情圖的數字奧秘

    https://blog.wenxuecity.com/myoverview/67349/

 

    相當樂觀的魁省“悲觀預測”

https://blog.wenxuecity.com/myblog/67349/202004/20157.html

 

    交叉感染之源,Montreal市中心COVID-19檢測點的選址問題

https://blog.wenxuecity.com/myblog/67349/202004/4468.html

 

    Montreal女市長的神操作—新冠病毒檢測點設在了市中心

https://blog.wenxuecity.com/myblog/67349/202003/40265.html

 

 

[ 打印 ]
閱讀 ()評論 (4)
評論
黃海懿 回複 悄悄話 回複 '武勝' 的評論 : 是啊,現在哪種檢測方法相對更準確些,以及能檢測的量有多大...
武勝 回複 悄悄話 回複‘黃海懿’:隨機抽樣測試最早斯坦福有報告。密度估計隨抽樣方式和測試準確率會有較大誤差。德國用的是抗體測試,從血庫抽樣-都是相對健康的捐血者,2、3期重災區及廣泛抽樣。武漢正在全民核酸測試-感覺試劑多得用不完,但也隻反映一個時間點,且核酸試劑也存在錯率。
黃海懿 回複 悄悄話 回複 '武勝' 的評論 : 是,另外德國的隨機抽查也是個很好的方法,測密度
武勝 回複 悄悄話 我也在追蹤疫情發展。正像樓主說的,本應指數上升的曲線受到了製約,如檢測瓶頸,還有更重要的是封閉措施。所以除了開始爆發階段,後麵的對數曲線已沒有太大意義。目前最常用的是新增病例曲線,它的峰值就對應累計病例曲線上的拐點。過了拐點增幅就趨小,非常直觀。理想形態是正態曲線,但現在受到封閉拖延,峰值削矮、推後,下降不會像上升那麽迅速。並且實際曲線並不光滑,所以有一些平滑手段如移動均值、回歸擬合和FFT。它們是有用的,可去除很多影響趨勢判斷的尖峰(同信號降噪)。另外病死數比病例數要可靠,但反映疫情滯後一些。
登錄後才可評論.