個人資料
正文

全美疫情的分析和估計 ---- 從峰值到拐點

(2020-04-12 08:03:11) 下一個

全美疫情的分析和估計 ---- 從峰值到拐點

十天前的四月二日曾寫一篇短文 《全美疫情的分析和估計 ---- 拐點在即》(https://blog.wenxuecity.com/myblog/73449/202004/2632.html),當時新冠肺炎(Covid-19)的確診人數節節攀升,股票市場中的三大指數經曆了四次融斷、二次攀升後平均下跌25%,全美大地哀鴻遍野,人們心理的陰影達到了最黑暗的時候。

圖一 股票市場的反應

我們感到恐懼,看不到希望,因為我們不知前麵將會發生什麽,不知未來發展的趨勢。如果我們知道麵臨災難,知道會有死亡,並能估計到災難的程度,估計到死亡的大致人數,那麽我們就會直麵災難,而不是選擇逃避。

首先我們關心疫情的拐點,所謂拐點就是單日增量達到最大,之後隻有下降沒有上升的那一點所對應的日期。在數學上,拐點定義在函數的一階微分達到最大,二階微分為零所對應的橫座標的數值。在十天前的文章中預計四月十五日左右達到拐點,拐點時的當日新增人數四萬左右(4.0±0.5萬)。

幾天前,醫生朋友建議 Update 數據和分析,那麽更新和更正就一並做了。先看兩張最新的數據,截止日期4/11。圖二,累計確診人數(總量N)和現存病患人數(現存病患人數=累計確診人數-康複人數-病死人數),數據來源於《一畝三分地》(https://coronavirus.1point3acres.com/ )。該網站具有適時性,除了當天的數據變化之外,幾天前的數據也不時變動,增減不一。這可能是我們文化的特性,畢竟該網站流著中華文化的血脈。為了不使數據亂變,就從 Coronavirus Disease (COVID-19) Statistics and Research (https://ourworldindata.org/coronavirus) 中取確診人數的數據。三月三日:103;三月十一日:1025;三月二十日:14250;三月二十八日:104686。在二十五天內百變千,千變萬,萬變十萬,完成了四個數量級的跳躍,平均每天的指數增長達到32%。這樣的數據使人感到除了恐懼還是恐懼,除了崩潰還是崩潰。

圖二 累計確診人數(總量N)和現存病患人數

圖三表達每日新增的確診人數(增量 DN),數據來源於《一畝三分地》和 Coronavirus Disease,後者的數據雖有一天的滯後,但不會胡亂變動。在圖三中隻見一波接著一波地強勁攀升,根本看不到拐點所在。峰穀起伏居然漲落近萬,已經不是統計誤差所能解釋的了。這反應疫情多批次,多地域,多時間段的次第爆發,幾十甚至幾百個大小不等的波峰相互疊加。就像華盛頓、紐約、密西根三,疫情先後爆發。

圖三 全美每日新增的確診人數(增量 DN)

華盛頓州最先爆發,最先死人,但該州應對控製很好,四月四日越過它的拐點,迄今為止總的確診人數10416人,病亡率2.6%,現趨於緩慢平複。紐約疫情似乎火如荼,但4/11的新增數據驟降,標誌在四月十日越過拐點。幾天前的四月八日曾寫一篇短文《紐約疫情 --- 數據和估》(https://blog.wenxuecity.com/myblog/73449/202004/5159.html ),如今的發展基本在當初的預料之內。

密西根最晚爆發,曾經發展迅猛,雖然它的病死率迄今為止最高(5.6%),但它在四月五日越過了拐點。密西根的數據量大,整體的發展進程短,具有統計學上的意義。圖四、圖五、圖六為密西根州的數據。下麵以密西根為例,看看COVID-19疫情的發展進程。

圖四 密西根州的累計確診人數(總量N

圖五 密西根州的每日新增病患人數(增量 DN)

圖六 密西根州的每日增長率

根據密西根州的統計數據,此類流行性感冒的發展進程大概有四個段。(1)爆發前的混亂階段(Chaos),(2)爆發階段,(3)燃燒階段,和(4)平複階段。

(1)爆發前的混亂階段(Chaos),在這期間由於人們的認識不足,測試樣本偏小,檢測手段不完備,試劑測出的結果真假也分辨不清,再加上無症狀感染者,導致此時的數據雜亂無章,毫無可信度。但烽火狼煙已起,社會群體中的少數醫護人員(如李文亮)最先得到一個信息 ---- 狼來了。如果此時應對正確,疫情可以被及時撲滅。此前的一個例子是2009年SARS 病毒在安徽泄露,感染了幾個人後就被撲滅。此時的傳播因子(R0)毫無意義。以密西根州為例,3月11、12、13日三天的累計確診為2、12、23人,那麽12、13兩日的傳播因子就分別為5和1,這個差別也太大了。既然號稱因子,就應是個常數,至少變化不會太大。Chaos 的階段大約會持續幾天、十幾天、以致一個月(比如加州)。

(2)爆發階段,這期間的特性是累計確診(N)和增長率(Growth Rate)均按指數迅猛增長,並達到增長率的峰值。密西根州的爆發階段隻用了三天(3月18、19、20),這三天的平均增長率達到106%。而全美的這個階段用了25天,(3月3 – 3月28),時間上比密西根州拉長了八倍,平均增長率達到了32%。此階段可以勉強談談傳播因子 RT,這個RT 是我定義的,和R0 不同,與時間有關,表達的是平均每天傳染幾人。密西根州的 RT=1,而全美的 RT=0.32 。可見傳播因子和病毒類型無關。那麽,怎麽說好呢,傳播因子啊 。。。。。。

(3)燃燒階段,我把這個時間段定義為從增長率的峰值(圖六中 3/19,172% 的那一點)到5天平均增量(《DN》)最大值(圖五中 4/5, 1635 的那一點)所對應的兩個時間點之間的區間。在此階段每天的增量繼續上升,而增長率按e指數下降。以密西根州為例,燃燒階段從3月19到4月5日,曆時18天。人們在此期間看不到希望,心情沮喪。這個階段正是黎明前的黑暗。

(4)平複階段,增量(DN)達到最大值後逐日下降。增長率的下降的方式和第(3)階段的一樣,先快後慢,這是由e 指數衰減的形式決定的。南韓的數據顯示,雖然2月29日達到拐點,但至今還拖著一個長長的尾巴,每天新增病患40-50人。就全美疫情來看,五月初每天仍可檢測到新增病患過萬;六月初過千;七月初過百。

繞了一大圈,回到主題 ---- 美國疫情。圖七表示全美新增病患人數的增長率(Growth rate %),這一數字正逐步、穩定地下降。結合圖三和圖七,預計今後每天的新增人數將在3萬至3萬5之間徘徊幾天,然後一路下降。由於多源頭、多批次、多地點的疫情爆發,對於全美來講,拐點已不再是一個特定的日子,而是一個區間。這個拐點區間的時間範圍大約起於4/5, 終於4/15, 十天左右。在這期間的每日新增病患的人數起伏波動,在3萬5左右(3.5±0.5萬)。這是病毒最後的有規模的掙紮,剩下搏住蒼龍隻是時間的問題了。

圖七 全美病患人數的增長率(Growth rate %)

圖八是累計病患的數據和預測,在COVID-19 的疫情中全美將有大約一百二十萬人染病 (120±10 萬人),以病死率4%計,全美因此流感而掛掉的人數約五萬。

圖八 累計病患及其預測

結論:

1 全美COVID-19疫情的拐點為一個十天左右的時間段,從4/5 到 4/15。拐點期間每天新增病患在三萬五左右 (3.5±0.5 萬),起伏還比較大,近萬呢。

2 全美COVID-19疫情所產生的累計病患將達到一百二十萬左右,(120±10 萬),以病死率4%計,病死人數接近五萬。

3 疫情有尾巴,長長的,七月份仍可檢測到。尾大難掉。

當我們理解了疫情發展的完整過程,我們對疫情的趨勢、危害也就洞若觀火了。朋友們,我們越過了峰值,正跋涉於拐點的緩坡,麵對著黎明前的黑暗,曙光即將來臨。讓我們迎接疫情解放自由民主的明天。

[ 打印 ]
閱讀 ()評論 (8)
評論
唐山故鄉 回複 悄悄話 回複 'jay_walker' 的評論 : 謝謝。一直相信老美科技多麽厲害,以為病死率最多2%,現在的數據大約是4%。 這個病毒還是很凶猛的。
jay_walker 回複 悄悄話 讚!分析的有譜!兩個星期前當trump說會死10到20萬的時候,我的直覺估計死亡會在3萬到5萬之間。現在看來5萬概率較大。
唐山故鄉 回複 悄悄話 回複 'ncpga' 的評論 : 緊緊握你的手。
ncpga 回複 悄悄話 讓我們迎接疫情解放自由民主的明天。
唐山故鄉 回複 悄悄話 回複 '枕寒流' 的評論 : 謝謝來訪,很高興認識新朋友。
唐山故鄉 回複 悄悄話 回複 'Wtp003' 的評論 : 謝謝來訪,很高興認識新朋友。
枕寒流 回複 悄悄話
Wtp003 回複 悄悄話 好文
登錄後才可評論.