美國新冠疫苗的統計學問題
文章來源: 朱頭山2020-11-17 06:58:25

過去兩周,美國兩家企業,Pfizer和Moderna,相繼宣布了它們的三期臨床試驗初步數據,都達到了驚人的90%以上的有效率,這給了深陷新冠災難不可自拔的世界一個希望。而且據說這種新型mRNA生產相對容易,安全,光Pfizer一家,年產量就可以達到14億支,加上Moderna,也許還有新來者,明年世界有望拜托新冠這個噩夢。

但我仔細看了Pfizer的統計方法,(Moderna也用的同樣方法),覺得一驚,這個方法好像有點不對勁。我當然不是大統計學家,但也算內行,在此就將這個疑慮說出來,與大家分享,有高手也希望與我解惑。

我在工業部門(不是學術研究)做過疫苗和蛋白藥物的免疫原性試驗(Immunogenecity),對疫苗的臨床試驗過程有一點了解,以我以往的了解,疫苗在批準前需完成三期臨床試驗。和其它藥物的臨床試驗不同,疫苗的受試者(Subject)全是正常的誌願者,而不是病人。

一期試驗的目的是安全性。根據臨床前在動物身上摸索出的劑量,從小計量開始,逐漸升級,在幾十個受試者身上觀察毒副作用,當到達出現了嚴重副作用的劑量,試驗終止。一期試驗成功,隻是說找到了安全的劑量範圍。也有藥物從最小劑量開始就有很大副作用,或疫苗受試者感染上了新冠,那可能這個疫苗的安全性有問題,就不再進行下去了。

二期試驗是安全性和免疫原性試驗。安全性貫其一生都是重要指標,疫苗的有效性要看其是否有預防作用,這和大多數藥物著重於治療性不同。在二期還無法作預防性試驗,隻是看疫苗能否在受試者身上激發其免疫原性。

人體免疫原性有兩個分支,體液免疫和細胞免疫。這兩者是互相聯係的,大多數免疫反應兩者都有。相比之下,體液免疫有可溶性的抗體,測定方法比較簡單可靠,所以大多數疫苗都以測定抗體為主要觀察指標。一個疫苗可以激發無數種抗體,我們一定要證明所測到的抗體能夠阻止病毒進入體內,或抑製某種功能,是所謂中和抗體(Neutralizing),這需要一係列複雜的步驟。如果在二期試驗內沒發現嚴重副作用,並在多數受試者體內測到高滴度的中和抗體,這說明疫苗過了第二關,可以進入第三關了。

三期試驗是安全性和預防有效性試驗。受試者人數需上萬例,必須在流行區域進行。受試者隨機分兩組,一組接種疫苗,一組接種安慰劑,通常是包裝和疫苗一樣的生理鹽水。誰是疫苗組,誰是安慰劑組,受試者自己不知道,接種的醫護人員也不知道,所謂雙盲,隻有最後分析時才揭盲,以避免人為的傾向性(BIAS)。

Pfizer公布的方法是這樣的: 招募到的受試者被隨機雙盲注射兩劑疫苗或安慰劑(間隔7天),然後就讓他們如常生活,並沒有強調不許自我防護。當其中出現確診的新冠病例到達164例時,或總例數到達44,000時,(看哪一個先到達),則終止試驗。按原計劃,在達到確診新冠數30,60,120例時要進行中期分析,但因技術原因無法進行。到11月份,總試驗例數達到了43,538例,已經接近44,000的終止指標時開始了中期分析,當時的確診新冠病人有94例,其中打疫苗隻有8例得病,因此得出保護率90%的結論。進一步試驗目標修正為達到確診數120例時終止(不是164例了)。

我想象中的臨床試驗方法是這樣的:試驗組和安慰劑組暴露在同樣條件下,比較兩組的感染率,進行統計學分析,根據P值,如果隨機因素造成的概率<0.05,判斷為兩組有顯著差異。試驗組的感染率低,則為疫苗有效,有效率的差距>50%,可以上市。

而Pfizer的方法不是這樣的,試驗組和安慰劑組的暴露情況並不能保證一致,當然,倫理上不能要求受試者不進行自我保護,但客觀上,這樣做參試者的暴露情況是不一致的。雖然,那些得了病的一定是受到有效病毒暴露了,因此在他們中間是否接種疫苗而造成的感染率不同,確實具有一定的意義,但我覺得這不是真正意義上的統計學顯著差異,而隻是算術差異。這裏的90%有效率,並不等同於統計學上的90%有效率。

這就好比驗證兩組婦女,哪組更容易懷孕。你的做法不是讓兩組婦女在受孕期和同一個男子性交來比較受孕率,而是把她們放羊,一定時間後檢查受了孕的婦女的數量,比較兩組的差異。這裏的影響因素多了,婦女有沒有性交,是不是受孕期,和男人是否不對......

統計學是門很tricky的科學,這次美國大選的民調也是基於統計學的,結果一筆吊帳。從我的眼光看,這些疫苗應該說是有效的,但其真正有效率還需要在實際使用中得到驗證。