朱頭山_文學城博客

過去兩周，美國兩家企業，Pfizer和Moderna，相繼宣布了它們的三期臨床試驗初步數據，都達到了驚人的90%以上的有效率，這給了深陷新冠災難不可自拔的世界一個希望。而且據說這種新型mRNA生產相對容易，安全，光Pfizer一家，年產量就可以達到14億支，加上Moderna，也許還有新來者，明年世界有望拜托新冠這個噩夢。

但我仔細看了Pfizer的統計方法，（Moderna也用的同樣方法），覺得一驚，這個方法好像有點不對勁。我當然不是大統計學家，但也算內行，在此就將這個疑慮說出來，與大家分享，有高手也希望與我解惑。

我在工業部門（不是學術研究）做過疫苗和蛋白藥物的免疫原性試驗（Immunogenecity),對疫苗的臨床試驗過程有一點了解，以我以往的了解，疫苗在批準前需完成三期臨床試驗。和其它藥物的臨床試驗不同，疫苗的受試者(Subject)全是正常的誌願者，而不是病人。

一期試驗的目的是安全性。根據臨床前在動物身上摸索出的劑量，從小計量開始，逐漸升級，在幾十個受試者身上觀察毒副作用，當到達出現了嚴重副作用的劑量，試驗終止。一期試驗成功，隻是說找到了安全的劑量範圍。也有藥物從最小劑量開始就有很大副作用，或疫苗受試者感染上了新冠，那可能這個疫苗的安全性有問題，就不再進行下去了。

二期試驗是安全性和免疫原性試驗。安全性貫其一生都是重要指標，疫苗的有效性要看其是否有預防作用，這和大多數藥物著重於治療性不同。在二期還無法作預防性試驗，隻是看疫苗能否在受試者身上激發其免疫原性。

人體免疫原性有兩個分支，體液免疫和細胞免疫。這兩者是互相聯係的，大多數免疫反應兩者都有。相比之下，體液免疫有可溶性的抗體，測定方法比較簡單可靠，所以大多數疫苗都以測定抗體為主要觀察指標。一個疫苗可以激發無數種抗體，我們一定要證明所測到的抗體能夠阻止病毒進入體內，或抑製某種功能，是所謂中和抗體（Neutralizing），這需要一係列複雜的步驟。如果在二期試驗內沒發現嚴重副作用，並在多數受試者體內測到高滴度的中和抗體，這說明疫苗過了第二關，可以進入第三關了。

三期試驗是安全性和預防有效性試驗。受試者人數需上萬例，必須在流行區域進行。受試者隨機分兩組，一組接種疫苗，一組接種安慰劑，通常是包裝和疫苗一樣的生理鹽水。誰是疫苗組，誰是安慰劑組，受試者自己不知道，接種的醫護人員也不知道，所謂雙盲，隻有最後分析時才揭盲，以避免人為的傾向性（BIAS）。

Pfizer公布的方法是這樣的: 招募到的受試者被隨機雙盲注射兩劑疫苗或安慰劑（間隔7天），然後就讓他們如常生活，並沒有強調不許自我防護。當其中出現確診的新冠病例到達164例時，或總例數到達44，000時，（看哪一個先到達），則終止試驗。按原計劃，在達到確診新冠數30，60，120例時要進行中期分析，但因技術原因無法進行。到11月份，總試驗例數達到了43，538例，已經接近44，000的終止指標時開始了中期分析，當時的確診新冠病人有94例，其中打疫苗隻有8例得病，因此得出保護率90%的結論。進一步試驗目標修正為達到確診數120例時終止（不是164例了）。

我想象中的臨床試驗方法是這樣的：試驗組和安慰劑組暴露在同樣條件下，比較兩組的感染率，進行統計學分析，根據P值，如果隨機因素造成的概率<0.05,判斷為兩組有顯著差異。試驗組的感染率低，則為疫苗有效，有效率的差距>50%,可以上市。

而Pfizer的方法不是這樣的，試驗組和安慰劑組的暴露情況並不能保證一致，當然，倫理上不能要求受試者不進行自我保護，但客觀上，這樣做參試者的暴露情況是不一致的。雖然，那些得了病的一定是受到有效病毒暴露了，因此在他們中間是否接種疫苗而造成的感染率不同，確實具有一定的意義，但我覺得這不是真正意義上的統計學顯著差異，而隻是算術差異。這裏的90%有效率，並不等同於統計學上的90%有效率。

這就好比驗證兩組婦女，哪組更容易懷孕。你的做法不是讓兩組婦女在受孕期和同一個男子性交來比較受孕率，而是把她們放羊，一定時間後檢查受了孕的婦女的數量，比較兩組的差異。這裏的影響因素多了，婦女有沒有性交，是不是受孕期，和男人是否不對......

統計學是門很tricky的科學，這次美國大選的民調也是基於統計學的，結果一筆吊帳。從我的眼光看，這些疫苗應該說是有效的，但其真正有效率還需要在實際使用中得到驗證。


	美國新冠疫苗的統計學問題
	文章來源: 朱頭山於 2020-11-17 06:58:25