2016 (368)
2017 (136)
2018 (148)
2019 (185)
2020 (305)
2021 (216)
2022 (127)
2023 (142)
過去兩周,美國兩家企業,Pfizer和Moderna,相繼宣布了它們的三期臨床試驗初步數據,都達到了驚人的90%以上的有效率,這給了深陷新冠災難不可自拔的世界一個希望。而且據說這種新型mRNA生產相對容易,安全,光Pfizer一家,年產量就可以達到14億支,加上Moderna,也許還有新來者,明年世界有望拜托新冠這個噩夢。
但我仔細看了Pfizer的統計方法,(Moderna也用的同樣方法),覺得一驚,這個方法好像有點不對勁。我當然不是大統計學家,但也算內行,在此就將這個疑慮說出來,與大家分享,有高手也希望與我解惑。
我在工業部門(不是學術研究)做過疫苗和蛋白藥物的免疫原性試驗(Immunogenecity),對疫苗的臨床試驗過程有一點了解,以我以往的了解,疫苗在批準前需完成三期臨床試驗。和其它藥物的臨床試驗不同,疫苗的受試者(Subject)全是正常的誌願者,而不是病人。
一期試驗的目的是安全性。根據臨床前在動物身上摸索出的劑量,從小計量開始,逐漸升級,在幾十個受試者身上觀察毒副作用,當到達出現了嚴重副作用的劑量,試驗終止。一期試驗成功,隻是說找到了安全的劑量範圍。也有藥物從最小劑量開始就有很大副作用,或疫苗受試者感染上了新冠,那可能這個疫苗的安全性有問題,就不再進行下去了。
二期試驗是安全性和免疫原性試驗。安全性貫其一生都是重要指標,疫苗的有效性要看其是否有預防作用,這和大多數藥物著重於治療性不同。在二期還無法作預防性試驗,隻是看疫苗能否在受試者身上激發其免疫原性。
人體免疫原性有兩個分支,體液免疫和細胞免疫。這兩者是互相聯係的,大多數免疫反應兩者都有。相比之下,體液免疫有可溶性的抗體,測定方法比較簡單可靠,所以大多數疫苗都以測定抗體為主要觀察指標。一個疫苗可以激發無數種抗體,我們一定要證明所測到的抗體能夠阻止病毒進入體內,或抑製某種功能,是所謂中和抗體(Neutralizing),這需要一係列複雜的步驟。如果在二期試驗內沒發現嚴重副作用,並在多數受試者體內測到高滴度的中和抗體,這說明疫苗過了第二關,可以進入第三關了。
三期試驗是安全性和預防有效性試驗。受試者人數需上萬例,必須在流行區域進行。受試者隨機分兩組,一組接種疫苗,一組接種安慰劑,通常是包裝和疫苗一樣的生理鹽水。誰是疫苗組,誰是安慰劑組,受試者自己不知道,接種的醫護人員也不知道,所謂雙盲,隻有最後分析時才揭盲,以避免人為的傾向性(BIAS)。
Pfizer公布的方法是這樣的: 招募到的受試者被隨機雙盲注射兩劑疫苗或安慰劑(間隔7天),然後就讓他們如常生活,並沒有強調不許自我防護。當其中出現確診的新冠病例到達164例時,或總例數到達44,000時,(看哪一個先到達),則終止試驗。按原計劃,在達到確診新冠數30,60,120例時要進行中期分析,但因技術原因無法進行。到11月份,總試驗例數達到了43,538例,已經接近44,000的終止指標時開始了中期分析,當時的確診新冠病人有94例,其中打疫苗隻有8例得病,因此得出保護率90%的結論。進一步試驗目標修正為達到確診數120例時終止(不是164例了)。
我想象中的臨床試驗方法是這樣的:試驗組和安慰劑組暴露在同樣條件下,比較兩組的感染率,進行統計學分析,根據P值,如果隨機因素造成的概率<0.05,判斷為兩組有顯著差異。試驗組的感染率低,則為疫苗有效,有效率的差距>50%,可以上市。
而Pfizer的方法不是這樣的,試驗組和安慰劑組的暴露情況並不能保證一致,當然,倫理上不能要求受試者不進行自我保護,但客觀上,這樣做參試者的暴露情況是不一致的。雖然,那些得了病的一定是受到有效病毒暴露了,因此在他們中間是否接種疫苗而造成的感染率不同,確實具有一定的意義,但我覺得這不是真正意義上的統計學顯著差異,而隻是算術差異。這裏的90%有效率,並不等同於統計學上的90%有效率。
這就好比驗證兩組婦女,哪組更容易懷孕。你的做法不是讓兩組婦女在受孕期和同一個男子性交來比較受孕率,而是把她們放羊,一定時間後檢查受了孕的婦女的數量,比較兩組的差異。這裏的影響因素多了,婦女有沒有性交,是不是受孕期,和男人是否不對......
統計學是門很tricky的科學,這次美國大選的民調也是基於統計學的,結果一筆吊帳。從我的眼光看,這些疫苗應該說是有效的,但其真正有效率還需要在實際使用中得到驗證。
用這麽少的幾例陽性來比較兩種疫苗的有效率就是數字遊戲。
Donald_Trump 發表評論於 2020-11-17 19:50:55
再用Moderna數據: 95人5人疫苗。如沒疫苗就有90人感染,疫苗救了85人。疫苗有效率=85/90=94.44%。即所謂接近95%。
新冠的感染受防護措施影響極大。戴好N95口罩,打疫苗的防護作用根本看不到。不強製讓受試者不加防護與確診新冠病人密切接觸足夠長時間,怎麽能確切觀察到疫苗的保護效果?
統計學無法解決實驗設計的缺陷。這兩個疫苗的保護性到底多強仍然存在疑問。
從招募誌願者角度考慮,如果參加實驗就要和確診病人共處,沒人願意被分到對照組,那能不能招夠誌願者都難說。除了人性化考慮,不限製受試者使用防護措施必然降低感染率,數據好看。說實在的,打疫苗打的不就是信心嘛。誰不想接種100%有效的呢? 從製藥公司的生意角度考慮,客觀指標在二期的中和抗體滴度裏呢。三期沒有嚴重副作用就可以放心使用了。難道要搞出保護率低的數據讓前期投入打水漂不成?
疫苗的保護性實驗不限製受試者的防護措施有其難言之隱,是綜合平衡的考慮。相信疫苗的盡早接種,不信的戴好口罩。
收試者本來或因受試疫苗變得更懂。這不影響結論,畢竟兩組幾萬人都一樣有可比性!
如50%以上,即94人感染,其中23.5人感染.
一、是random sampling的
二、A|B test 有做 propensity score matching
就基本就可以了,何況樣本數量有4萬多個,從大數據來看很足夠了!我看Pfizer的數據應該沒問題。
樓主的擔憂完全可以使用 propensity score matching 解決,稍微對統計有些認識的研究人員都知道的。
大選前民調不準,那是sampling技術不好,而統計模型也沒有對數據的粗糙做出必要矯正,這說明統計學用得不夠,用得不到家,並非是看不上統計學的理由。
問卷調查很難避免一些受訪者在一些問題上說謊,想不出有什麽好辦法可以校正這種偏差。也許同時測謊?
因為並不是所有受試者在特定時間,比如打第二針後某天接受病毒檢測,隻是自覺出現症狀就醫確診,又因為理論上存在大量無症狀感染者,所以隻能說,疫苗可減輕感染後症狀或避免感染者出現症狀。這個數據並不能證實疫苗的作用肯定是避免感染。
傳統上一個成功疫苗的研發要10多年,現在搞大躍進,非要幾個月就得結論,所以很難避免這種有點糊了糊塗的結論。
2萬人隨機分到對照,另外2萬人隨機分到疫苗組,基本就能保證暴露狀況一致了。而且的分組的時候,要確保兩組間的年齡,基礎病狀況差不多。