老錢:關於“樣本池”的普測方法

5/26/20130

老錢:關於“樣本池”的普測方法
5/25/20



今天網上流轉兩篇文章,武漢千萬人核酸檢測,真實感染率曝光全民檢測50萬人已感染 武漢女斥政府腦殘(視頻)
 
武漢市的感染情況到底如何。這個問題不僅僅是武漢人關心,政府關心,也是全世界都很關心的問題。5月14日,武漢市掀起了“十日大會戰任務”,要在10天之內,對全武漢的一千一百萬人做一次核酸檢測,徹底摸清武漢市的詳細情況。


這麽大的測試量,怎麽能在十天完成。據說這是因為采取了混合樣本池的方法。這個方法是英國科學家在《柳葉刀/Lancet》上發表的,為了提高大規模普查的效率和降低成本。
 
我思考了一下,想來做一個進一步理解和解釋。
 
設想把一群人(比如說64人中的一半,32人)的每個人的采樣樣本混合在一起,成為一個樣本池。因為32人的樣品都攪合在一起了,隻要其中有一個人是陽性,這個樣本池整體就是陽性。如果檢測結果是陰性,那麽這個樣本池裏的任何一個人都必定是陰性。那麽就不用對這32人一個一個地檢測(但是仍然需要做了32個采樣),而是僅一次測試就把這32個人都排除了。減少了31個測試。
 
對於剩下的另一半的32人呢?如法炮製。
 
再取一次16人的混合樣本池,如果最好的結果是陰性。這16個人就一下子排除了。
第三次對剩下一半16人,做8人的混合樣本池,最好的結果是陰性。這八個人就一次排除了。
第四次是對剩下8人,進行4人的混合樣本池,最好的結果是陰性。這四個人就一次排除了。
第五次是對剩下4人,2人的混合樣本池,如果是陰性。這兩個人就排除了。
第六次,僅剩下最後兩個人了。就要對每一個人都做測試。如果可能是3種。
兩人都是陰性,那麽這全部的64人就沒有一人被感染!
如果一陰一陽,就是隻有感染一人了;感染率就是1/64,即1.56%。
如果都是陽性,就是隻有兩人感染:感染率就是1/32,即3.12%。
 
這樣的樣本池法,最好的結果就是,對全部64人,采了64次樣,但是僅僅做了7個測試,就完成了對全部64人的測試。每個人都必須被采樣,這是必須的。但是,不是每一個人都需要做測試。最好的情況,就是隻做了7次測試,就查清了64人。7/64,即是挨個檢測的11%的檢測量。
 
對於昂貴的耗料耗時耗人工的核酸檢測來說,樣本池法是非常有效,非常經濟合算的。極大地降低了測試成本!
 
這樣的樣本池法,也叫做“二分法”。
 
上麵是最幸運的情況。如果不幸呢?我們來看看“最不幸”的情況。
 
如果這個32人的“樣本池”的測試結果是陽性,就必須對這個“樣本池”裏的人重新來一次采樣和測試。可以一個人一個人的測試,找到具體誰是陽性,誰是陰性。不僅僅必須要對這32個人重新測試,還要對另一半的32人從頭開始。
 
也可以,對這個陽性的“樣本池”再來一次16人的混合樣本池,最壞的結果是陽性。不僅僅必須對這16個人重新測試,還要對另一半的16人從頭開始。
第三次是8人的混合樣本池,最壞的結果是陽性。不僅僅必須對這8個人重新測試,還要對另一半的8人從頭開始。
第四次是4人的混合樣本池,最壞的結果是陽性。不僅僅必須對這4個人重新測試,還要對另一半的4人從頭開始。
第五次是2人的混合樣本池,如果結果是陽性。那麽這最後四個人的每一個人都要采樣測試。
 
這樣的樣本池法,最壞的結果就是,對全部64人,每一個人都被重複了4次采樣和4次檢測。一共采了256次樣,做了256個測試。最終結果,最壞是64人都被感染了,百分之百的感染。最壞之下的最好的結果是,每個4人裏隻有一個人是陽性,另外3人都是陰性。就是四分之一,即25%的感染率。但是,仍然是要采256次樣,做256個測試。
 
這樣,樣本池法反而增加了工作量,還不如64人,每一個人都測試一次了。
 
所以,樣本池法的運用是有條件的,需要隨機應變,靈活運用的。
 
而且,樣本池太大了,可能降低了檢測的靈敏度。我前麵用的32人的樣本池就太大了。這樣“誇張”的樣本池法,隻是為了使得“減少測試量到11%”可以顯易而見。如果32人中隻有一個陽性的話,陽性的濃度立刻就降低到了1/32,很可能就檢測不出來了。10人的樣本池就會把一個陽性的濃度降低到1/10。多大的樣本池是合適的呢?這就不是紙上談兵,而應該從試驗中總結出來。從微信上武漢大嫂的抱怨來看,在武漢的“大會戰”中,是采用了10人的樣本池。那個大嫂抱怨:“把我們十個人的樣品不注名地放在一個容器裏”。大嫂說,“那查個鬼啊!”。這是因為她不知道到樣本池”的理論。
 
那麽,我們就用10人“樣本池”來分析。如果這個“樣本池”是陰性,那麽這10人就全部是陰性,就節約了9/10的測試量。如果是陽性呢,就要把這10人叫回來重新測試。
改為5人“樣本池”,如果結果是陰性,這5個人都是陰性,不用再測試了。
對於其餘5個人,一一測試,總測試量就是7次,7/10,也減少了3次。
如果再采取3人“樣本池”,如果是陰性,這3人都是陰性,隻要再分別測試剩下的兩個人就完成了。這樣的總測試量就是5次,減少了50%的工作量。
如果3人“樣本池”是陽性,那麽這5個人都要逐個測試。總工作量就是8次。8/10.
如果第一個5人“樣本池”是陽性,就重複上麵的分析,總測試量大約為50%到80%。因為他們有把握,剩下的5人應該全是陰性。因為,在決定采用“樣本池”方法之前,他們已經做了前期試驗,得到了平均感染率是5%。但是,為了避免漏側,還是要對剩下的5人,做一個“樣本池”測試。這樣來,總測試量大約人人檢測的為60%到90%。
 
到這裏,我們要回過頭來說,“武漢大嫂”的抱怨是完全正確的,即使采用樣本池”方法,不可能把受測試的老百姓,反複的叫回來重新采樣,更要被老百姓罵死了!一次采樣的量必須夠用測試3次。
 
所以,那個大嫂抱怨:“把我們十個人的樣品不注名地放在一個容器裏,那查個鬼啊!”。她是完全正確的。不管她懂不懂樣本池”。
 
由此看來,樣本池”的方法也隻能用於第一步,頂多到第二步,到了4人“樣本池”,就沒有什麽優越性了。
 
對於美國斯坦福大學研發出來的抗體快速檢測來說,測試與采樣基本上就是一件事兒。除了昂貴複雜的核酸檢測,這樣的混合樣本池法,也就沒有多少優越性了。
 
我不是生化醫學領域裏的人,隻是一個工程師,隻是有興趣從簡單算術來理解樣本池”的理論。本文不談如何政治問題,隻是數學和邏輯。可能貽笑大方。歡迎專家批評指正。
 
 (全文到此結束)




更多我的博客文章>>>

所有跟帖: 

你還沒有考慮國產核酸檢測試劑盒的準群度和敏感度對混合測試的影響 -xintian- 給 xintian 發送悄悄話 xintian 的博客首頁 (0 bytes) () 05/26/2020 postreply 04:57:14

在CT雙肺都白了,還要測3-4次才能確診,可以知道國產試劑的靈敏度了。稀釋十倍也就是得到它想要的數據而已 -蔥蒜- 給 蔥蒜 發送悄悄話 蔥蒜 的博客首頁 (0 bytes) () 05/26/2020 postreply 12:05:09

從報道的情況看, 主要不是試劑盒的問題,而是醫護人員取樣和處理的問題(病毒數量不夠) -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 14:27:08

成本主要是取樣,處理,檢測,分析四部分。混合節省多少與實際陽性率有關(接近0.002%),20人混合可節省95%耗材和處理時間 -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (472 bytes) () 05/26/2020 postreply 10:08:58

靈敏度為什麽降低呢? 推理的過程是什麽? -LingYuan- 給 LingYuan 發送悄悄話 LingYuan 的博客首頁 (100 bytes) () 05/26/2020 postreply 11:18:08

這是指20人樣本混合組,其中有一個陽性病人,他的病毒數量達到至少100個/1 ul,混合後終濃度是5個/1ul,才能被檢測出陽性 -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 11:26:05

對這一段不明白。你肯定有一定的假設 -LingYuan- 給 LingYuan 發送悄悄話 LingYuan 的博客首頁 (327 bytes) () 05/26/2020 postreply 11:07:27

為什麽要重新采樣呢? 第一次抽血多抽一些不就行了嗎? -LingYuan- 給 LingYuan 發送悄悄話 LingYuan 的博客首頁 (0 bytes) () 05/26/2020 postreply 11:08:57

不是抽血,是鼻咽拭子,也是成本的核算,保存1000萬個樣本還是重檢4000人加保存200萬樣品?那個省事 -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 11:19:34

這個方法的關鍵是怎樣分組。不一定對半分就是最佳的,黃金分割可能更好。如果預先有個大致估計可以用概率法來求。 -LingYuan- 給 LingYuan 發送悄悄話 LingYuan 的博客首頁 (0 bytes) () 05/26/2020 postreply 11:12:12

極低陽性率的保留的隻是混合樣品,沒法對分,陽性組每個再次取樣檢測,也就4000人 -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 11:22:09

??? -LingYuan- 給 LingYuan 發送悄悄話 LingYuan 的博客首頁 (0 bytes) () 05/26/2020 postreply 11:29:09

數學理論上需要對分再檢,由於極低陽性率,選陽性組20人逐個重檢更節約時間和經費 -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 11:37:55

嗯,怎樣分組,組的人數要有技巧。覺得重災區分小組,非重災區分大組。之後陽性組再黃金分割細篩。。於此類推。 -pickshell- 給 pickshell 發送悄悄話 (0 bytes) () 05/26/2020 postreply 11:58:23

既然是普篩,我覺得敏感度是首先考慮的分組依據而不是重或輕災,否則結果偏差太大 -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 12:03:27

你所指測試敏感度吧? 當然保證準確是一切的前提。敏感度與病毒陽性濃度有關,而重或輕災與陽性人口密度有關。 -pickshell- 給 pickshell 發送悄悄話 (138 bytes) () 05/26/2020 postreply 12:11:41

對,我指的是測試的技術底限敏感度,你指的是臨床的檢測敏感度 -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 14:50:15

嗯,明白你意思,會有假陰性們漏網。精準與節省本身就是對矛盾。 -pickshell- 給 pickshell 發送悄悄話 (0 bytes) () 05/27/2020 postreply 05:36:43

你真的搞過醫學統計麽? -fuz- 給 fuz 發送悄悄話 fuz 的博客首頁 (0 bytes) () 05/26/2020 postreply 15:33:54

謝謝你們的討論。 我理工男,對醫學是外行。喜歡瞎琢磨。隻是拋磚引玉。 顯然你們都是行家。向你們學習了。謝謝了。 -老_錢- 給 老_錢 發送悄悄話 老_錢 的博客首頁 (190 bytes) () 05/26/2020 postreply 12:25:36

個人說自己的觀點,有合理的也有可能不合理的,大家平和討論就好,謝謝你的話題, -楊別青- 給 楊別青 發送悄悄話 楊別青 的博客首頁 (0 bytes) () 05/26/2020 postreply 14:30:58

“樣本池”最大問題是靈敏度。池子越大,靈敏度越下降,會導致許多False Negative (假陰性) -未知- 給 未知 發送悄悄話 未知 的博客首頁 (567 bytes) () 05/26/2020 postreply 22:43:22

請您先登陸,再發跟帖!