老錢:關於“樣本池”的普測方法

打印 (被閱讀 次)

5/26/20130

老錢:關於“樣本池”的普測方法
5/25/20



今天網上流轉兩篇文章,武漢千萬人核酸檢測,真實感染率曝光全民檢測50萬人已感染 武漢女斥政府腦殘(視頻)
 
武漢市的感染情況到底如何。這個問題不僅僅是武漢人關心,政府關心,也是全世界都很關心的問題。5月14日,武漢市掀起了“十日大會戰任務”,要在10天之內,對全武漢的一千一百萬人做一次核酸檢測,徹底摸清武漢市的詳細情況。


這麽大的測試量,怎麽能在十天完成。據說這是因為采取了混合樣本池的方法。這個方法是英國科學家在《柳葉刀/Lancet》上發表的,為了提高大規模普查的效率和降低成本。
 
我思考了一下,想來做一個進一步理解和解釋。
 
設想把一群人(比如說64人中的一半,32人)的每個人的采樣樣本混合在一起,成為一個樣本池。因為32人的樣品都攪合在一起了,隻要其中有一個人是陽性,這個樣本池整體就是陽性。如果檢測結果是陰性,那麽這個樣本池裏的任何一個人都必定是陰性。那麽就不用對這32人一個一個地檢測(但是仍然需要做了32個采樣),而是僅一次測試就把這32個人都排除了。減少了31個測試。
 
對於剩下的另一半的32人呢?如法炮製。
 
再取一次16人的混合樣本池,如果最好的結果是陰性。這16個人就一下子排除了。
第三次對剩下一半16人,做8人的混合樣本池,最好的結果是陰性。這八個人就一次排除了。
第四次是對剩下8人,進行4人的混合樣本池,最好的結果是陰性。這四個人就一次排除了。
第五次是對剩下4人,2人的混合樣本池,如果是陰性。這兩個人就排除了。
第六次,僅剩下最後兩個人了。就要對每一個人都做測試。如果可能是3種。
兩人都是陰性,那麽這全部的64人就沒有一人被感染!
如果一陰一陽,就是隻有感染一人了;感染率就是1/64,即1.56%。
如果都是陽性,就是隻有兩人感染:感染率就是1/32,即3.12%。
 
這樣的樣本池法,最好的結果就是,對全部64人,采了64次樣,但是僅僅做了7個測試,就完成了對全部64人的測試。每個人都必須被采樣,這是必須的。但是,不是每一個人都需要做測試。最好的情況,就是隻做了7次測試,就查清了64人。7/64,即是挨個檢測的11%的檢測量。
 
對於昂貴的耗料耗時耗人工的核酸檢測來說,樣本池法是非常有效,非常經濟合算的。極大地降低了測試成本!
 
這樣的樣本池法,也叫做“二分法”。
 
上麵是最幸運的情況。如果不幸呢?我們來看看“最不幸”的情況。
 
如果這個32人的“樣本池”的測試結果是陽性,就必須對這個“樣本池”裏的人重新來一次采樣和測試。可以一個人一個人的測試,找到具體誰是陽性,誰是陰性。不僅僅必須要對這32個人重新測試,還要對另一半的32人從頭開始。
 
也可以,對這個陽性的“樣本池”再來一次16人的混合樣本池,最壞的結果是陽性。不僅僅必須對這16個人重新測試,還要對另一半的16人從頭開始。
第三次是8人的混合樣本池,最壞的結果是陽性。不僅僅必須對這8個人重新測試,還要對另一半的8人從頭開始。
第四次是4人的混合樣本池,最壞的結果是陽性。不僅僅必須對這4個人重新測試,還要對另一半的4人從頭開始。
第五次是2人的混合樣本池,如果結果是陽性。那麽這最後四個人的每一個人都要采樣測試。
 
這樣的樣本池法,最壞的結果就是,對全部64人,每一個人都被重複了4次采樣和4次檢測。一共采了256次樣,做了256個測試。最終結果,最壞是64人都被感染了,百分之百的感染。最壞之下的最好的結果是,每個4人裏隻有一個人是陽性,另外3人都是陰性。就是四分之一,即25%的感染率。但是,仍然是要采256次樣,做256個測試。
 
這樣,樣本池法反而增加了工作量,還不如64人,每一個人都測試一次了。
 
所以,樣本池法的運用是有條件的,需要隨機應變,靈活運用的。
 
而且,樣本池太大了,可能降低了檢測的靈敏度。我前麵用的32人的樣本池就太大了。這樣“誇張”的樣本池法,隻是為了使得“減少測試量到11%”可以顯易而見。如果32人中隻有一個陽性的話,陽性的濃度立刻就降低到了1/32,很可能就檢測不出來了。10人的樣本池就會把一個陽性的濃度降低到1/10。多大的樣本池是合適的呢?這就不是紙上談兵,而應該從試驗中總結出來。從微信上武漢大嫂的抱怨來看,在武漢的“大會戰”中,是采用了10人的樣本池。那個大嫂抱怨:“把我們十個人的樣品不注名地放在一個容器裏”。大嫂說,“那查個鬼啊!”。這是因為她不知道到樣本池”的理論。
 
那麽,我們就用10人“樣本池”來分析。如果這個“樣本池”是陰性,那麽這10人就全部是陰性,就節約了9/10的測試量。如果是陽性呢,就要把這10人叫回來重新測試。
改為5人“樣本池”,如果結果是陰性,這5個人都是陰性,不用再測試了。
對於其餘5個人,一一測試,總測試量就是7次,7/10,也減少了3次。
如果再采取3人“樣本池”,如果是陰性,這3人都是陰性,隻要再分別測試剩下的兩個人就完成了。這樣的總測試量就是5次,減少了50%的工作量。
如果3人“樣本池”是陽性,那麽這5個人都要逐個測試。總工作量就是8次。8/10.
如果第一個5人“樣本池”是陽性,就重複上麵的分析,總測試量大約為50%到80%。因為他們有把握,剩下的5人應該全是陰性。因為,在決定采用“樣本池”方法之前,他們已經做了前期試驗,得到了平均感染率是5%。但是,為了避免漏側,還是要對剩下的5人,做一個“樣本池”測試。這樣來,總測試量大約人人檢測的為60%到90%。
 
到這裏,我們要回過頭來說,“武漢大嫂”的抱怨是完全正確的,即使采用樣本池”方法,不可能把受測試的老百姓,反複的叫回來重新采樣,更要被老百姓罵死了!一次采樣的量必須夠用測試3次。
 
所以,那個大嫂抱怨:“把我們十個人的樣品不注名地放在一個容器裏,那查個鬼啊!”。她是完全正確的。不管她懂不懂樣本池”。
 
由此看來,樣本池”的方法也隻能用於第一步,頂多到第二步,到了4人“樣本池”,就沒有什麽優越性了。
 
對於美國斯坦福大學研發出來的抗體快速檢測來說,測試與采樣基本上就是一件事兒。除了昂貴複雜的核酸檢測,這樣的混合樣本池法,也就沒有多少優越性了。
 
我不是生化醫學領域裏的人,隻是一個工程師,隻是有興趣從簡單算術來理解樣本池”的理論。本文不談如何政治問題,隻是數學和邏輯。可能貽笑大方。歡迎專家批評指正。
 
 (全文到此結束)

19428182 發表評論於
A question, Why selected 50/50 but the Golden Section way?
balancedview 發表評論於
你的想法考慮到很多實際情況。
根據我讀到的有關文章,樣本池是最多5到10個人,這樣能保證每個人的血不會被過分稀釋,使得病毒太少而被漏測,同時每個人最多測2次。
西風-西風 發表評論於
讚好文,謝科普。
dqdeer 發表評論於
在感染人數很少的情況下,效率肯定是很高的。瞎質疑就是和文中的大嫂一個水平?
charlie_us 發表評論於
采用樣本池的方法,可以把每個人的樣本分成幾份,拿第一份做第一遍測試,如果需要第二遍測試再取第二份,以此類推。不需要把人叫回來取第二,三次樣。
大漢唐 發表評論於
博主好象有些基本概念似是而非:大數據下的概率是很有效的,如果無症狀感染者比例很低的話——根本不會有那麽多重複測試的可能性
老_錢 發表評論於
回複 '隻愛一點點' 的評論 : 謝謝。
老_錢 發表評論於
謝謝你們的討論。
我理工男,對醫學是外行。喜歡瞎琢磨。隻是拋磚引玉。
顯然你們都是行家。向你們學習了。謝謝了。
隻愛一點點 發表評論於
讚好文! 那篇公眾號文章不夠嚴謹,看看就好。 這種混合檢測法是不是夠可靠,我表示懷疑。
武勝 發表評論於
你這不談概率哪兒行,那個“全都是陽性”可能性有麽?要知道這都是無症狀人群,陽性可能百分比是個位數或更少,90%以上都是陰性。你說的最壞情況在超大樣本下根本不可能發生。

同樣樓下質疑的測試劑不準率也是可以定量的。關鍵是樣本大,一定朝概率方向去。對每個人檢測的準確度可以存疑,但總體結果不會錯。
playnice 發表評論於
說的很有道理。尤其在假陰率如此高的情況下,很可能測不出來。
登錄後才可評論.