去年年中時,城頭有個新聞報道了一位102歲的長壽阿婆有個特殊嗜好—可樂。她每天要消費1升可樂。從這裏可不可以得出一個結論:可樂有助於延年益壽?顯然,要下這個結論還為時過早。從這例個案到結論還有許多論證步驟。就像要證實一個藥物是否有效,光有一例是不夠的。這就需要進行藥物的臨床試驗。以可樂為例,怎樣的臨床試驗才可以證明到底可樂有無延長壽命的作用?
首先,需要一個足夠大的樣本來測試。因為就像擲分幣,得到正麵和反麵的機率應該是1:1。可是,如果隻草草地擲一兩次,很可能要不全是正麵,要不就全是反麵,以致於結果不能真實反映事實。隻有擲的次數多到一定值後,擲出正麵和反麵的結果才會最接近概率1:1的事實。那麽,要多大的樣本才有話語權?這是可以由統計學的數學模型計算得到。換句話說,如果在一個足夠大的人群樣本裏,喝可樂沒有重複多次產生長壽現象,就不能說可樂有助於延長壽命。阿婆的長壽和飲用可樂不過是巧合。
其次,設立有效的對照組。目的是用來比較喝可樂和不喝可樂的壽命有無差別。如果不喝可樂和喝可樂的人群相比,壽命無差別;那就不好下結論說:可樂可以使人長壽。對照這個詞用英語表達是control, 有控製的意思。也就是說要控製好對照組和試驗組具有可比性。比如說,兩組性別、年齡、基礎疾病、家族史等都沒重大差異。簡而言之,對照組和試驗組和試驗組之間,除了喝與不喝可樂外,沒有其他的區別。這樣,當兩組人群出現壽命上的差異時,才能下結論說是這個差異是由飲用可樂引起的。
最後,檢驗差異的顯著性。假設在兩組人群中,最後喝可樂組有12位活到了100歲,不喝可樂組有9位活到了100歲。那麽可不可以就此得出結論:喝可樂就比不喝可樂的人更可能活到百歲?這就需要判斷:12和9的差別有沒有意義。這種差異顯著性的檢驗也是可以根據統計學的數學模型進行計算得到答案。如果統計學計算得出差異沒有顯著性,那麽就可以認為12和9的差別是抽樣誤差引起。就像擲21次分幣,得到12次正麵和9次反麵一樣,實際上並沒有差別。
在臨床試驗中,最重要的是避免偏倚(bias)。要取得一個可靠臨床試驗結果,無論是試驗設計還是過程中都不能有偏倚。比如,因為已有個案報道喝可樂健康活到百歲的影響,就有人為的盡力分到喝可樂這一組的可能性;或者分到可樂這一組的試驗對象有了長壽心理暗示,分到不喝可樂這一組卻有了折壽的心理暗示。為了避免人為的分組不公平和心理活動的影響,在臨床試驗中,最常用的方法是 “隨機”(randomization) 和 "盲" (blind)。分組不是按工作人員指定或受試者要求分配;而是隨機分配,以類似抽簽的方式決定。盲就是在破盲前不知道在哪個測試組。單盲一般是試驗對象不知道自己在哪一組,雙盲是試驗對象本人和工作人員都不知道試驗對象分在哪一組。這裏還有一個技術關鍵:安慰劑(placebo)。如果對照組給的是白水,很容易就同可樂區分開,這樣就無所謂盲了。安慰劑就是除有效成分以外,外觀,口感都和測試藥物一致。片劑的安慰劑一般就是片劑的填充劑成分。前瞻性(prospective)的試驗要比回顧性(retrospective)要嚴密。所謂前瞻性試驗就是:先設計好試驗的方案,再按試驗方案錄用試驗對象、在試驗過程中收集數據、最後分析、總結。而回顧性的試驗則是已有數據,然後再定標準進行分組,統計分析。這樣,回顧性試驗較前瞻性更容易出現人為幹預的偏倚。因此,為新藥上市所進行的臨床試驗按法規必須是前瞻性設計的。
概括而言,要證明一個新藥的有效性,必須經過臨床試驗的驗證。而這個臨床試驗應該是前瞻性的、大樣本的、隨機雙盲對照的。如果有廣告或個人宣傳某個產品的特殊功效時,也請看看這個結果是怎麽來的:有沒有經過前瞻性的、大樣本的、隨機雙盲對照的臨床試驗的驗證。
一篇好的科普文章是要讓普通百姓都能看懂、理解。這一點上我還有很多需要學習和提高的。
這篇文章旨在討論什麽是科學的、縝密的臨床試驗設計。可樂與長壽不過是拿來打比方。可樂是藥物,而長壽則是需要論證的療效。所以這篇文章不是討論長壽的秘訣,而是討論我們應該怎樣來驗證一種藥物的某一假定的療效。
以中醫為主,西醫為附, 咱很容易就讓人活到90. 用你的統計法,google 中國逝世的將軍,部長以上的有幾個活不到90的?