個人資料
正文

微侃醫林 187: 臨床思維(三 可能性比,四 循證醫學與證據誤區)

(2025-03-09 16:49:00) 下一個

三 不確定性與量化可能性 — 可能性比(Likelihood ratio)
四 循證醫學與證據誤區

我思,故我在。 —笛卡爾

目錄:

一 良醫三大要素
醫德,知識技術,臨床思維的習慣和能力
二 不確定性與量化可能性 — 概率(Probability)
I:臨床充滿不確定性
II: 鍾形曲線與臨床思維
III: 三種概率:簡單概率、複合概率和條件概率
IV: 概率操作與概率誤區
三 不確定性與量化可能性 — 可能性比(Likelihood ratio)
四 循證醫學與證據誤區
五 推理
I: 演繹推理(Deductive Reasoning)
II: 歸納推理(Inductive reasoning)
III: 溯因推理 (Abductive reasoning)
六 兩種臨床思維方式及思維誤區
I: 經驗直覺思維
II: 分析思維
七 理性思維者若幹特性[2]
八 臨床思維偏見和誤區[2]
九 我的臨床思維

三 不確定性與量化 — 可能性比(Likelihood ratio)

Possibility, probability, likelihood, 中文翻譯都是可能性。醫學思維理論中, Possibility是若幹可能發生的事件, 我們想要診斷或者排除的疾病 — 心肌梗塞、中風、肺炎等等。 Probability 是這些事件的概率。 Likelihood 是如果一個假設成立,得到有關證據的概率。例如一個病人發生了心肌梗塞,肌鈣蛋白陽性的概率。Likelihood 像是敏感性(Sensitivity = 陽性結果人數/病人人數)。

我關心的是病人患病的概率,是未知數。檢查結果的概率隻是幫助我診斷的手段而已,是已知數。不過Likelihood 來曆不小,這個概念的提出者羅納德·艾爾默·費希爾爵士(Sir Ronald Aylmer Fisher 1890 – 1962 ) 是英國的一位全才。他是數學家、統計學家、生物學家、遺傳學家。他是“幾乎單槍匹馬地奠定了現代統計科學基礎的天才”, “20世紀統計學界最重要的人物”。1918 年,他發表了《孟德爾遺傳假說下的親屬相關性》,用數學將孟德爾遺傳學和達爾文的自然選擇結合起來。20世紀30年代末40年代初,李森科在蘇聯步步高升,蘇聯的頂級遺傳學家被斯大林作為人民敵人的幫凶一掃而光。

FisherFisher in 1913(維基)

Likelihood ratio (LR) 比Likelihood 更重要。
陽性可比性比(Positive Likelihood ratio) [LR(+)] = 敏感性/(1-特異性) 或者說=真陽性率/假陽性率
陰性可比性比(Negative Likelihood ratio) [LR(-)] = 假陰性率/真陰性率 =(1-敏感性)/特異性

統計學家說:LR讓我們思維的權衡點、或者傾向偏移,而不是概率本身。

LR(+)數值越高,真陽性率越高於假陽性率,權衡點偏向真陽性,陽性結果的價值就越高。LR(+)= 1, 真陽性率等於假陽性率,這個檢查就是向天上甩硬幣,沒用。LR(+)=2-3,真陽性率是假陽性率的2-3倍,檢查有價值。LR(+)10,真陽性率是假陽性率的10倍,檢查陽性幾乎肯定是真陽性,病人真的有病。

LR(-)數值越低,假陰性率越低於真陰性率,陰性結果的價值就越高。LR(-)= 0.2-0.3,真陰性率是假陰性率的3.3-5倍,檢查有價值。LR(-)= 0.1,真陰性率是假陰性率的10倍,檢查結果陰性幾乎肯定是真陰性,病人真的沒病。

優勢比(Odds) = 概率/(1-概率)= 發生的概率/不發生的概率 。一個病人冠心病的概率是 25%,則不發生的概率是75%。我們傾向於認為他/她發生冠心病的Odds 是1/3。有時候我認為Odds 是畫蛇添足、文字遊戲。概率25%已經給了我一個清楚的概念,不需要拐來拐去拐一個1/3出來。

LR (+) 或者 LR(-) x 檢查前Odds =檢查後Odds。

假設一個胸痛病人,冠心病基礎概率是45%,實驗室檢查肌鈣蛋白敏感性是90%,特異性是85%。
LR (+) = 0.9/0.15 = 6;LR(-)= 0.1/0.85 = 0.117。肌鈣蛋白檢查含金量非常高。
檢查前Odds, 或者說基礎Odds =0.45/0.55 = 0.88。
肌鈣蛋白陽性,檢查後Odds = 6 x 0.88 = 5.88, 有心肌梗塞的概率與無心肌梗塞概率之比將近6:1。
肌鈣蛋白陰性,檢查後Odds = 0.117 x 0.88 = 0.1, 有心肌梗塞的概率與無心肌梗塞概率之比是1:10。

根據Odds 也可以判斷病人患病可能性多大。但是Odds 讓我感到別扭,我更喜歡概率。Odds 可以轉換為概率。
Odds = 概率/(1-概率),概率=Odds/(1+Odds)。
繼續用上麵的例子:
肌動蛋白陽性,檢查後概率=5.88/(1+5.880) = 85%。如果肌鈣蛋白陽性,發生心肌梗塞的概率從45%上升到85%。
肌動蛋白陰性,檢查後概率=0.1/(1+0.1) = 9%。肌鈣蛋白陰性,發生心肌梗塞的概率下降到9%。

作者說[1]: 上麵的計算很方便,我們幾乎可以馬上心算概率。我倒是感到很不方便,要根據基礎概率,敏感性和特異性,首先計算LR(+), LR(-) 和Odds, 再計算檢查後Odds, 再把Odds 換算成檢查後概率。用前麵的貝葉斯公式8和9,一步就算出來了,我為什麽要去彎彎繞?

LR(+) 數值越高,陽性檢查結果增加疾病存在的Odds和概率,幫助確診。LR (-) 數值越低,陰性檢查結果降低疾病存在的Odds和概率,幫助排除診斷。但是LR(+) 和LR(-)都是由敏感性和特異性兩個指標決定。敏感性越高,陰性檢查結果就越容易排除診斷。 特異性越高,陽性檢查結果就越容易確定診斷。 Likelihood ratio 自然可以幫助診斷(確定或者排除),仍然是拖泥帶水,沒有敏感性特異性直接方便。

不少實驗室檢查和圖像檢查都有Likelihood ratio 資料, 如心電圖ST段上抬與心肌梗塞,胸片肺水腫與心衰,腦鈉肽與心衰,D-二聚體與肺動脈栓塞。

舉一個心衰的例子:
半夜三更突然呼吸困難(paroxysmal nocturnal dyspnea PND) LR + 2.6,LR – 0.7。陽性可以增加一點概率,陰性不能排除。
體位性呼吸困難(Orthopnea)LR+ 2.2,LR-0.65。和PND 差不多.
第三心音(S3 gallop): LR + 13,LR -0.83。和胸片差不多,陽性幫助確診,陰性不能幫助排除。
胸片CXR: LR+ 13.5,LR(-) 0.48。胸片如果陽性,心衰的可能性大為增加。胸片陰性,沒有什麽意義,不能排除心衰。
上麵這些症狀體征和胸片,結果陽性可以幫助診斷,結果陰性對排除診斷沒有什麽幫助。我感到困惑,一個病人什麽症狀體征胸片的心衰表現都沒有,我仍然不能說他/她沒有心衰?我經常依靠PND和體位性呼吸困難幫助排除心衰,看來我搞錯了?

肺炎的例子[5]:
呼吸擴張不對稱:LR+44,LR-NS
叩診實音:LR+3.6,LR-NS
支氣管呼吸音:LR+3.3,LR-0.9
語音增強(Egophony):LR+4.1,LR-NS
濕羅音:LR+2.8,LR-NS 0.8。
和心衰的例子一樣,陽性體征可以幫助確診,陰性沒有什麽意義。今天的肺炎病人,很少有這些陽性體征。另一本書說肺炎的體征,對診斷沒有任何幫助。我更相信這本書,也許是給自己馬馬虎虎查體找借口。也許我沒有遇到幾個陽性體征。

看著這些數據,我總是想:這些數據是怎麽來的?提供數據的人群有多大?代表了普遍的人群還是特定的人群?收集數據的醫生,特別是作體檢的醫生,具有多大的代表性?這些LR(+)和LR (-),隻是大致估計,僅作參考,而且不可能適用於任何人群,任何醫生群體。但是掃一掃這些數據,可以讓醫生的判斷有一個量化的估計,雖然這些量化不可能是精確的數字。

Normogram另外還有這種列線圖(nomogram)(圖來自網絡), 隻要知道基礎概率(pretest probability),知道檢查的LR(+)(-), 知道檢查結果,一查就知道檢查後的概率。

醫生每天看病人查房,既不會計算Odds、概率,也不會查列線圖。但是有這些概念,遇到困難病例時查一查,算一算,可以幫助反思審查自己作出的診斷和治療決定,可以防止自己偏離軌道太遠,防止鬧笑話。不過,我自己不用LR和Odds。知道概率(臨床更常用發病率Prevalence)、敏感性和特異性,可以推算陽性預測率、陰性預測率足夠了。兩者都是為了判斷檢查後的概率,計算方法表達方式不同而已。

四 循證醫學與證據誤區

今日行醫,是根據證據行醫(Evidence based medicine EBM),用什麽藥物,體內安裝什麽醫療裝置,是手術還是經導管換瓣膜,都得有證據支持。不是所有的證據生而平等,社交媒體、微信帖子不足為憑,直接跳過。 證據等級(不同的協會組織,細節有所差別):
• IA 多個隨機對照臨床試驗。
• IB 一個隨機對照臨床試驗。
• IIA 一個非隨機對照臨床試驗。
• IIB 一個病例對照(case-control)或隊列研究(cohort study)。
• III 病例報告
• IV專家意見。

這些證據,還要判斷質量,作者對這些證據是非常有信心,還是沒有任何信心。根據證據等級和質量,作者推薦強度:
• A 級:證據充分,好處遠遠超過潛在風險, 推薦使用。
• B 級:證據合理,好處遠遠超過潛在風險, 推薦使用。
• C 級:益處和風險之間的平衡太過接近,不適合作為一般性建議, 除非有個人考慮。
• D 級:風險大於潛在益處。臨床醫生不應該常規用於無症狀患者。
• 一級:科學證據缺乏、證據質量低劣或相互矛盾,無法評估風險與收益的平衡。醫生應幫助患者了解其不確定性。

證據不是生來平等,頭等證據也不是個個鐵證如山。要警惕證據誤區:
• 企業支持的研究,報喜不報憂。
• 發表偏見,往往是有效的結果就報告,無效的結果不報告。和上麵的企業報喜不報憂相似,但這是雜誌主編的誤區。
• 研究者偏見和利益衝突。
• 企業操縱資料。
• 不能看到病人層次的資料。
• 刀手。
• 企業讚助的繼續醫學教育(CME)。
• 直接對消費者廣告。
• 研究的人群沒有代表采用此項治療的人群。
• 相對危險誤區:假設一個預防冠心病的藥物,使冠心病5年發病率降低0.5%,而對照使之降低0.3%。相對危險降低了40%,看起來效果不錯甚至驚人。 但是絕對危險隻降低了0.2%,微不足道。讀資料,要習慣看絕對危險變化。看需要治療人數(NNT)也是好主意。NNT 越高,效果或者經濟效益就越成問題。
• 終點(End point)替代問題。終點是判斷療效的指標,如死亡率。治療冠心病的藥物,除了死亡率,自然還有心肌梗塞發生率,心血管死亡率。治療心衰的藥物,還得加上心衰死亡率,心衰住院率。替代終點,就是用其它指標來判斷療效,如腦鈉肽,如血脂。當年一個它仃藥物Simvastatin,最初臨床研究證明它可以縮小頸動脈粥樣硬化斑塊。FDA據此批準。批評者說,這是替代終點,不能作為批準的證據。Simvastatin後來撤出市場。Merck 公司臥薪嚐膽,重作臨床試驗(4S臨床試驗),終點是死亡率,冠心病發病率。試驗證明有效,再次殺入市場。
• 研究設計誤區或者誤導,新的藥物或者器械,不是與已經在使用的藥物器械對照,而是與安慰劑對照。而批準以後,這些新的藥物往往比老藥貴幾倍甚至幾十倍,而療效並不比老藥優越。這是普遍現象。

關於製藥公司如何操縱研究資料,操縱證據,《Sickening: How Big Pharma Broke American Health Care and How We Can Repair It》有詳細的介紹。微侃醫林155-159 山寨了若幹內容。

我的習慣是,遇到疑問就到UpToDate, 幾個頭號醫學雜誌(JAMA, NEJM, Annals of Internal Medicine, JAMA Internal Medicine), 大醫學協會(AHA,ACC, ADA)的指南和Cochran Review 找答案。大部分時候馬馬虎虎掃一下,然後無條件接受。有時候懷疑那些答案或者推薦,就仔細讀文章。有的時候讀了文章,感到結論,推薦的治療或者治療改變,證據不夠充分,於是決定不采用所推薦的治療。曾經寫過兩篇:微侃醫林 93: 心衰神藥諾欣妥(Entresto);微侃醫林 83: 頭號雜誌文章不總是一錘定音。雖然質疑上述來源的若幹文章,對於這些權威來源還是信任的。自從讀了《Sickling》一書,對這些來源也開始疑神疑鬼。讀文章,首先是挑漏洞,而不是來者照收。

循證醫學,如果頭號醫學雜誌,頭號醫學協會/指南,都有被收買的嫌疑,或者至少有拿人手軟的嫌疑,到哪裏去找證據?我成了證據虛無者,我不知所措。不可不信,不可全信,抱一顆懷疑之心。隻能這樣了。

嚴格說,循證醫學不屬於臨床思維,至少不屬於診斷思維。但是在選擇治療,特別是那些昂貴的治療時,有必要查查證據,查查這些治療究竟多有效,值不值那麽多錢。美國內科醫師學會(American College of Physicians ACP)已經開始把經濟因素列入指南中[7]。

[ 打印 ]
評論
目前還沒有任何評論
登錄後才可評論.