寫在前麵:
本貓認為,在大數據時代,群體醫學統計模型的作用將會越來越小,而建立真正的個體化醫學(personalized medicine)模型才是正確的方向,即所謂的精準醫學(precision medicine)。有一個很直接的例子就是,大家都知道抽煙喝酒吃肥肉對身體健康不利,但是,在人群中放眼望去,抽煙喝酒吃肥肉的長壽者竟然比比皆是。這就是個體之間的差異,有遺傳基因的原因,有個人體質的原因,有生活習慣的原因,等等。如果可以建立起個人的生物數據檔案,根據個人的數據來建立數據模型,那麽,對於保持個人的身體健康會有很大的幫助。
正文:
現今的時代,患糖尿病的人數迅速增加,這種病已經成為遍及全球的流行病。什麽是II-型糖尿病(Type-II Diabetes)?
II-型糖尿病是一種令患者血糖水平過高的疾病。這種病會妨礙血糖從血管進入細胞,令細胞無法得到所需的能量,最終使身體的重要器官嚴重受損。這種病也會妨礙血液循環,導致失明,腎病,腳趾或腿部也可能因組織壞死而要被切除。大部分糖尿病患者都死於心髒病突發或中風。最近醫學界也發現這個病使人更容易患上癡呆症。
在患上II-型糖尿病之前,患者通常已經處於糖尿病前期(Pre-Diabetes),也就是血糖水平稍為高於正常。糖尿病和糖尿病前期的區別在於,II-型糖尿病目前是一種隻能控製,不能治愈的病,但那些糖尿病前期的人經過對生活習慣的控製,血糖可以回到正常水平。但是,糖尿病前期沒有任何明顯病征,因此不容易察覺。一些報告指出,全球約有3億1600萬人處於糖尿病前期,但當中有很多都不知道自己是患者。在美國,大約有九成糖尿病前期患者都不知道自己有這個病。
早在2001年,本貓已經意識到自己會很容易患上糖尿病。原因有四個:(1) 亞裔屬於糖尿病高危人群;(2) 家族中有人患糖尿病;(3) 體重指標偏高(BMI>25);(4)每天坐著的時間過長(工作和休閑的大部分時間都是坐著的)。本貓決定要注意監測自己的血糖水平。作為一個生物統計師,本貓對於數據具有一種職業上的熱愛。於是就開始注意收集儲存這些血糖數據,最簡單的來源是每年的年度體檢報告。下圖是隔夜空腹血糖值的趨勢圖。
從上麵的趨勢圖,可以很明顯的觀察到,隨著年齡的增加,隔夜空腹的血糖指標也在不斷升高。
然而,對於糖尿病高危人群和已處在糖尿病前期的人群來說,隔夜空腹的血糖水平並不是最好的指標,因為每天的最低血糖水平在正常範圍並不能保證每天的平均血糖水平也是在正常範圍的。也就是說,隔夜空腹血糖高的話,那你的平均血糖水平一定是高的,但反之不然。餐後兩小時的血糖水平(接近於每天的最高血糖水平)才是比較好的監測指標。而且,餐後兩小時的血糖值一定有所吃食物的直接影響,可以對控製食物有直接的指導作用。
你不能改變自己的基因,但能改變自己的生活習慣。隻要能把血糖水平夠控製到正常範圍,就能減低自己患上II-型糖尿病的風險。隻要血糖水平在沒有藥物作用下是可控的(利用食物控製和增加運動),那就說明體內的胰島素功能沒有被完全破壞,那就不是正真意義上的II-型糖尿病。
在目前的市麵上和網絡上,論述和指導對血糖控製的專家論文比比皆是,但是全都是泛泛而談,沒有一條是針對個人的。事實上,每一個人的生理條件是不一樣的,腸胃裏麵的各種酶的質量的數量以及成分組合都是不一樣的,所以,對於糖尿病高危人群和已處在糖尿病前期的人群來說,不可能有一條“放四海而皆準”的生活習慣(飲食和運動)方麵的指導。比如說,有些人喝粥會引起血糖快速飆升,但有些人卻是可以喝粥的(本貓喝粥和吃米飯的情況類似)。重要的是要每個人要找到適合自己的生活習慣。
作為一個生物統計師,本貓想回答這樣的問題,能不能用數據建模來找到自己優化的食物種類和運動方式。於是開始了一個人的臨床試驗。從2016年開始,本貓於是開始用血糖儀每天觀測自己餐後兩小時的血糖水平。並且記錄所吃的食物和運動的方式。
雖然一個人的臨床試驗很難做到隨機化,而且連續的日子的食物和血糖水平會有很高的相關性。還要注意到每周7天的周期性因素(通常周末的食物會和平常不一樣),所以在數據的觀察中,要注意各種食物的隨機搭配,也要有重複樣本,在數據建模過程中,每5天取一個數據。看成是近似獨立隨機樣本吧。這是本貓能想到的比較好的辦法了。在這個(還在繼續的)過程中,家裏負責夥食的貓嫂,表現出非常的配合,在此表示衷心的感謝。在家裏製作的食物菜點,都是不含糖的,而外出吃餐館點菜的話,那菜點裏麵一定是重糖濃油的,但是出去吃自助餐的話,那食物的選擇又是可以自己有控製的。這對餐後血糖的控製,是有很大差別的。
可以看到,在開始做記錄的時候,血糖值上下跳動很大,因為不清楚如何控製血糖,有點手足無措的感覺,還在摸索的過程中。紅線是糖尿病的分界線,黃線是血糖正常值,在紅黃線之間的,可以認為是糖尿病前期。本貓觀察到,2018年以來,自己血糖值基本穩定在紅線和黃線之間。隻要血糖值不借助藥物就可以控製,那就是個好的結果。和慢性病共存,這是現代人類對生命過程新的認識。對於那些無法治愈的病,就應該學會和病共存。
在建模過程中,血糖水平是因變量,食物類型和運動方式作為自變量。其中食物類型分成米麵食物,素菜,肉類,水果,運動方式分為低強度(散步),中強度(伸展操),高強度(打球)。在每個食物大類裏,還有很多子類。每隔5天取一個值,這樣就有五組樣本。每一組樣本,可以認為是來自同一母體的重複樣本。於是,可以用隨機因子和固定因子的混合模型(Mixed Model)來做數據分析。而其中的隨機參數可以用貝葉斯(Bayesian)方法來估計,而且隨著新的數據的不斷更新,模型也可以不斷的更新。
對於本貓的個體情況,數值統計模型的結果顯示,模型的估計值和原始值有一個非常好的擬合度,線性係數為0.994。模型擬合度的Q-Q圖顯示,模型誤差的分布很好的服從理論上的正態分布。
注意到這個模型不是群體模型(population model),而是一個個體模型(individual model),也就是說模型結果不具備群體普遍性,而是對本貓這個具體的個體有很好的針對性。這個模型最特殊的結果的就是把自變量的類型變量,針對本貓的個體情況精確的數值化了。
比如說,飯後兩小時之內的低強度運動可以期望降低餐後2小時的血糖值14mg/dL,而中強度的運動可以期望降低餐後2小時的血糖值38mg/dL。少量鮮水果(半份)和水果幹(葡萄幹)不會增加血糖值,大部分的肉類都會增加血糖值(30 – 50mg/dL),本貓常吃的所有蔬菜都會降低血糖值,其中葉菜可以期望降低血糖值65mg/dL,而豆類菜可以期望降低血糖值30mg/dL,等等。這個結果對於本貓控製血糖值有著很好的指導意義。
因為糖化血紅蛋白(A1c)可以反映過去三個月血糖控製的平均值,A1c被認為是一個長期的血糖指標。A1c不能顯示血糖規律,它隻是表示血糖控製好壞的一個指標。美國糖尿病學會的目標是A1c應控製在7%(154mg/dL)以下。研究表明,A1c在7%以下能減少糖尿病並發症的發生。美國內分泌學會的標準是 A1c應低於6.5%(140mg/dL)。接下來,本貓將試著建立個體統計模型,希望可以用每日自測血糖值來較好的預測A1c。
如果有讀者屬於糖尿病高危人群,一定要盡早檢查你的血糖水平。並且可以利用本文的方法建立屬於你自己的血糖值估計模型。不要過分迷信媒體上專家的建議,因為那些建議都是來自泛泛的群體統計模型,並不對你的個體情況會有很大的針對性。人們常常吐槽專家們的建議,但是並不知道專家們的建議都是基於不同的群體統計模型,而群體統計模型是排除個體差異性的,這也就是為什麽常常會有吐槽專家的個體例子。
結語 (重複寫在前麵):
本貓認為,在大數據時代,群體醫學統計模型的作用將會越來越小,而建立真正的個體化醫學(personalized medicine)模型才是正確的方向,及所謂的精準醫學(precision medicine)。有一個很直接的例子就是,大家都知道抽煙喝酒吃肥肉對身體健康不利,但是,在人群中放眼望去,抽煙喝酒吃肥肉的長壽者竟然比比皆是。這就是個體之間的差異,有遺傳基因的原因,有個人體質的原因,有生活習慣的原因,等等。如果可以建立起個人的生物數據檔案,根據個人的數據模型,那麽,對於保持個人的身體健康會有很大的幫助。
心理學上講,是不是人對小概率事件的關注度更高?抽煙環境吃肥肉早死的一大把,人們不稀罕了。所以特例受到特別的關注。得艾滋病不死,炒股能發財也是一個道理。
專家們的建議的確常令人困擾,一會兒雞蛋對身體不好,一會兒一天可以吃兩個。
西方西醫的醫學模型和統計數據基本上是建立在洋人族群,亞裔族群除了屬於糖尿病高危族群外,不吸煙女性患肺癌的機率較高。有沒有其他亞裔族群的醫學病理差異?
謝謝分享!