個人資料
  • 博客訪問:
正文

柴靜正確陳述論文結論,方舟子不懂妄批

(2015-03-13 22:06:50) 下一個

方舟子質疑柴靜捏造數據的事情,經過這幾天的討論,初步結論已經可以做了。那就是柴靜正確陳述了論文的結論,而方舟子完全沒有能理解該論文。


柴靜在視頻中說道:【當pm2.5值升高的時候,人群的死亡率是隨之上升的。】(12分34秒)。其依據是中科院大氣物理研究所在2013年的一篇論文:《Time-seriesanalysis of mortality effects from airborne particulate matter sizefractions in Beijing》的圖6。

正如我在《詳解方舟子沒看懂的霧霾曲線》中指出的,這張圖顯示的是【PM2.5值每增加10,死亡率增加的百分比】。因此,隻要這張圖的數據大於零,那麽死亡率就是隨PM2.5值上升而上升。這張圖顯示,PM2.5值每增加10,心血管病死亡率平均將上升1.3%,呼吸係統病死亡率將增加0.6%。因此,柴靜說當pm2.5值升高的時候,人群的死亡率是隨之上升的】完全符合論文的數據與結論。

方舟子由於未能正確理解這張圖,以為圖中顯示的是死亡率。方舟子說 【pm2.5值最高的是2006年,之後由於要開北京奧運會進行治理,北京pm2.5值其實是逐年下降的。柴靜的圖卻顯示那幾年北京循環係統疾病死亡率逐年上升,豈不成了隨著pm2.5下降,人群的死亡率是隨之上升的?】

至於方舟子就柴靜視頻中顯示的最上麵一條曲線的問題提出的捏造指控,有幾點可以確定:


1)柴靜圖中最上麵的曲線四個數據點是來自原論文計算出的增長率係數,而不是捏造;

2)柴靜與原論文的區別在於,原論文使用三次曲線進行吻合,而柴靜使用二次曲線;但無論根據原論文曲線,還是柴靜的曲線,結論都是:PM2.5增加則死亡率增加

3)方舟子對柴靜作假的推理是基於他對曲線的錯誤理解,把曲線當成了死亡率,而不是死亡率的增加比例,基於方舟子的這一錯誤理解,他誤以為2008年死亡率下降,而他以為柴靜試圖在掩蓋2008年死亡率的下降。實際上,2008年的死亡率是上升的。目前我們沒有證據顯示柴靜與方舟子對該曲線有著同樣的錯誤理解。完全可能出現柴靜理解了原論文的精神、而方舟子沒有理解的情況。
我們目前閱讀到的柴靜所說的“當PM2.5值升高,死亡率升高”的說法完全符合原論文的數據顯示的結果。說柴靜試圖作假缺乏證據。

4)從方舟子12號對我的回應看,他當時仍然沒有理解圖中的數據是何含義。我對他的駁斥參見科學網博文。


說明:我之前都不知道柴靜是誰,柴靜的視頻我隻看了前兩分鍾,上麵柴靜說的話及其視頻截圖來自方舟子的文章


 

 cj.png
原來的曲線如下。
0.png


詳解方舟子沒看懂的“柴靜曲線" 精選

已有 2974 次閱讀 2015-3-1314:05 |個人分類:反民科|係統分類:科普集錦    推薦到群組

下麵這張圖最近在科學網引發了巨大的爭論,起因是柴靜引用了這張圖,而方舟子說柴靜對原圖數據進行了【捏造數據】的改動。該圖是 PeiLi等人發表的《Time-series analysis of mortality effects fromairborne particulate mattersize fractions in Beijing》中的圖六。方舟子可能是最早給出圖出處的。在《方舟子妄批柴靜捏造數據的錯誤》一文中,我指出方舟子雖然閱讀了原論文,卻根本沒看懂。我在文中同時做出了正確的解讀。但由於我之前並沒有閱讀論文,而隻是讀了這張圖,對圖中數據點的具體來曆並不清楚。

現在我終於讀到了這篇論文。下麵進行一個簡單的介紹。特別是講講圖中的幾個數據點到底是怎麽來的,希望通過這個詳解,能讓大家對原論文以及下圖有更清楚的了解。


該論文顧名思義是分析北京霧霾對死亡率的影響,這個分析是一個時序統計分析。作者根據的原始數據包括(1)2005-2009年每天的PM2.5等汙染指數;(2)每天的溫度、濕度等氣象數據;(3)每天的心血管病、呼吸係統病死亡人數。論文使用的模型公式是:

x.jpg


 

其中 E(Y )代表死亡人數期待值,X代表PM指數 (如PM 2.5、PM10),PM指數X 前β

是需要通過分析確定的係數(其意義我在後麵會重點講)。上述公式看起來複雜,各種因素堆在一起。因此,我做一個簡單的調整,把左邊的對數換成為右邊指數,使之變得更加一目了然


 

其中 f(T,RH, ...)  是一個未知的溫度T, 濕度RH 及其他變量的函數,在論文中使用多個分段三次曲線 s()的乘積代表,我們就不必去追究細節了。PM指數的影響在最後的指數項裏。論文作者們使用 R軟件包中MGCV模塊的 gam程式對數據進行分析,確定了 X前麵的係數 β。這個計算僅僅是一個調用軟件的過程,我們就不必去深究了。問題是 β 的意義是什麽。

由上述公式,在其他變量不變,而改變X時,我們有



 

可見 β 的意義是:當PM指數X增加一個單位時,死亡率增加的比例。(因為人口固定,死亡率增加比例與死亡人數增加的比例是相同的)。

明白這一點之後,上麵那副圖的數據點就很清楚了:它們是用2005-2009四年的數據分別進行統計分析算出的各年的β值(upto a multiplying constant)。

原論文圖的正確描述應該是【The inter-annual variability of the estimated percentincreases in daily mortality ASSOCIATED WITH 10 ug/m^3 INCREASE ofPM2.5 in recent years. 】 原論文圖下的描述少了大寫的部分。也就是說,原圖是 PM2.5值每增加10,死亡率增加的百分比。

另外,該論文的模型是否可以改進,那是另外一個問題,我就不在這多講了。


[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.