尼羅河水手中來

風在雲上,雲在水上,水在我心上。
個人資料
正文

從方舟子砍柴論真相與造假

(2015-03-20 18:06:19) 下一個

真相就是事物本來麵目;造假就是改變事物本來麵目。這個道理誰都知道。但是遇到實際問題,很多人自動認為既然打假,手裏當然握有真相。方是民之流正是利用大眾的這種慣性心理大行其道。

柴靜生孩子有三個細節,良性腫瘤,玩具小熊和手上的針眼。方舟子質疑柴靜生孩子造假,可能到現在都沒有人真正搞清楚,在生孩子的問題上柴靜作了什麽假,又根據什麽事實認定柴靜造假。

用一隻小熊來打假柴靜在美國生孩子的經曆,這本來就是八杆子夠不著的事情。認定小熊是醫院專門用來安慰小病人的,一開始就荒誕不經。實際上任何產科病房都不需要安慰小病人的玩具。給柴靜一個小熊並非醫院的行為而是護士的個人行為。小熊身上的眼科標識與柴靜生孩子的產科在邏輯上沒有任何聯係。

為了加強打假火力,方是民甚至不惜捏造柴靜言論。『柴靜談到她在生下女兒從醫院回家的路上,“全是煙熏火燎的味,我就拿一個手絹捂在她鼻子上”,這顯然不是在洛杉磯,貌似在北京。』。問題是柴靜說過“從醫院回家的路上”嗎?

柴靜說的是“回家的路上我就開始害怕了,全是煙熏火燎的味,我就拿一個手絹捂在她鼻子上。”在前後文中也沒有任何地方暗示這是“從醫院回家”。柴靜說什麽不說什麽是人家的自由。人家說出來的東西,你不能按照你自己的需要改頭換麵然後再來打假。用這樣的卑劣手段咬定柴靜造假,就不僅僅是質疑的問題了。這是在反對柴靜公布霧霾真相的既定立場之下鑽頭覓縫無事生非羅織罪名誹謗柴靜。

而最能表現出方是民無知又虛偽的還是關於那張死亡率與PM2.5 的三條曲線圖。方是民不是質疑柴靜視頻中科院大氣物理所提供的圖是怎麽來的,為什麽與原來發表的論文不同,而是結論性指控柴靜造假:“這顯然與事實不符,是對原圖的篡改。”。

從統計學上看,方是民不知道這三條曲線是如何產生的。曲線方程是用五年1825天的PM2.5數據與死亡率數據作出的非線性回歸。這個圖不是畫出來的,是電腦根據曲線方程自動生成的。PM2.5的年平均值與曲線方程無關。這個數據的用與不用與死亡率變化沒有任何關係。那些以為用五個數據點就可以取得一個非直線回歸方程的人基本是就是科學文盲。

還是統計學問題,方是民不知道曲線的意義如何解讀。所以才會說出這樣無知的話:“柴靜的圖卻顯示那幾年北京循環係統疾病死亡率逐年上升,豈不成了隨著pm2.5下降,人群的死亡率是隨之上升的?”。第一條曲線的圖例明確表示,心血管疾病死亡率增量與PM2.5汙染的增量之間相關係數(注)為0.19(與呼吸道疾病死亡的關係是0.99)。說明兩者之間基本沒有相關性(注),或者說兩者相關性沒有統計學意義(注)。

據方是民所言“pm2.5會立即導致循環係統疾病的死亡,不存在滯後”。這樣的言論完全是沒有科學素養的胡言亂語。任何物質(不論是有利還是有害)對生物體產生作用都有一個劑量效應關係。不考慮劑量因素的說法沒有任何科學意義。從臨床醫學角度,方是民不了解心血管疾病的的直接影響因素並不是空氣汙染,而是高血壓糖尿病高血脂肥胖吸煙飲酒以及生活模式工作節奏等等,還有人口老齡化的後果。這就是為什麽心血管死亡與PM2.5相關係數(注)隻有0.19

然而學術上的無知並非方是民心術不正的主要問題。他既然意識到柴靜的曲線是用原始數據重新擬合的,起碼應該知道原始數據必然是原始論文作者提供的。兩張圖出現差異的原因邏輯上就有兩種可能,一種是柴靜自己偽造數據。一種是原始作者提供新的數據。如果是偽造數據,就要偽造上千個數據。偽造那麽多的數據難道就是為了證明心血管疾病死亡與PM2.5汙染沒有顯著相關性,這不是與她電視片的初衷南轅北轍嗎?

柴靜在視頻中說明了圖表來源,清楚表明全部數據都是原論文作者單位提供的。科學研究的結果更改修正很正常。方是民僅僅根據原始論文而沒有經過原論文作者求證就肆意誹謗柴靜造假,不過是基於既定立場的惡意推測而且把他的很不專業的數據分析偽裝成為“客觀事實證據”。造假可惡,以打假為名造假就是惡上加惡。

方是民所謂打假,一貫用自己一知半解去對專業學術問題作出似是而非的解釋。偽造事實,偽造他人言論,甚至杜撰科學理論一貫是方是民的看家本領。

若幹年前方是民就偽造 “李一道長在水中閉氣”,而且還煞有介事地援引水中閉氣的世界紀錄。事實上李一是在沒入水中的一個密封玻璃箱子裏靜坐。令人稱奇的是,沒過幾天還是根據同一個視頻,造假者李一又變成坐在沒有水的箱子裏騙人。李一道長對方是民的誣陷之詞不置一言。離職去人,不知所蹤。方是民窮追猛打,揭發李一邪教、強奸、淫亂、斂財。警方介入調查,前麵三宗子虛烏有。辦班收費是事實,高與不高看和誰比了。

為了證明四川中醫師陳建民辟穀49天違反“真理”,方是民杜撰了人不吃飯7天會死的科學理論誣陷辟穀是造假。陳建民將聽信方是民偽真理的《北京科技報》告上法庭,方是民之流受到了應有的法律的懲罰還死不改口要堅持真理。陳建民回應,歡迎隨時把你們的真理拿來檢驗。

2013年,這位被中國網民評為人渣的打假鬥士卻獲首屆約翰•馬多克斯獎。這個打著自然雜誌旗號的獎項後麵,金主正是英國支持轉基因農作物的非官方組織“科學智識”(Sense About Science)。方是民打假的真實用心已昭然若揭。

如今柴靜的《穹頂之下》喚醒全民的環保意識。環保部長履新24小時就公開表示對柴靜工作的肯定和支持。方是民卻處心積慮以打假為名抹黑柴靜的人品。數據造假,生孩子造假,還有什麽不能造假。尼羅河就不理解了,如果柴靜果然造假,究竟是為了多大的回報值得她斥資百萬用一歲的女兒煽情還要冒被人揭露的危險。如果柴靜沒有造假,這樣的指控對於一個身為記者初為人母的柴靜情何以堪。柴靜團隊應該考慮訴諸法律,讓這幢公案在明鏡高懸的法庭上當麵對質;讓真正的造假者受到法律製裁。

注:
有網友提出文章中把R2稱為相關係數是錯誤的。尼羅河對本文作出如下更正與更正說明。

第一,關於R2的名稱問題。R2是判定係數或者決定係數。相關係數用表示。R2有密切的關係。在一元線性回歸,R2=r2。在非線性回歸或者多元線性回歸,R2的值略大於r2。有鑒於此,原文中的“心血管疾病死亡率增量與PM2.5汙染的增量之間相關係數為0.19。”應該修正為“心血管疾病死亡率增量與PM2.5汙染的增量之間決定係數為0.19”。


第二,關於
R2的統計學意義問題。所謂判定係數或者決定係數,表示因變量的變化在多大程度上是由自變量的變化決定的。或者說自變量的改變在多大程度上對因變量的改變產生影響。R2的絕對值在01之間。0表示完全沒有影響,1表示100%的決定性。回到本文的具體問題,就是死亡率的增幅在在多大程度上是由PM2.5的增幅導致的。原文中“心血管疾病死亡率增量與PM2.5汙染的增量之間相關係數為0.19(與呼吸道疾病死亡的關係是0.99)。說明兩者之間基本沒有相關性”,並沒有對該係數的統計意義產生誤判。如果有陳述不精確之處,也是弱化了這個係數的意義。更加準確的陳述是這樣的。PM2.5的增量極大地決定了呼吸道疾病死亡率的增量,而對心血管疾病死亡率的增量基本沒有影響。

 

第三,關於有0.19有沒有統計學意義的問題。在做線性回歸先要對自變量與因變量的相關性作出檢驗。一般根據r值與樣本量查表得到P值。顯著性的定義是P小於0.05 。如果沒有顯著意義,根本就沒有必要去做回歸。有經驗的統計人根據r值可以大致判斷有沒有顯著性。本文討論涉及心血管疾病死亡率增量與PM2.5增量相關是否有顯著性。我並不知道柴靜圖上的P值是多少。我認為兩者相關性沒有統計學意義有兩個理由。第一,PM2.5 上升心血管病死增量上升,PM2.5下降後者依然上升。第二,從柴靜圖可見,心血管曲線有5個數據點無法擬合在曲線中,這就表明,原始數據如果要把這五個點的數據都包括進去,這條曲線根本就不能成立。



附:方是民關於柴靜死亡率與PM2.5曲線數據造假的原文:

柴靜在演講中提供了一張隨著圖表表示:“當pm2.5值升高的時候,人群的死亡率是隨之上升的。”(1234秒)。圖表上顯示數據來源為中科院大氣物理研究所。實際上它的數據取自中科院大氣物理研究所在201312月在《大氣環境》雜誌上發表的一篇論文:Time-series analysis of mortality effects from airborne particulate matter size fractions in BeijingAtmospheric Environment 81 (2013) 253-262,改自該論文的圖6。這張圖表示的是20052009年這5年北京pm2.5濃度、非事故總死亡率、呼吸係統疾病死亡率、循環係統疾病死亡率的情況。最上麵的那條曲線是循環係統疾病死亡率的情況:在論文原圖,最高的是2007年,2008年有所下降,2009年又升上去了。但是在柴靜的圖中,這條曲線卻變成了平滑上升,也就是說,這五年北京循環係統疾病死亡率是逐年上升的。這顯然與事實不符,是對原圖的篡改。

有人會說,柴靜團隊是用原始數據重新畫圖,進行擬合,表示的是死亡率的上升趨勢。那好,我們再來看看原圖。原圖有一組重要的數據被柴靜的圖刪掉了,那就是北京20052009年這五年每年的pm2.5平均濃度,分別是:7684786965。可見在這五年,pm2.5值最高的是2006年,之後由於要開北京奧運會進行治理,北京pm2.5值其實是逐年下降的。柴靜的圖卻顯示那幾年北京循環係統疾病死亡率逐年上升,豈不成了隨著pm2.5下降,人群的死亡率是隨之上升的?(按:pm2.5會立即導致循環係統疾病的死亡,不存在滯後)難怪要刪掉pm2.5值,同時捏造出一條逐漸上升的死亡曲線。請問這不是捏造數據是什麽?

 

[ 打印 ]
閱讀 ()評論 (21)
評論
尼羅河 回複 悄悄話 回複 'hawei' 的評論 : 問題不在他有多專業。在於他立場決定一切。其實我的更正有一個不影響結論的小錯誤。故意放在那裏試試他們是不是真的具備統計專業知識。看來名不符實。
hawei 回複 悄悄話 像Anopheles這一類專家,問題就在於抓住芝麻,丟了西瓜。盡管對什麽r, r2的區別比較清楚,對二者之間的聯係不太了解,又善於下結論,說什麽別人的統計學知識查,其實自己缺乏常識。你們知道方肘子和他老婆一貫造假,剽竊。知道嗎?你們知道方肘子打假是為了自己賺吸引力,比如說柴靜這個作品吸引了幾個億的關注,方肘子通過造假一樣的打假,也可以賺個百八十萬點擊吧。柴靜如果有錯甚至造假,是應該被批評,甚至唾棄。但是,方肘子早就失去了打假的資格。他早就被唾棄了。有人以為這種說法是因為仇恨方肘子,難道那麽多人討厭嶽不群就是因為和嶽不群有仇嗎?作為當代最著名的偽君子,方不群早就麵目清晰了,爛大街了。
尼羅河 回複 悄悄話 回複 'BeijingGirl1' 的評論 :
『方沒說柴生孩子造假』
方舟子質疑柴靜生孩子造假,可能到現在都沒有人真正搞清楚,在生孩子的問題上柴靜作了什麽假,又根據什麽事實認定柴靜造假。

『他是說那隻小熊造假』
那隻小熊真實存在,不存在造假問題。

『因為那小熊來自極特殊的眼科醫院,柴不可能在生孩子的地方和給孩子做手術的地方的到小熊。因為孩子不是眼部腫瘤。』
重複一下,任何產科病房都不需要安慰小病人的玩具。給柴靜一個小熊並非醫院的行為而是護士的個人行為。小熊身上的眼科標識與柴靜生孩子的產科在邏輯上沒有任何聯係。
尼羅河 回複 悄悄話 回複 'Anopheles' 和“三絲”的評論 :

"第一條曲線的圖例明確表示,心血管疾病死亡率增量與PM2.5汙染的增量之間相關係數為0.19(與呼吸道疾病死亡的關係是0.99)。說明兩者之間基本沒有相關性,或者說兩者相關性沒有統計學意義"

從你上述描述可以看出:你混淆了相關係數(R)和擬合度(R平方),柴圖中明明是R平方,你卻解釋成R。不要以為兩者隻是一個簡單的平方差別,相關係數隻是定義在線性關係的,在非線性方程中是沒有意義的。另外,你如何知道相關係數0.19就沒有統計學意義,如果是大樣本,別說0.19,就是相關係數0.05,統計檢驗也可以是顯著的。你大概指這個相關沒有流行病學意義,這不是你可以下的結論。

你的統計知識比較初級,卻敢於發帖指點別人的數據分析,勇氣可嘉。如果不是出於對方舟子的憤恨,大概隻能是出自對弱女子的同情和祖國環境汙染的憂慮。不管動機如何,都應該以科學的態度,否則就成宣傳了。

針對你提出的質疑作出三點回應:
第一,關於R2的名稱問題。你說的沒錯,R2是判定係數或者決定係數。相關係數用r 表示。r 與R2有密切的關係。在一元線性回歸,R2=r2。在非線性回歸或者多元線性回歸,R2的值略大於r2。有鑒於此,原文中的“心血管疾病死亡率增量與PM2.5汙染的增量之間相關係數為0.19。”應該修正為“心血管疾病死亡率增量與PM2.5汙染的增量之間決定係數為0.19”。

第二,關於R2的統計學意義問題。所謂判定係數或者決定係數,表示因變量的變化在多大程度上是由因變量的變化決定的。或者說自變量的改變在多大程度上對因變量的改變產生影響。R2的絕對值在0到1之間。0表示完全沒有影響,1表示100%的決定性。回到本文的具體問題,就是死亡率的增幅在在多大程度上是由PM2.5的增幅導致的。原文中“說明兩者之間基本沒有相關性”並沒有對該係數的統計意義產生誤判,如果有陳述不精確之處,也是弱化了這個係數的意義。更加準確的陳述是這樣的。PM2.5的增量極大地決定了呼吸道疾病死亡率的增量,而對心血管疾病 死亡率的增量基本沒有影響。

第三,關於有0.19有沒有統計學意義的問題。在做線性回歸是先要對自變量與因變量的相關性作出檢驗。一般根據r值與樣本量查表得到P值。顯著性的定義是P小於0.05 。如果沒有顯著意義,根本就沒有必要去做回歸。有經驗的統計人根據r值可以大致判斷有沒有顯著性。本文討論涉及心血管疾病死亡率增量與PM2.5增量相關是否有顯著性。我並不知道樣本量的具體數字,也不知道柴靜圖上的P值是多少。我認為兩者相關性沒有統計學意義有兩個理由。第一,PM2.5 上升心血管病死增量上升,PM2.5下降後者依然上升。第二,從柴靜圖可見,心血管曲線有5個數據點無法擬合在曲線中,這就表明,原始數據如果要把這五個點的數據都包括進去,這條曲線根本就不能成立。

盡管你們站在方是民的立場上以尼羅河的一個失誤貶低尼羅河的專業能力,故意回避R2值的統計學意義以開脫方是民的明顯錯誤與無知。尼羅河還是要就你們指出錯誤表示感謝。我將對你們的回應作為注釋加入文章中。保留文章的原始麵貌不變。

最後,以上關於統計學問題的討論不影響尼羅河文章中的下麵兩段論述:

然而學術上的無知並非方是民心術不正的主要問題。他既然意識到柴靜的曲線是用原始數據重新擬合的,起碼應該知道原始數據必然是原始論文作者提供的。兩張圖出現差異的原因邏輯上就有兩種可能,一種是柴靜自己偽造數據。一種是原始作者提供新的數據。如果是偽造數據,就要偽造上千個數據。偽造那麽多的數據難道就是為了證明心血管疾病死亡與PM2.5汙染沒有顯著相關性,這不是與她電視片的初衷南轅北轍嗎?

柴靜在視頻中說明了圖表來源,清楚表明全部數據都是原論文作者單位提供的。科學研究的結果更改修正很正常。方是民僅僅根據原始論文而沒有經過原論文作者求證就肆意誹謗柴靜造假,不過是基於既定立場的惡意推測而且把他的很不專業的數據分析偽裝成為“客觀事實證據”。造假可惡,以打假為名造假就是惡上加惡。


美國老麥 回複 悄悄話 就看見一票撒比比的騙子,真讓我生氣。


美國老麥 回複 悄悄話 還有,美國醫院裏的玩具是可以到處有的,真是少見多怪。
美國老麥 回複 悄悄話 Anopheles and 三絲, 那你們兩位高級在哪裏啊????初級並不代表不正確。所以你們兩位的邏輯是錯誤的。還敢在這賣什麽賣???


你的統計知識比較初級
YanbeiYin 回複 悄悄話 Feel very sorry for "方舟子". He has been turning himself from a "positive force (not energy)" in the society toward a "negative force", in the cases of anti-Chinese traditional medicine with some superficial sciences, advocating genetic-modified food without sound rationale, and trying to derail anti-air pollution movement with some trivial details.

Hope that he will realize this himself.
fonsony 回複 悄悄話 說數據曲線,秀才之見,毛主席說的論的都是戰略性大方向性。
BeijingGirl1 回複 悄悄話 方沒說柴生孩子造假,他是說那隻小熊造假,因為那小熊來自極特殊的眼科醫院,柴不可能在生孩子的地方和給孩子做手術的地方的到小熊。因為孩子不是眼部腫瘤。

我雖然不是處處同意方舟子,但是他的分析文章確實比柴視頻嚴謹和靠譜多了。煽情不是科學,而治霧霾顯然完全不能靠煽情。
三絲 回複 悄悄話 Agree with Anopheles

"你的統計知識比較初級"
So the conclusion is invalid.
Anopheles 回複 悄悄話 "第一條曲線的圖例明確表示,心血管疾病死亡率增量與PM2.5汙染的增量之間相關係數為0.19(與呼吸道疾病死亡的關係是0.99)。說明兩者之間基本沒有相關性,或者說兩者相關性沒有統計學意義"

從你上述描述可以看出:你混淆了相關係數(R)和擬合度(R平方),柴圖中明明是R平方,你卻解釋成R。不要以為兩者隻是一個簡單的平方差別,相關係數隻是定義在線性關係的,在非線性方程中是沒有意義的。另外,你如何知道相關係數0.19就沒有統計學意義,如果是大樣本,別說0.19,就是相關係數0.05,統計檢驗也可以是顯著的。你大概指這個相關沒有流行病學意義,這不是你可以下的結論。

你的統計知識比較初級,卻敢於發帖指點別人的數據分析,勇氣可嘉。如果不是出於對方舟子的憤恨,大概隻能是出自對弱女子的同情和祖國環境汙染的憂慮。不管動機如何,都應該以科學的態度,否則就成宣傳了。
拾麥客 回複 悄悄話 在中國當教授真容易,象方舟子這樣不用自己搞研究,不用去發現,隻要將國外的專家研究結果拿來砸人就可以穩坐教授職位,真是中國特色!
DYMD 回複 悄悄話 方肘子能出境麵對公眾, 希望你也能境麵對公眾, 別在這忽悠大家。
尼羅河 回複 悄悄話 回複 'playnice' 的評論 :

請具體說明你說的mislead。
尼羅河 回複 悄悄話 回複 'Anopheles' 的評論 : 請在本文中指出不理智的內容。
playnice 回複 悄悄話 No matter who pointed out, Chai should not mislead people. If she didn't intend to, she should clarify them and apologize.
Anopheles 回複 悄悄話 你對方的仇恨會蒙蔽你的理智,這個世界上沒有無緣無故的恨,倒是有無緣無故的愛
hawei 回複 悄悄話 方肘子自己就是一個剽客,他和他老婆都是造假抄襲的慣犯,他們根據自己的經驗和觀察,認定所有的成功人士都是造假成功的,所有被世人肯定的成果都是造假出來的,沒什麽了不起,和方肘子一個樣。這就是他的基本假定。加上他自己學術上的失敗,所以對學術成功的人有一種歇斯底裏的仇恨和嫉妒。後來他轉行為專職打假的媒體人,而做媒體人也做的不成功,又恨上了成功的媒體人。他一心想做中國當代的聖人,青年導師,也不成功,因此對那些成功的媒體人,成功的媒體作品,成功的青年導師充滿仇恨與嫉妒。他利用打假為凶器,對這些他仇恨嫉妒的人進行瘋狂地攻擊。
老人新ID 回複 悄悄話 方是 吹毛求疵 啊!

還是希望多一些類似於柴靜的這些公益視頻!
武勝 回複 悄悄話 方指出柴CM曲線造假沒錯啊,錯的是將死亡率增長百分比誤為死亡率,屬於不嚴謹。而柴圖中文字和其口述皆明顯誤導,恐怕方的誤解還有柴的一份"功勞"呢。
登錄後才可評論.