發現有個適合笑壇的帖子,貼在這裏了。有幾分鍾的時間,不妨陪著玩一下。補一補統計學101,順便說說統計學中的一個基本原理。
在統計學中這個基本的原理,就是統計相關與因果關係不是一回事,搞錯了,要出笑話的。
這樣的笑話在統計學發展史上是出現過的。例如有人曾經把太陽黑子出現的頻率和某種農作物產量畫在一起,得到相關關係,因此說該農作物的豐收與否是太陽黑子出現多少的原因,從而誤導了發展該作物的農業政策。還有人把某種疾病與某種激素的攝取量畫在一起,並得出該激素能治愈該病的結論,並導致大量研發資金的浪費,結果在臨床實驗時,發現該激素對所要醫治的病絲毫沒有任何療效。最近還有人把國家研發經費的投入與謀殺案件多少畫在一起,並得出0.9979的相關係數。因此提出應該減少科研經費的投資來降低謀殺案的荒唐提議。
無獨有偶,本壇也有人通過相關分析的方法,把感染人數和測試人數的統計關係誤認為是因果關係,得出測試導致感染的荒唐結論。實際上,二者都是疫情發展的結果,疫情的發展導致感染人數的增加,同時導致測試需求的增加。每組數據不是在相同疫情條件下的數據,而是隨疫情發展而變化的數據。
另外。請把趨勢與數量多少的關係搞清楚。趨勢反映的是變化,不是絕對的數量。例如,F(t)與 f(t)=c*F(t) 可能具有不同的量值,但是它們卻具有同樣的趨勢, 因為F(t2)/F(t1)=f(t2)/f(t1)。
在作任何分析時,包括統計分析,對數據要理解其含義,這是任何分析的基礎。如果對數據是什麽,反映的是什麽實際都沒搞懂,就生搬硬套,反映的是思維的混亂。