再簡化一下,大街上調查兩個穿西裝的人,發現他們平均收入50萬,然後調查200個不穿西裝的人,平均收入20萬。結論:穿西裝的人收入遠遠高於不穿西裝的人。 靠譜不?萬一這兩個人其中之一是馬雲呢?即便不穿西裝的人中有強哥,平均值也比不過兩個人。樣本越小,隨意性和極端性就越大,大樣本和小樣本不能放在一起比較。(把穿西裝的樣本擴大到200,哪怕馬雲還包括其中,平均收入就不會有天壤之別)
同理,10-14歲打疫苗的人樣本是不打的人群的1/20,不能比較,另外,這組選擇打疫苗的是不是本來體質弱或有其它疾病,家長才選擇給孩子打?
所以,數據的解釋不是簡單看一眼數字就能得出結論的。