人口統計中通常有三個各自獨立且不相幹的樣本:人口總數統計數據,年度死亡人數統計數據,年度新生人口統計數據。
一般來說,死亡人口和新生人口是總人口的千分之幾,不正常的時候,最多也不過百分之幾,因此總人口數據相對來說是大數。各年度的總人口波動起伏接近百分之一,統計過程本身也會有千分之幾的誤差,若是用總人口統計數據來估算死亡人口,相近的兩個大數相減會產生很大的誤差(相對於死亡人口來說),這類計算不可靠。至於美國,還需考慮人口遷移的因數,因為美國是一個有大量移民的國家,更不能用總人口數據來計算死亡人口的變化。按照標準的統計理論,總可以計算出一個期望值,但同時還必須給出誤差範圍,誤差太大時(接近甚至超過100%):可靠性太低、計算結果失去意義必須放棄。
從死亡人數統計數據的波動,可以計算非正常死亡的概率,中國1961年左右的情形,就是人們常說的“餓死多少人的大饑荒”事件,可以用統計方法估算。到底餓死多少人? 采用標準的統計方法,我給出的計算結果是 1200±200 萬。用新生人口統計數據,或是年度人口數據,還可以由統計理論計算出另一個數值:人口出生異常值。將之用到中國60年代,可以估算出少生人口:4.5±1 千萬。當然統計方法的計算結果多多少少帶有一些認為假設,這些假設都應該明確列示,並在檢查可靠性時考慮。
人們的觀點和看法常常是跟政治立場牽連,往往偏頗,這在"大饑荒餓死幾千萬"的爭論的"眾生像"中體現的很充分。