談談中國人口數據的可靠性秋 實[新觀察]·文庫版·大饑荒檔案 www.chinafamine.net 轉載時請注明作(譯)者及出處 在大饑荒之爭中,經常有網友對我國人口數據的可靠性提出疑問。大 多數人是出於對實際情況的不了解。也有些人,出於對基本概念的誤解。 比如,有人說,我國人口統計的誤差是10%,三千萬人誤差一下就出來 了,跟零沒有差別。於是,所謂非正常死亡兩三千萬的說法,統計上沒什 麽意義。他們顯然沒整明白整體(比如若幹個隨機變量之和)的誤差,與 其構成部分(比如其中單個變量)的誤差之間關係。舉個簡單反例:五六 十年代之交,我國少數民族的總人數也不過三千多萬,難道也是誤差一下 出來的,跟零沒什麽區別嗎?建議提出這種說法的朋友,自修一下概率統 計入門知識。 其實,我國三項主要的人口數據--人口普查、人口抽查和戶籍登記 --中,除戶籍登記數據之外,其它數據的誤差都沒有上麵網友猜測的那 麽大。俺這裏簡單地介紹一下三大類人口數據的誤差範圍,同時著重談一 談戶籍死亡和出生數據的漏報情形,這是人口專家在估算大饑荒非正常死 亡人數時,都特別給予注意的一大問題。 一 人口普查數據 人口普查點算整個群體,不是抽樣,無所謂抽樣誤差。但在點算時會 出現多報或漏報的問題。這就需要抽取一定比例人口進行複查,以確定其 誤差範圍。下麵是我國前三次人口普查的複查結果: 1953年普查:複查覆蓋地區占直接調查人口9%, 結果發現,全國總 人口數重複登記1.39‰,漏報2.55‰,淨漏報1.16‰,毛誤差3.94‰。誤 差低於千分之四。[1] 1964年普查:全部大陸人口係直接調查。複查覆蓋地區占人口5.3%。 總人口數重複登記0.38‰,漏報0.39‰,淨漏報0.01‰,毛誤差0.77‰。 誤差低於千分之一。 1982年普查:這次普查采用國際通用方法,進行了嚴格質量控製。複 查結果如下: --總人數重複登記0.71‰,漏報0.56‰,淨重報0.15‰,毛誤差1.27‰。 誤差約為千分之一點二。 --出生人數重登率0.78‰,漏報2.61‰,淨漏報1.83‰,毛誤差3.39‰。 誤差低於千分之四。注意此處的誤差是以出生人口為基數計算的。 --死亡人數重登率2.64‰,漏報7.04‰,淨漏報4.40‰,毛誤差9.68‰。 誤差約為千分之十。注意此處的誤差是以死亡人口為基數計算的。 由此可見,人口普查數據的精度是相當高的。這就是為什麽大家總是 盡可能地以人口普查數據作為基礎,去校驗其他人口數據。 二 抽樣調查數據 人口抽樣調查的誤差範圍,在設計調查方案時予以控製。以下談到的 誤差範圍,置信概率均為95%。 1、一年一度的千分之零點五抽樣的人口變動情況調查,人口出生率的允 許誤差範圍正負5‰。 國家統計局公布的一九八二年後每年的出生率和死亡率,便來自於此 項調查。 2、生育率調查,包括1982年的千分之一抽樣的婦女婚姻生育史調查, 以及1985年的千分之二抽樣的婦女生育節育調查等。後者的出生率允 許誤差在正負0.3‰以內。 蔣正華、BANISTER、ASHTON等人口專家用於校正中國 戶籍人口登記數據的生育率曆史資料,便來自於1982年的調查。 3、1987年的百分之一人口抽樣調查,這是一次微型人口普查,半年 出生率允許誤差正負0.11‰,半年死亡率允許誤差正負0.06‰。 此外還有其它一些抽樣調查,此處不一一列出。從以上例子看,抽樣 調查的允許誤差都控製在極低水平。當然,這些都是設計誤差,要求調查 者按規定進行抽樣與詢問,才能達到。至於調查者是否人為引入了係統誤 差,在發現可靠的證明材料之前,俺不想妄加猜測。從現有資料看,抽樣 調查數據與人口普查數據吻合度相當高,不象是有可觀係統誤差的樣子。 三 戶籍登記數據 戶籍登記的人口總數、死亡人數、出生人數等數據,不是由專門的統 計調查來的,而是行政部門負責管理的。其好處是解放以來年年都有,壞 處就是戶籍登記與人們的權利義務聯係過於密切,登記數字的可靠性,直 接為人們的切身利益所左右,可靠性遠遠不及前兩類數據。下麵根據現有 的資料,談一談戶籍登記的人口總數、出生數以及死亡人數的可能誤差。 1、總人口 1964年整頓戶口和人口普查本身,共查出多報人口1172萬,漏報 人口357萬人。按1964年普查人口計算,多報率16‰,漏報率5‰,淨 多報11‰,毛誤差21‰。 1982年整頓戶口與人口普查,共查出多報人口622萬,漏報人口 899萬人。多報率6‰,漏報率9‰,淨漏報3‰,毛誤差15‰。 2、死亡率: 1982年人口普查得到的1981年死亡率為6.60‰,而這年戶籍 登記的死亡率卻為6.11‰,登記完備率約為4%。 不過,1982年因有人口普查,情況較為特殊。比較一下其它年份 戶籍登記的死亡率與人口變動抽樣調查得到的死亡率,就可以發現,除1 982年外,八十年代前期的死亡漏報相當嚴重,戶籍登記的完備率隻有 85-90%左右,如下表所示: 表一、1982-85年死亡率漏報情況 -------------------------------------------------- 年份 戶口登記‰ 抽樣調查‰ 死亡漏報率(%) -------------------------------------------------- 1982 6.11 6.36 3.93 1983 6.09 6.60 8.42 1984 5.93 6.86 13.56 1985 5.93 6.69 12.86 -------------------------------------------------- 資料來源:《中國統計年鑒1988》 轉引自《中國人口--總論》(袁永熙主編,中國財政經濟出版社,1991) 第620頁 五、六十年代,我國的戶籍登記中漏報死亡的情況,同樣十分嚴重。 1964年人口普查時,對該年上半年人口出生、死亡、遷入、遷出四個 項目進行了核對性檢查。 普查得到的1964年上半年死亡率為7‰。假 如上下兩個半年死亡人數相當,推算全年死亡率應為14‰左右。而戶籍登 記的死亡率,僅有11.5‰,比普查推算數低18%!由此可見當時漏報死亡 的嚴重性。 至於1964年以前的情況,我們可以從兩次人口普查的數據以及當 時所作的死亡情況調查,大致看出漏報死亡的嚴重情形。 根據資料,1964年普查人口69458萬人中,年滿11周歲以上的 人口占69%,約為48105萬,此即1953年的58260萬人口中尚存的人數。 因此,不計算五三年到六四年之間出生後又死亡的人數,此期間也至少死 亡10155萬人。而同期戶籍登記的死亡人口僅僅隻有9500萬人! 假如這個 期間有大量死亡是出生後沒活幾歲的兒童,我們就可以肯定,戶籍登記的 死亡人數,是大大低估了的。 那麽,兒童死亡情形究竟如何呢?我國分別在1957年和1963 年,也即這個期間死亡率最低的兩個年份,進行了兩次大規模的死亡情況 調查。根據這些調查,死亡人口中很多是少年兒童(表三)。1957年 和1963年,0-4歲死亡人數占死亡人口的比重分別為42.3%和46.2%。 1957年,死亡人口的一半,沒有活到18歲,1963年更慘,一半人 沒有活到10歲! 用以上數據,不難對戶籍死亡登記的漏報情形,作出粗略的估算。根 據人口普查資料,1953年4歲以上,到1964年已經死亡的人口,大約7900萬 人,這是該期間死亡的4歲以上人口的下限。按0-4歲死亡人口占死亡人口 40%算,此期間0-4歲死亡人口至少有7900 * 40% / 60% = 5366萬人,約 相當於登記死亡人數的55%。 兩項合計,死亡人數13000萬人,戶籍登記 的死亡漏報率為28%左右。 注意以上估計未使用任何出生資料,卻與蔣正華教授等根據生育調查 資料估算的死亡漏報率相當一致。根據蔣的估算,1954-64年間大 部分年份,漏報率都在23%到40%之間。事實上,中國五六十年代漏報死 亡極其嚴重,早已是絕大多數人口專家的共識。 表二、中國死亡人口比重(%) ----------------------------------------------------------- 年份 0-4歲(%) 50歲+(%) 死亡人口年齡中位數(歲) ----------------------------------------------------------- 1957 42.3 35.9 17.6 1963 46.1 34.8 9.6 1975 14.3 67.3 63.2 1981 15.9 64.7 62.0 1987 14.4 69.1 64.5 ----------------------------------------------------------- 資料來源:《中國人口年鑒1985》,《中國1%人口抽樣調查資料》 轉引自《中國人口--總論》(袁永熙主編,中國財政經濟出版社,1991) 第164頁 從表二還可以看出,七十年代以後,兒童死亡情形有了翻天覆地的改 變。 0-4歲死亡的比重,從40%以上,下降到16%以下;死亡年齡中位數 則從十歲十幾歲,上升到六十多歲。一些生長在七、八十年代的網友,不 了解五、六十年代之事,看到人口專家估算的死亡人口中包括了大量兒童 死亡,覺得無法理解,又不肯去了解曆史,動輒就把這些估算斥之為“瘋 狂”“荒謬”。其實,真正“瘋狂”而“荒謬”的,正是這些人不懂裝懂 而又不肯虛心了解事實的偏執態度。 3、出生率 1982年人口普查得到的1981年出生率為20.91‰, 按誤差率 計算,其範圍20.89-20.96‰之間。但這年戶籍登記的出生率卻為18.53‰, 登記完備率隻有88.6%。 出生率的情形與死亡率相似,戶籍數據也有可觀的漏報。而且在八十 年代,出生率漏報情形,遠比死亡率的漏報來得嚴重。除1982年以外, 登記完備率僅有80%左右(表三)。 表三、1982-85出生漏報情況 -------------------------------------------------- 年份 戶口登記‰ 抽樣調查‰ 出生漏報率(%) -------------------------------------------------- 1982 18.53 21.09 12.14 1983 15.11 18.22 17.08 1984 13.85 17.50 20.85 1985 13.63 17.80 23.48 -------------------------------------------------- 資料來源:《中國統計年鑒1988》 轉引自《中國人口--總論》(袁永熙主編,中國財政經濟出版社,1991) 第620頁 由此表可見,戶籍出生率統計的可靠性同樣十分可疑。國家統計局自 1982年起便不再使用戶籍出生率和死亡率,正式公布的數字一律以抽 樣調查數字為準。 五十年代,我國的戶籍登記製度剛剛建立不久,很多新出生人口,都 未及時申報登記。再加上嬰兒死亡率較高,很多出生後不久就死亡的孩子, 根本就沒有登記出生,也沒有登記死亡。蔣正華根據人口普查數據和生育 率回顧調查數據,用估計參數模型的方法計算出生率,發現五十年代到六 十年代初,出生率漏報程度同樣達到10%左右,1962年更達到17%。 此後漏報程度便大幅降低。其原因,一是戶籍登記製度更為健全;二是越 來越多的基本消費品按人頭分配,漏報出生人口帶來的利益損失擴大了; 三是嬰兒死亡率大幅降低。低水平的漏報率一直維持到七十年代。隨著計 劃生育政策的推行日趨嚴厲,出生漏報率再次於七十年代後期升到10%以 上。這裏有瞞報出生因素。更有不少地區,將出生人口假報為遷入人口, 這樣既降低了出生率,又不損害按人頭分配票證的利益。 ASHTON等人估計的1953-1964年戶口登記出生的完備 率,以及其他人口專家的估算數,與蔣正華的估算相差不大,都在80-90% 之間。這些估算,與現有的人口資料以及我國有關政策變化的時間序列, 都是相當吻合的。 四、小結 我國人口普查數據和抽查數據,可靠性都是相當高的。這一點,打從 我國於1983年首次完整公布前三次人口普查數據開始,就得到國內外 主要人口專家的多方檢驗確認,基本上已經成為人口學界的共識。問題比 較大的是戶籍出生和死亡數據,都存在比較大的漏報,其中又以死亡人數 的漏報,尤為嚴重。這就是為什麽根據戶籍上報的死亡人數算出的1500萬 左右非正常死亡,通常隻被被絕大多數人口專家視為下限的緣故。 注釋 [1] 在1953年人口普查中,除直接調查的人口外,另有占總人口1.44%的人口為 間接估算,主要是西藏昌都等極少數邊遠少數民族地區。因其占比重小,其誤差對全 國總人口誤差影響很小。 (2000年5月6日貼於[新觀察/xgc2000.com],2000年6月5日修改) [新觀察]·文庫版·大饑荒檔案 www.chinafamine.net 轉載時請注明作(譯)者及出處 |