正文

【大饑荒檔案】談談中國人口數據的可靠性

(2017-01-21 10:24:54) 下一個
 

談談中國人口數據的可靠性

秋 實


[新觀察]·文庫版·大饑荒檔案 www.chinafamine.net 轉載時請注明作(譯)者及出處

  在大饑荒之爭中,經常有網友對我國人口數據的可靠性提出疑問。大
多數人是出於對實際情況的不了解。也有些人,出於對基本概念的誤解。
比如,有人說,我國人口統計的誤差是10%,三千萬人誤差一下就出來
了,跟零沒有差別。於是,所謂非正常死亡兩三千萬的說法,統計上沒什
麽意義。他們顯然沒整明白整體(比如若幹個隨機變量之和)的誤差,與
其構成部分(比如其中單個變量)的誤差之間關係。舉個簡單反例:五六
十年代之交,我國少數民族的總人數也不過三千多萬,難道也是誤差一下
出來的,跟零沒什麽區別嗎?建議提出這種說法的朋友,自修一下概率統
計入門知識。

  其實,我國三項主要的人口數據--人口普查、人口抽查和戶籍登記
--中,除戶籍登記數據之外,其它數據的誤差都沒有上麵網友猜測的那
麽大。俺這裏簡單地介紹一下三大類人口數據的誤差範圍,同時著重談一
談戶籍死亡和出生數據的漏報情形,這是人口專家在估算大饑荒非正常死
亡人數時,都特別給予注意的一大問題。


一 人口普查數據

  人口普查點算整個群體,不是抽樣,無所謂抽樣誤差。但在點算時會
出現多報或漏報的問題。這就需要抽取一定比例人口進行複查,以確定其
誤差範圍。下麵是我國前三次人口普查的複查結果:

1953年普查:複查覆蓋地區占直接調查人口9%, 結果發現,全國總
人口數重複登記1.39‰,漏報2.55‰,淨漏報1.16‰,毛誤差3.94‰。誤
差低於千分之四。[1]

1964年普查:全部大陸人口係直接調查。複查覆蓋地區占人口5.3%。
總人口數重複登記0.38‰,漏報0.39‰,淨漏報0.01‰,毛誤差0.77‰。
誤差低於千分之一。

1982年普查:這次普查采用國際通用方法,進行了嚴格質量控製。複
查結果如下:
--總人數重複登記0.71‰,漏報0.56‰,淨重報0.15‰,毛誤差1.27‰。
誤差約為千分之一點二。
--出生人數重登率0.78‰,漏報2.61‰,淨漏報1.83‰,毛誤差3.39‰。
誤差低於千分之四。注意此處的誤差是以出生人口為基數計算的。
--死亡人數重登率2.64‰,漏報7.04‰,淨漏報4.40‰,毛誤差9.68‰。
誤差約為千分之十。注意此處的誤差是以死亡人口為基數計算的。

  由此可見,人口普查數據的精度是相當高的。這就是為什麽大家總是
盡可能地以人口普查數據作為基礎,去校驗其他人口數據。


二 抽樣調查數據

  人口抽樣調查的誤差範圍,在設計調查方案時予以控製。以下談到的
誤差範圍,置信概率均為95%。

1、一年一度的千分之零點五抽樣的人口變動情況調查,人口出生率的允
許誤差範圍正負5‰。

  國家統計局公布的一九八二年後每年的出生率和死亡率,便來自於此
項調查。

2、生育率調查,包括1982年的千分之一抽樣的婦女婚姻生育史調查,
以及1985年的千分之二抽樣的婦女生育節育調查等。後者的出生率允
許誤差在正負0.3‰以內。

  蔣正華BANISTERASHTON等人口專家用於校正中國
戶籍人口登記數據的生育率曆史資料,便來自於1982年的調查。

3、1987年的百分之一人口抽樣調查,這是一次微型人口普查,半年
出生率允許誤差正負0.11‰,半年死亡率允許誤差正負0.06‰。

  此外還有其它一些抽樣調查,此處不一一列出。從以上例子看,抽樣
調查的允許誤差都控製在極低水平。當然,這些都是設計誤差,要求調查
者按規定進行抽樣與詢問,才能達到。至於調查者是否人為引入了係統誤
差,在發現可靠的證明材料之前,俺不想妄加猜測。從現有資料看,抽樣
調查數據與人口普查數據吻合度相當高,不象是有可觀係統誤差的樣子。


三 戶籍登記數據

  戶籍登記的人口總數、死亡人數、出生人數等數據,不是由專門的統
計調查來的,而是行政部門負責管理的。其好處是解放以來年年都有,壞
處就是戶籍登記與人們的權利義務聯係過於密切,登記數字的可靠性,直
接為人們的切身利益所左右,可靠性遠遠不及前兩類數據。下麵根據現有
的資料,談一談戶籍登記的人口總數、出生數以及死亡人數的可能誤差。


1、總人口

  1964年整頓戶口和人口普查本身,共查出多報人口1172萬,漏報
人口357萬人。按1964年普查人口計算,多報率16‰,漏報率5‰,淨
多報11‰,毛誤差21‰。

  1982年整頓戶口與人口普查,共查出多報人口622萬,漏報人口
899萬人。多報率6‰,漏報率9‰,淨漏報3‰,毛誤差15‰。


2、死亡率:

  1982年人口普查得到的1981年死亡率為6.60‰,而這年戶籍
登記的死亡率卻為6.11‰,登記完備率約為4%。

  不過,1982年因有人口普查,情況較為特殊。比較一下其它年份
戶籍登記的死亡率與人口變動抽樣調查得到的死亡率,就可以發現,除1
982年外,八十年代前期的死亡漏報相當嚴重,戶籍登記的完備率隻有
85-90%左右,如下表所示:

 表一、1982-85年死亡率漏報情況
 --------------------------------------------------
  年份 戶口登記‰  抽樣調查‰ 死亡漏報率(%)
 --------------------------------------------------
  1982   6.11     6.36     3.93
  1983   6.09     6.60     8.42
  1984   5.93     6.86     13.56
  1985   5.93     6.69     12.86
 --------------------------------------------------
 資料來源:《中國統計年鑒1988》
 轉引自《中國人口--總論》(袁永熙主編,中國財政經濟出版社,1991)
 第620頁

  五、六十年代,我國的戶籍登記中漏報死亡的情況,同樣十分嚴重。
1964年人口普查時,對該年上半年人口出生、死亡、遷入、遷出四個
項目進行了核對性檢查。 普查得到的1964年上半年死亡率為7‰。假
如上下兩個半年死亡人數相當,推算全年死亡率應為14‰左右。而戶籍登
記的死亡率,僅有11.5‰,比普查推算數低18%!由此可見當時漏報死亡
的嚴重性。

  至於1964年以前的情況,我們可以從兩次人口普查的數據以及當
時所作的死亡情況調查,大致看出漏報死亡的嚴重情形。

   根據資料,1964年普查人口69458萬人中,年滿11周歲以上的
人口占69%,約為48105萬,此即1953年的58260萬人口中尚存的人數。
因此,不計算五三年到六四年之間出生後又死亡的人數,此期間也至少死
亡10155萬人。而同期戶籍登記的死亡人口僅僅隻有9500萬人! 假如這個
期間有大量死亡是出生後沒活幾歲的兒童,我們就可以肯定,戶籍登記的
死亡人數,是大大低估了的。

  那麽,兒童死亡情形究竟如何呢?我國分別在1957年和1963
年,也即這個期間死亡率最低的兩個年份,進行了兩次大規模的死亡情況
調查。根據這些調查,死亡人口中很多是少年兒童(表三)。1957年
和1963年,0-4歲死亡人數占死亡人口的比重分別為42.3%和46.2%。
1957年,死亡人口的一半,沒有活到18歲,1963年更慘,一半人
沒有活到10歲!

  用以上數據,不難對戶籍死亡登記的漏報情形,作出粗略的估算。根
據人口普查資料,1953年4歲以上,到1964年已經死亡的人口,大約7900萬
人,這是該期間死亡的4歲以上人口的下限。按0-4歲死亡人口占死亡人口
40%算,此期間0-4歲死亡人口至少有7900 * 40% / 60% = 5366萬人,約
相當於登記死亡人數的55%。 兩項合計,死亡人數13000萬人,戶籍登記
的死亡漏報率為28%左右。

  注意以上估計未使用任何出生資料,卻與蔣正華教授等根據生育調查
資料估算的死亡漏報率相當一致。根據蔣的估算,1954-64年間大
部分年份,漏報率都在23%到40%之間。事實上,中國五六十年代漏報死
亡極其嚴重,早已是絕大多數人口專家的共識。

 表二、中國死亡人口比重(%)
 -----------------------------------------------------------
 年份  0-4歲(%)  50歲+(%)   死亡人口年齡中位數(歲)
 -----------------------------------------------------------
 1957   42.3     35.9        17.6
 1963   46.1     34.8         9.6
 1975   14.3     67.3        63.2
 1981   15.9     64.7        62.0
 1987   14.4     69.1        64.5
 -----------------------------------------------------------
 資料來源:《中國人口年鑒1985》,《中國1%人口抽樣調查資料》
 轉引自《中國人口--總論》(袁永熙主編,中國財政經濟出版社,1991)
 第164頁

  從表二還可以看出,七十年代以後,兒童死亡情形有了翻天覆地的改
變。 0-4歲死亡的比重,從40%以上,下降到16%以下;死亡年齡中位數
則從十歲十幾歲,上升到六十多歲。一些生長在七、八十年代的網友,不
了解五、六十年代之事,看到人口專家估算的死亡人口中包括了大量兒童
死亡,覺得無法理解,又不肯去了解曆史,動輒就把這些估算斥之為“瘋
狂”“荒謬”。其實,真正“瘋狂”而“荒謬”的,正是這些人不懂裝懂
而又不肯虛心了解事實的偏執態度。


3、出生率

  1982年人口普查得到的1981年出生率為20.91‰, 按誤差率
計算,其範圍20.89-20.96‰之間。但這年戶籍登記的出生率卻為18.53‰,
登記完備率隻有88.6%。

  出生率的情形與死亡率相似,戶籍數據也有可觀的漏報。而且在八十
年代,出生率漏報情形,遠比死亡率的漏報來得嚴重。除1982年以外,
登記完備率僅有80%左右(表三)。

 表三、1982-85出生漏報情況
 --------------------------------------------------
  年份 戶口登記‰  抽樣調查‰ 出生漏報率(%)
 --------------------------------------------------
  1982   18.53     21.09     12.14
  1983   15.11     18.22     17.08
  1984   13.85     17.50     20.85
  1985   13.63     17.80     23.48
 --------------------------------------------------
 資料來源:《中國統計年鑒1988》
 轉引自《中國人口--總論》(袁永熙主編,中國財政經濟出版社,1991)
 第620頁

  由此表可見,戶籍出生率統計的可靠性同樣十分可疑。國家統計局自
1982年起便不再使用戶籍出生率和死亡率,正式公布的數字一律以抽
樣調查數字為準。

  五十年代,我國的戶籍登記製度剛剛建立不久,很多新出生人口,都
未及時申報登記。再加上嬰兒死亡率較高,很多出生後不久就死亡的孩子,
根本就沒有登記出生,也沒有登記死亡。蔣正華根據人口普查數據和生育
率回顧調查數據,用估計參數模型的方法計算出生率,發現五十年代到六
十年代初,出生率漏報程度同樣達到10%左右,1962年更達到17%。
此後漏報程度便大幅降低。其原因,一是戶籍登記製度更為健全;二是越
來越多的基本消費品按人頭分配,漏報出生人口帶來的利益損失擴大了;
三是嬰兒死亡率大幅降低。低水平的漏報率一直維持到七十年代。隨著計
劃生育政策的推行日趨嚴厲,出生漏報率再次於七十年代後期升到10%以
上。這裏有瞞報出生因素。更有不少地區,將出生人口假報為遷入人口,
這樣既降低了出生率,又不損害按人頭分配票證的利益。
  
  ASHTON等人估計的1953-1964年戶口登記出生的完備
率,以及其他人口專家的估算數,與蔣正華的估算相差不大,都在80-90%
之間。這些估算,與現有的人口資料以及我國有關政策變化的時間序列,
都是相當吻合的。


四、小結

  我國人口普查數據和抽查數據,可靠性都是相當高的。這一點,打從
我國於1983年首次完整公布前三次人口普查數據開始,就得到國內外
主要人口專家的多方檢驗確認,基本上已經成為人口學界的共識。問題比
較大的是戶籍出生和死亡數據,都存在比較大的漏報,其中又以死亡人數
的漏報,尤為嚴重。這就是為什麽根據戶籍上報的死亡人數算出的1500萬
左右非正常死亡,通常隻被被絕大多數人口專家視為下限的緣故。

注釋

[1] 在1953年人口普查中,除直接調查的人口外,另有占總人口1.44%的人口為
間接估算,主要是西藏昌都等極少數邊遠少數民族地區。因其占比重小,其誤差對全
國總人口誤差影響很小。

(2000年5月6日貼於[新觀察/xgc2000.com],2000年6月5日修改)

回頁首  


[新觀察]·文庫版·大饑荒檔案 www.chinafamine.net 轉載時請注明作(譯)者及出處

 

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.