正文

溫故而知新——也談準確度,再答兩隻黃鸝

(2008-09-16 11:29:51) 下一個

[ 回幾曾回首首頁 ]

也談準確度,再答兩隻黃鸝

來源: 龍劍 於 07-07-22 16:33:02

  網友統計資料不完整說得好:“在任何一組不重合的選擇數據中,其結論的偏差,主要取決於誤差最大的那個數據,並且通常不會小於這個誤差。也就是說,所有數據中,其中任何一個數據可信度低或缺少直接實測數據而以估算數據代替的話,那這樣得出的結論,意義了了。”。

  無論金輝,李成瑞還是兩隻黃鸝都認為中國國家統計局編一九八三年《中國統計年鑒》(以下簡稱年鑒)給出的數據可信度低,都讚同統計資料不完整說的由這些數據得出的結論,意義了了,因此需要一個接近曆史真相的這一時期(58-63年,不僅僅是59-61年的困難時期)過多死亡人數的估計。

  三方在有這一需要上沒有分歧,分歧在如何作出重估的方法上。

  如何評價重估結果的好壞?

  兩隻黃鸝以準確度來衡量,在下理解兩隻黃鸝所講的準確度就是和事實符合的程度,請教兩隻黃鸝這樣理解對不對?

  如果理解得對的話,就會產生一個問題,當事實真相無法確定的時候,怎樣認定重估結果的準確度?

  現在就是這種情況,沒有58-63年過多死亡人數的直接實測數據,兩隻黃鸝憑什麽斷言隻有他的上限為400萬是準確的呢?

  應該建立一些判斷標準,才能把討論進行下去。

  首先,在下同意統計資料不完整說的推論結果開始時所選擇的每一個統計數據都要可信度高;

  其次,推論結果過程中主觀做出的客觀證據不充分的假設盡可能少,不能認為運用人口學、統計學、規劃論等學科的成熟理論也是假設,因為這些理論已被實踐證明是正確的,例如人口學中災年之後必定出現補償性生育高峰的規律早已被證實;

  最後,對一些已經得到的實測數據應該能夠從所得結果導出和之相吻合的數據。歡迎對討論感興趣的朋友補充新的判斷標準,但在下認為這三條是最基本的。

  李成瑞在全國‘招賢’後確定由蔣正華來主持研究工作。

  他根據李成瑞提出的不摻入任何主觀因素的要求,幹脆完全拋棄年鑒中的數據,首先著力於選取質量最好的調查數據作依據。

  經過對各種數據的深入評審和比較,確認三次人口普查所取得年齡、性別數據是可靠性很高的。

  三次普查相應年齡組數據的高度吻合也證明了它的高質量。

  關於人口出生率和死亡率,則以1982年人口普查取得的普查前一年(1981年下半年和1982年上半年)的數據為基礎。

  這些數據的高質量已從普查後的現場複查中得到證實。

  李成瑞說這些數據是高質量的意思,在下理解為這些數據是完整的,且每一個數據的可信度都很高。

  不知統計資料不完整,兩隻黃鸝或其他人對上述數據評價如何,在下認為不能說上述數據沒有誤差,但那是精確度問題不是準確度問題,因此同意李成瑞對上述數據的評價。

  上述數據中蔣正華把53年和64年人口普查所取得年齡、性別數據作為驗證結果是否準確的實測數據,把其它數據作為推導開始時需要的初始數據。

  可以從人口普查的數據算出82年的完全生命表,然後用參數估計模型算出53-82年間其餘各年的完全生命表,然後用一致優化的方法把誤差減少到最小。

  蔣正華計算得到的53年和64年的完全生命表和根據53年和64年人口普查數據得出的相應的完全生命表相吻合。

  由這些生命表就可以算出每一年的出生率和死亡率,再由82年普查得到(82年6月30日24點)的人口總數,以它作為82年的全年平均人口總數和算出每一年的出生率和死亡率逐年推算每年6月30日24點的人口總數,出生人數和死亡人數,其中64年和53年的普查結果剛好作為檢驗數據。

  再從每年的6月30日24點的數據推算到每年12月31日24點的相應數據。

  最後根據正常年份預期壽命的變動規律算出58-63年如果處在正常年份的預期壽命,由此就可以算出這幾年的正常死亡人數。

  整個推算過程沒有用任何其它原始數據和假設。

  蔣正華計算得到的曆年完全生命表中任何一年出生的人數在以後年份的生命表中都是單調遞減的,而且出生後的頭幾年遞減數量多,這也符合嬰幼兒的死亡率遠高於成年人的客觀情況。

  更重要的是在人口普查年份計算所得的年人口總數、年出生人數、年死亡人數和年齡分布與人口普查結果相吻合。

  綜上所述,蔣正華研究較好地符合三條準確度的判別標準,因此在下認為其結論是準確的。

  蔣正華研究的詳細情況請參閱 蔣正華:《中國人口動態估計的方法和結果》,西安交通 大學學報,1986年第3期。

  科爾在計算死亡人數時,根據平均漏檢率,對每年的漏檢率用主觀假設作了分配,所以由此算出的每年死亡人口數的準確度就降低了。

  李成瑞和兩隻黃鸝都說科爾的死亡人數計算有問題,這是對的。

  蔣正華得到的結果是58-63六年間死亡人數8299萬,其中正常死亡6602萬,非正常死亡1697萬。

  59-61年困難時期,蔣正華算得死亡人數為4826萬。

  由於在下手頭沒有蔣正華計算的59-61年的正常死亡人數,隻能取作六年正常死亡人數的一半。

  這個主觀假設肯定會影響精確度,但誤差不大,還不至於影響準確度。

  最後認定困難時期過多死亡人口在1500萬左右。哪位朋友有蔣正華計算的59-61年的正常死亡人數,請提供,使在下拋棄這個主觀假設,以得到更精確的結論。

  金輝和兩隻黃鸝則是直接對年鑒上給出的數據進行重估。這在第一條準確度的判別標準上(選擇可信度高的初始數據)已比蔣正華的研究差。

  兩隻黃鸝從60年的人口總數比59年少了整數1000萬這個令人懷疑的數據出發,認為由於困難時期真實的出生率下降,年鑒上57-59年出生人數多報告了1000萬,為了平衡人口總數,年鑒就把這1000萬人記入到60年和61年的死亡人數。並且年鑒還把58-61年間外出逃荒等原因漏報的人口中的300萬列入了這期間的死亡人數,這些人在62年和63年回到原地,同樣為了平衡人口總數,年鑒這兩年的死亡人數少報告了300萬,這正是62年和63年年鑒上死亡人數少的原因。

  上述兩項合計,這段期間年鑒上多報告了死亡人數1300萬。

  請注意兩隻黃鸝這種說法是他本人的主觀設想,根據準確度的第二條判別標準,推算過程中加入主觀假設的方法所得到的結果要比推算過程中沒有主觀假設的方法所得到的結果不準確。

  接著兩隻黃鸝說:‘很多人的計算表明,這個時期的非正常死亡是1700萬,從1700萬減去1400萬就得到非正常死亡的上限為400萬。’雖然蔣正華的計算也表明,這個時期的非正常死亡是1700萬,但他根本沒用年鑒所提供的數據,因此不需要再作任何修正。

  兩隻黃鸝說的許多人,顯然不包括他。

  很多人最起碼是有三個人,請兩隻黃鸝給出除蔣正華之外其他三位得到1700萬這一結果的人,及其采用的初始數據和計算的方法或過程,並說明需要修正的原因。如有其他朋友知道,請轉貼供大家研究。

  還可以用1964年人口普查結果檢驗兩隻黃鸝的結果是否準確。

  根據1964年人口普查

  1958年7月1日至1959年6月30日出生的人在1964年7月1日存活1488萬,

  1959年7月1日至1960年6月30日出生的人在1964年7月1日存活1431萬,

  由此可認為

  1959年1月1日至1959年12月31日出生的人在

  1964年7月1日存活1465萬,1465萬不精確,但肯定是準確的。

  兩隻黃鸝認為57-59年出生人口多報了1000萬,又認為其中57年多報300萬,其它兩年共多報700萬,平均每年350萬。還是根據年鑒的數據,由59年出生率X(58年末人口總數+59年末人口總數)/2得到59年出生人數為1650萬,減去350萬,兩隻黃鸝修正後的59年出生人數為1300萬。

  而1964年人口普查結果59年出生的人僅在1964年7月1日存活的就還有1465萬,若再加上1964年7月1日以前死去的59年出生的人, 注意到本來就比較高的嬰幼兒死亡率, 在困難時期會更高, 數據相差就更大.

  根據統計資料不完整的說法,其中任何一個數據可信度低或缺少直接實測數據而以估算數據代替的話,那這樣得出的結論,意義了了,所以兩隻黃鸝的結論是不準確的.
  
  手頭沒有金輝的文章,壇上有丁抒《人禍》一書的摘要,他們的觀點相近,就用分析丁抒的說法代替之.

  丁抒也是對年鑒給出的數據進行重估,增加了一個0-3歲嬰幼兒死亡率的估算(采用中國社會科學出版社《一九五八年中國人口年鑒》所提供的數據估算).

  丁抒首先認為年鑒給出的死亡率不可信,然後用估算的0-3歲嬰幼兒死亡率和1964年人口普查所得相應年齡組當時存活的人數一起推算那幾年的出生人數,進而說明年鑒給出的出生率低了許多,這個結果和兩隻黃鸝認為年鑒57-59年的出生率過高,造成多報人口1000萬剛好相反.

  接著他按照年鑒給出的年末人口總數重新計算了出生率,由這個出生率和年鑒給出的出生率之差得到少報的人口數,由於已經按照千分之十點八扣除了正常死亡人數,這個數字就加入到非正常死亡的人數中,這樣他就有了58-63年非正常死亡人數(他還認為是餓死的)三千多萬的結論.

  丁抒在推算過程中沒有加入主觀假設,而且用可靠的數據證實年鑒給出的出生率偏低.

  盡管在下以為0-3歲嬰幼兒死亡率的估算可能偏高(當然當時的0-3歲嬰幼兒死亡率也不會像我們現在感覺到的八十年代以後的0-3歲嬰幼兒死亡率那麽低),但這隻是影響精確度.

  所以會有許多人認同丁抒他們的結論,但是在下並不認同.

  首先,年鑒給出的曆年死亡率至少在64年以前(包括64年)的偏低很多,應該把64年人口普查時得到的64年的死亡率作為那幾年的正常死亡率,即千分之十三點六左右.如果認同這一點,那末丁抒在這六年中共把1100萬正常死亡人口誤算入非正常死亡人口.

  再則,丁抒是把年鑒給出的年末人口總數作為初始數據開始推算的,實際上除了64年的以外,其它各年的年末人口總數可信度很低.證實這一點並不困難,64年的數據誤差應該較小,如果相信年鑒給出的63年年末人口總數是對的,則可由此重新推算的63年年末人口總數比年鑒所給少了600萬.由於初始數據的可信度低,丁抒的結論也不準確

  綜上所述,在下認為蔣正華的研究是準確的.

  金筆先生說整理這些要花很多時間,確實如此,所以在下到今天才能再答兩隻黃鸝.

  這番討論是金筆先生在文化走廊上’點火’(他的標題就是如此)引起的,現在金筆先生沒時間或沒興趣完全可以不繼續參與討論,但不能說在下是空談.

  在下抱著弄清曆史真相的目的參加討論,講的都有事實依據,並非主觀臆測的空談.

  兩隻黃鸝也把《廢墟中的桃花源》貼在文化走廊上,那裏輿論一邊倒,一片讚揚聲,那可不是好的討論氛圍,在下到目前為止還不想去點火. 
[ 打印 ]
[ 編輯 ]
[ 刪除 ]
閱讀 ()評論 (0)
評論
博主已隱藏評論
博主已關閉評論