49年到91年中國人口模擬:59-61三年人口有沒有異常,有多大?

根據網上1949-1991 年全國曆年主要人口數據,我做了一個分析,想估計出59-61三年人口變化與其它年份比較有沒有區別,有的話,再估計從變化是多大。

方法:將原始人口(P)數據取對數,然後計算對數序列的一次差分(Ln(P_t+1)-ln(P_t)),這相當於人口變動的對數值。轉換後的人口數據變動可以用簡單線性模型描述。

Ln(P_t+1)-ln(P_t) = a + b× (ln(P_t))

這個模型就是Gompertz模型,可以用於正常年份人口模擬,也可以說是人口變動率的模型。為了檢驗到59-61年的數據有沒有異常變化,假定與其它年份相比參數b不變,而隻是a 不同,引入一個啞變量X_t

Ln(P_t+1)-ln(P_t) = a + a1*X_t+1 + b× (ln(P_t))

X_t 取值除59-61年為1外,其餘為0,如果統計檢驗a1等於0,那麽就是說59-61年與其它年份人口變化沒有統計上的差別;相反就有。

結果:用Excel做數據ln(P_t), X_t的回歸,結果表明參數a1在統計上是明顯不等於0的(下表P值很小),模型擬合圖在對數坐標能看到些小差別, 數字太大,很多點都重合了。

 

 

Coefficients

Standard Error

t Stat

P-value

 a

0.186409

0.045848

4.065818

0.000225

 b

-0.01473

0.004046

-3.64037

0.000789

 a1

-0.02354

0.003554

-6.62302

7.09E-08

 

圖上也可以看出帶啞變量的模型表現不錯!那麽,靠模型如何估計人口在59-61年應該為多少呢?隻需要按常規年份計算59-61年的人口就行了, 也就是把參數估計值帶入公式( a + b× (ln(P_t))),實際估計人口公式為: P_t+1=P_t*exp(a+b*ln(P_t)), 減少的人口可以與實際人口比較或者擬合人口[P_t+1=P_t*exp(a+a1*X_t+1+b*ln(P_t))]比較得出。

三年實際人口是:67207, 66207,65859; 模型擬合人口是:659556715066165;按正常年份預測的人口應該是:675266874967741。如果與實際比較,三年人口因出生或者死亡不同,估計的下降人口數量為4743萬;與模型擬合比較,估計的下降人口數量為4747萬。擬合模型產生的三年殘差為95萬,也就是說把所有數據混在一起的模型高估了95萬人口,總體相對來說誤差不太大。

結論:根據正常年份的人口變動情況,59-61年三年中國人口可能因出生或者死亡不同,Gompertz模型統計分析出:三年約有4743或4747萬的總計人口數量低於正常年份。

這個模型隻能說明59-61年的人口變動是不同於正常年份的,不同的數量有多少。不能找出人口下降率高的具體原因,究竟人口下降的具體原因是死亡率高了,還是出生率低了或者兩者都有,模型也不知道。數據在後麵,有Excel願意的話,可以驗證,做出回歸可能不需要3分鍾以上時間。

Year Population(萬) Ln(P) Flag Ln(Pt+1)-Ln(Pt)
1949 54167 10.90    
1950 55196 10.92 0 0.019
1951 56300 10.94 0 0.020
1952 57482 10.96 0 0.021
1953 58796 10.98 0 0.023
1954 60266 11.01 0 0.025
1955 61465 11.03 0 0.020
1956 62828 11.05 0 0.022
1957 64653 11.08 0 0.029
1958 65994 11.10 0 0.021
1959 67207 11.12 1 0.018
1960 66207 11.10 1 -0.015
1961 65859 11.10 1 -0.005
1962 67295 11.12 0 0.022
1963 69172 11.14 0 0.028
1964 70499 11.16 0 0.019
1965 72538 11.19 0 0.029
1966 74542 11.22 0 0.027
1967 76368 11.24 0 0.024
1968 78534 11.27 0 0.028
1969 80671 11.30 0 0.027
1970 82992 11.33 0 0.028
1971 85229 11.35 0 0.027
1972 87177 11.38 0 0.023
1973 89211 11.40 0 0.023
1974 90859 11.42 0 0.018
1975 92420 11.43 0 0.017
1976 93717 11.45 0 0.014
1977 94974 11.46 0 0.013
1978 96259 11.47 0 0.013
1979 97542 11.49 0 0.013
1980 98705 11.50 0 0.012
1981 100072 11.51 0 0.014
1982 101654 11.53 0 0.016
1983 103008 11.54 0 0.013
1984 104357 11.56 0 0.013
1985 105851 11.57 0 0.014
1986 107507 11.59 0 0.016
1987 109300 11.60 0 0.017
1988 111026 11.62 0 0.016
1989 112704 11.63 0 0.015
1990 114333 11.65 0 0.014
1991 115823 11.66 0 0.013

 

所有跟帖: 

可否對曆年出生人口死亡人口分別做類似的分析?也許模型要換? -方外居士- 給 方外居士 發送悄悄話 (0 bytes) () 10/14/2024 postreply 11:08:01

可以用啞變量方法對出生率和死亡率做單獨分析,是不能用這個模型了。不同的生死模型也難有動力學特征。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 10/14/2024 postreply 11:26:20

這幾年出生率,死亡率等等。 -chufang- 給 chufang 發送悄悄話 chufang 的博客首頁 (247 bytes) () 10/14/2024 postreply 11:21:20

出生率人口數量增加而降低,死亡率稍降低些,以上數據可以對59-61的人口變動模型提供印證,畢竟 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (340 bytes) () 10/14/2024 postreply 12:03:21

圖表上人口出生率下降比死亡率上上升大一些,對人口下降影響更大,餓死人數應該低於模型給出的4千7百萬的一半(不考慮置信限) -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 10/14/2024 postreply 14:11:36

1960年前戶籍管理鬆散,大躍進時期大量農村戶籍人到城市當工人或勞力他們在城鎮有了新戶籍,但農村的戶籍並沒有撤銷,造成了 -sxyz- 給 sxyz 發送悄悄話 (206 bytes) () 10/14/2024 postreply 11:37:52

戶口的嚴密是從1958年開始到的 -華府采菊人- 給 華府采菊人 發送悄悄話 華府采菊人 的博客首頁 (0 bytes) () 10/14/2024 postreply 11:53:38

大量是多少?有%數嗎? -方外居士- 給 方外居士 發送悄悄話 (0 bytes) () 10/14/2024 postreply 11:57:02

人口數據是網上來的,如果59-61年的數據是有問題的話,那麽人口下降數量的估計誤差就會增大。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 10/14/2024 postreply 12:08:07

這麽說來,大躍進餓死三千萬,有科學根據? -郭大平- 給 郭大平 發送悄悄話 郭大平 的博客首頁 (0 bytes) () 10/14/2024 postreply 11:38:32

老郭這不廢話嗎。 -蔣聞銘- 給 蔣聞銘 發送悄悄話 蔣聞銘 的博客首頁 (0 bytes) () 10/14/2024 postreply 11:50:37

餓死三千萬,證據不好找。主要是當事人毛周毀屍滅跡手段高明。所以,如果能從科學理論分析上找出邏輯證據,是值得鼓勵的。 -郭大平- 給 郭大平 發送悄悄話 郭大平 的博客首頁 (0 bytes) () 10/14/2024 postreply 11:55:27

這是總數。包括死亡增加數和出生減少數。前者與餓死相關,但不全是餓死,也可能營養缺乏導致其他疾病而亡。 -方外居士- 給 方外居士 發送悄悄話 (0 bytes) () 10/14/2024 postreply 11:52:01

出生減少數,也與餓死有關。吃不飽,餓死了,生孩子都會少了。 -郭大平- 給 郭大平 發送悄悄話 郭大平 的博客首頁 (0 bytes) () 10/14/2024 postreply 12:00:56

那隻能算一個死亡人數,即大人。你不能把本來應該出生但因大人死了而沒有出生的也算死了,那個就沒邊了。 -方外居士- 給 方外居士 發送悄悄話 (0 bytes) () 10/14/2024 postreply 12:11:18

若真算也隻能算已經懷孕但死了的婦女所懷的孩子。 -方外居士- 給 方外居士 發送悄悄話 (0 bytes) () 10/14/2024 postreply 12:18:58

總之要精細化,而不是拍腦袋 -方外居士- 給 方外居士 發送悄悄話 (0 bytes) () 10/14/2024 postreply 12:22:28

我也是第一次嚐試從宏觀角度分析這個問題,方法是普通統計學的方法,比隨便喊應該更好一些。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 10/14/2024 postreply 12:10:21

你這個方法好,繞過了毛周的毀屍滅跡。因為毛數學沒學好,毀屍滅跡時沒有滅掉統計學上的證據。 -郭大平- 給 郭大平 發送悄悄話 郭大平 的博客首頁 (0 bytes) () 10/14/2024 postreply 12:15:39

國內外都有不少學者研究,但很多方法都有缺陷。以前懂人口的不太懂正統常規統計,懂統計的不知道解決實際問題的竅門。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 10/14/2024 postreply 12:59:07

上麵有個出生和死亡率數據,人口下降是與出生率下降和死亡率增加同時發生的。 -pichawxc- 給 pichawxc 發送悄悄話 pichawxc 的博客首頁 (0 bytes) () 10/14/2024 postreply 12:06:16

挺好。能報告一下您擬合的標準差嗎?另外,我建議先排除這三年的數據,對其他年份做整體最小二乘擬合,然後補算這三年人口;跟實 -馮墟- 給 馮墟 發送悄悄話 馮墟 的博客首頁 (57 bytes) () 10/14/2024 postreply 19:58:20

請您先登陸,再發跟帖!