根據網上1949-1991 年全國曆年主要人口數據,我做了一個分析,想估計出59-61三年人口變化與其它年份比較有沒有區別,有的話,再估計從變化是多大。
方法:將原始人口(P)數據取對數,然後計算對數序列的一次差分(Ln(P_t+1)-ln(P_t)),這相當於人口變動的對數值。轉換後的人口數據變動可以用簡單線性模型描述。
Ln(P_t+1)-ln(P_t) = a + b× (ln(P_t))
這個模型就是Gompertz模型,可以用於正常年份人口模擬,也可以說是人口變動率的模型。為了檢驗到59-61年的數據有沒有異常變化,假定與其它年份相比參數b不變,而隻是a 不同,引入一個啞變量X_t
Ln(P_t+1)-ln(P_t) = a + a1*X_t+1 + b× (ln(P_t))
X_t 取值除59-61年為1外,其餘為0,如果統計檢驗a1等於0,那麽就是說59-61年與其它年份人口變化沒有統計上的差別;相反就有。
結果:用Excel做數據ln(P_t), X_t的回歸,結果表明參數a1在統計上是明顯不等於0的(下表P值很小),模型擬合圖在對數坐標能看到些小差別, 數字太大,很多點都重合了。
|
Coefficients |
Standard Error |
t Stat |
P-value |
a |
0.186409 |
0.045848 |
4.065818 |
0.000225 |
b |
-0.01473 |
0.004046 |
-3.64037 |
0.000789 |
a1 |
-0.02354 |
0.003554 |
-6.62302 |
7.09E-08 |
圖上也可以看出帶啞變量的模型表現不錯!那麽,靠模型如何估計人口在59-61年應該為多少呢?隻需要按常規年份計算59-61年的人口就行了, 也就是把參數估計值帶入公式( a + b× (ln(P_t))),實際估計人口公式為: P_t+1=P_t*exp(a+b*ln(P_t)), 減少的人口可以與實際人口比較或者擬合人口[P_t+1=P_t*exp(a+a1*X_t+1+b*ln(P_t))]比較得出。
三年實際人口是:67207, 66207,65859; 模型擬合人口是:65955,67150, 66165;按正常年份預測的人口應該是:67526,68749,67741。如果與實際比較,三年人口因出生或者死亡不同,估計的下降人口數量為4743萬;與模型擬合比較,估計的下降人口數量為4747萬。擬合模型產生的三年殘差為95萬,也就是說把所有數據混在一起的模型高估了95萬人口,總體相對來說誤差不太大。
結論:根據正常年份的人口變動情況,59-61年三年中國人口可能因出生或者死亡不同,Gompertz模型統計分析出:三年約有4743或4747萬的總計人口數量低於正常年份。
這個模型隻能說明59-61年的人口變動是不同於正常年份的,不同的數量有多少。不能找出人口下降率高的具體原因,究竟人口下降的具體原因是死亡率高了,還是出生率低了或者兩者都有,模型也不知道。數據在後麵,有Excel願意的話,可以驗證,做出回歸可能不需要3分鍾以上時間。
Year | Population(萬) | Ln(P) | Flag | Ln(Pt+1)-Ln(Pt) |
1949 | 54167 | 10.90 | ||
1950 | 55196 | 10.92 | 0 | 0.019 |
1951 | 56300 | 10.94 | 0 | 0.020 |
1952 | 57482 | 10.96 | 0 | 0.021 |
1953 | 58796 | 10.98 | 0 | 0.023 |
1954 | 60266 | 11.01 | 0 | 0.025 |
1955 | 61465 | 11.03 | 0 | 0.020 |
1956 | 62828 | 11.05 | 0 | 0.022 |
1957 | 64653 | 11.08 | 0 | 0.029 |
1958 | 65994 | 11.10 | 0 | 0.021 |
1959 | 67207 | 11.12 | 1 | 0.018 |
1960 | 66207 | 11.10 | 1 | -0.015 |
1961 | 65859 | 11.10 | 1 | -0.005 |
1962 | 67295 | 11.12 | 0 | 0.022 |
1963 | 69172 | 11.14 | 0 | 0.028 |
1964 | 70499 | 11.16 | 0 | 0.019 |
1965 | 72538 | 11.19 | 0 | 0.029 |
1966 | 74542 | 11.22 | 0 | 0.027 |
1967 | 76368 | 11.24 | 0 | 0.024 |
1968 | 78534 | 11.27 | 0 | 0.028 |
1969 | 80671 | 11.30 | 0 | 0.027 |
1970 | 82992 | 11.33 | 0 | 0.028 |
1971 | 85229 | 11.35 | 0 | 0.027 |
1972 | 87177 | 11.38 | 0 | 0.023 |
1973 | 89211 | 11.40 | 0 | 0.023 |
1974 | 90859 | 11.42 | 0 | 0.018 |
1975 | 92420 | 11.43 | 0 | 0.017 |
1976 | 93717 | 11.45 | 0 | 0.014 |
1977 | 94974 | 11.46 | 0 | 0.013 |
1978 | 96259 | 11.47 | 0 | 0.013 |
1979 | 97542 | 11.49 | 0 | 0.013 |
1980 | 98705 | 11.50 | 0 | 0.012 |
1981 | 100072 | 11.51 | 0 | 0.014 |
1982 | 101654 | 11.53 | 0 | 0.016 |
1983 | 103008 | 11.54 | 0 | 0.013 |
1984 | 104357 | 11.56 | 0 | 0.013 |
1985 | 105851 | 11.57 | 0 | 0.014 |
1986 | 107507 | 11.59 | 0 | 0.016 |
1987 | 109300 | 11.60 | 0 | 0.017 |
1988 | 111026 | 11.62 | 0 | 0.016 |
1989 | 112704 | 11.63 | 0 | 0.015 |
1990 | 114333 | 11.65 | 0 | 0.014 |
1991 | 115823 | 11.66 | 0 | 0.013 |