根據網上1949-1991 年全國曆年主要人口數據,我做了一個分析,想估計出59-61三年人口變化與其它年份比較有沒有區別,有的話,再估計從變化是多大。
方法:將原始人口(P)數據取對數,然後計算對數序列的一次差分(Ln(P_t+1)-ln(P_t)),這相當於人口變動的對數值。轉換後的人口數據變動可以用簡單線性模型描述。
Ln(P_t+1)-ln(P_t) = a + b× (ln(P_t))
這個模型就是Gompertz模型,可以用於正常年份人口模擬,也可以說是人口變動率的模型。為了檢驗到59-61年的數據有沒有異常變化,假定與其它年份相比參數b不變,而隻是a 不同,引入一個啞變量X_t
Ln(P_t+1)-ln(P_t) = a + a1*X_t+1 + b× (ln(P_t))
X_t 取值除59-61年為1外,其餘為0,如果統計檢驗a1等於0,那麽就是說59-61年與其它年份人口變化沒有統計上的差別;相反就有。
結果:用Excel做數據ln(P_t), X_t的回歸,結果表明參數a1在統計上是明顯不等於0的(下表P值很小),模型擬合圖在對數坐標能看到些小差別, 數字太大,很多點都重合了。
|
|
Coefficients |
Standard Error |
t Stat |
P-value |
|||||
|
a |
|
|
|
|
|||||
|
b |
|
|
|
|
|||||
|
a1 |
|
|
|
|

圖上也可以看出帶啞變量的模型表現不錯!那麽,靠模型如何估計人口在59-61年應該為多少呢?隻需要按常規年份計算59-61年的人口就行了, 也就是把參數估計值帶入公式( a + b× (ln(P_t))),實際估計人口公式為: P_t+1=P_t*exp(a+b*ln(P_t)), 減少的人口可以與實際人口比較或者擬合人口[P_t+1=P_t*exp(a+a1*X_t+1+b*ln(P_t))]比較得出。
三年實際人口是:67207, 66207,65859; 模型擬合人口是:65956,67150, 66165;按正常年份預測的人口應該是:67513,68735,67727。如果與實際比較,三年人口因出生或者死亡不同,估計的下降人口數量為4702萬;與模型擬合比較,估計的下降人口數量為4701萬。
結論:根據正常年份的人口變動情況,59-61年三年中國人口可能因出生或者死亡不同,Gompertz模型統計分析出:三年約有4700萬總計人口數量低於正常年份。
這個模型隻能說明59-61年的人口變動是不同於正常年份的,不同的數量有多少。不能找出人口下降率高的具體原因,究竟人口下降的具體原因是死亡率高了,還是出生率低了或者兩者都有,模型也不知道。數據附在下麵。
| Year | Population | Ln(P) | Flag | R |
| 1949 | 54167 | 10.8998 | 0 | 0.018819 |
| 1950 | 55196 | 10.9186 | 0 | 0.019804 |
| 1951 | 56300 | 10.9384 | 0 | 0.020777 |
| 1952 | 57482 | 10.9592 | 0 | 0.022602 |
| 1953 | 58796 | 10.9818 | 0 | 0.024694 |
| 1954 | 60266 | 11.0065 | 0 | 0.019700 |
| 1955 | 61465 | 11.0262 | 0 | 0.021933 |
| 1956 | 62828 | 11.0482 | 0 | 0.028634 |
| 1957 | 64653 | 11.0768 | 0 | 0.020529 |
| 1958 | 65994 | 11.0973 | 1 | 0.018214 |
| 1959 | 67207 | 11.1155 | 1 | -0.014991 |
| 1960 | 66207 | 11.1005 | 1 | -0.005270 |
| 1961 | 65859 | 11.0953 | 0 | 0.021570 |
| 1962 | 67295 | 11.1168 | 0 | 0.027510 |
| 1963 | 69172 | 11.1444 | 0 | 0.019002 |
| 1964 | 70499 | 11.1634 | 0 | 0.028512 |
| 1965 | 72538 | 11.1919 | 0 | 0.027252 |
| 1966 | 74542 | 11.2191 | 0 | 0.024201 |
| 1967 | 76368 | 11.2433 | 0 | 0.027968 |
| 1968 | 78534 | 11.2713 | 0 | 0.026848 |
| 1969 | 80671 | 11.2981 | 0 | 0.028365 |
| 1970 | 82992 | 11.3265 | 0 | 0.026598 |
| 1971 | 85229 | 11.3531 | 0 | 0.022599 |
| 1972 | 87177 | 11.3757 | 0 | 0.023064 |
| 1973 | 89211 | 11.3988 | 0 | 0.018305 |
| 1974 | 90859 | 11.4171 | 0 | 0.017035 |
| 1975 | 92420 | 11.4341 | 0 | 0.013936 |
| 1976 | 93717 | 11.4480 | 0 | 0.013324 |
| 1977 | 94974 | 11.4614 | 0 | 0.013439 |
| 1978 | 96259 | 11.4748 | 0 | 0.013241 |
| 1979 | 97542 | 11.4880 | 0 | 0.011853 |
| 1980 | 98705 | 11.4999 | 0 | 0.013754 |
| 1981 | 100072 | 11.5136 | 0 | 0.015685 |
| 1982 | 101654 | 11.5293 | 0 | 0.013232 |
| 1983 | 103008 | 11.5426 | 0 | 0.013011 |
| 1984 | 104357 | 11.5556 | 0 | 0.014215 |
| 1985 | 105851 | 11.5698 | 0 | 0.015524 |
| 1986 | 107507 | 11.5853 | 0 | 0.016540 |
| 1987 | 109300 | 11.6019 | 0 | 0.015668 |
| 1988 | 111026 | 11.6175 | 0 | 0.015001 |
| 1989 | 112704 | 11.6325 | 0 | 0.014350 |
| 1990 | 114333 | 11.6469 | 0 | 0.012948 |
| 1991 | 115823 | 11.6598 | 0 |