您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页中国人口增长预测

中国人口增长预测

来源:爱go旅游网
中国人口增长预测

摘要:本文是关于中国未来人口预测问题,严格说来,人口预测就是指根据一个国家、

一个地区现有人口状况及可以预测到的未来发展变化趋势,测算在未来某个时间人口的状况。这里说的人口状况,首先是指人口的数量,其次是指人口的性别、年龄构成。在此基础上,还可以对未来人口的地区分布等进行分析。

一般来说对未来人口预测可采用回归分析、自回归分析、差分方法、logistic曲线拟和方法研究、传统三点法拟和曲线研究、变分同化法研究、非参数估计法等多种预测方法,根据所给数据与中国人口发展的新特点,本文在采用灰色系统理论的基础上进行分块整合处理。

大致思路如下:

在分块思想的指导下,分别计算出市、镇、乡不同性别的死亡率与出生率及相关数据。在所计算的数据的基础上,利用灰色系统理论建立GM(1,1)的预测模型,应用嘴最小二乘法进行参数估计,然后分别对市、镇、乡不同性别的死亡率与出生率的发展状况进行预测。

为了得到全国总人口的发展趋势,需对分块预测数据进行整合,以此来预测人口发展的总体态势。

用C语言对以上过程进行处理得到相关数据,预测出了中短期人口发展趋势,结果为总体人数呈上升趋势,男女比例出现一定程度上的失调,城镇人口增长速度比乡村快。如2006年总人口为13.14亿人、2010年为13.45亿人、2020年14.亿人,在一定波动范围内与国家预测人数相符合。

关键词:人口预测,灰色系统理论,灰色建模,最小二乘法,;

1

一、 问题的重述

中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。

近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。2007年初发布的《国家人口发展战略研究报告》(附录1) 还做出了进一步的分析。

关于中国人口问题已有多方面的研究,并积累了大量数据资料。附录2就是从《中国人口统计年鉴》上收集到的部分数据。

下面依据中国的实际情况和人口增长的上述特点,并参考附录2中的相关数据和一些文献中的数据,去建立中国人口增长的数学模型,并利用此模型对中国人口增长的中短期和长期趋势做出预测。

二、问题的分析

任何人口预测,一般都包括前提条件、假设条件和数学模型三个要素。前提条件指预测时的人口现状,包括当时的人口数量、性别和年龄结构、地区分布状况,以及人口过程中的出生、死亡、迁移等因素的强度等等。假设条件主要是对未来人口过程的出生、死亡、年龄结构、迁移等因素,作定量的规定,假定这些因素在未来保持在怎样的数量指标。

对问题中所给数据进行处理,绘图如下:

城、镇、乡发展趋势0.70.60.5比率0.40.30.20.102001年2002年2003年年份2004年2005年城比率镇比率乡比率

上图说明城镇人口总体成缓慢上升趋势,而乡村有明显的下降幅度,这反映出中国人口城镇化。

2

市、镇、乡性别比例1301251201151101051002001年 2002年2003年2004年2005年年份 此图表明中国整体性别比失调,使城乡性别比有差异。

市性别比镇性别比乡性别比根据以上中国城乡和性别的特点,性别比和城乡比都将对中国总人口的发展趋势产生影响, 在预测人口发展趋势时采用分块整合的思想进行数据处理,为了提高预测的准确性,应将其他影响因素考虑在内,而由于其他影响因素不宜用具体数据进行描述,需采用灰度模型对人口发展态势进行分析。

灰色预测模型属于全因素的非线性拟合外推类方法 , 在形式上是单数列预测 , 只运用研究对象自身的时间序列建立模型 , 与其相关联的因素没有参与建模 , 这正是灰色系统“灰”的体现。因为任何一个系统究竟包含多少因素 , 难以说清。比如人口系统的再生产是由生育、死亡、疾病、灾害、环境、社会、经济等诸多因素影响、制约的共同结果 , 如此众多的因素不可能通过几个指标就能表达清楚 , 它们对人口增长的潜在而复杂的影响更是无法精确计算。这反映出人口系统具有明显的灰色性 , 适宜采用灰色模型去发掘和认识原始时间序列综合灰色量所包涵的内在规律。

比率三、模型的假设

1,将中国整体人口看成一个整体;

2,认为出生率与死亡率是全国人口状态变化的主要因素; 3,在一定时期内中国不出现非正常的人口波动;

4,假设所给的统计数据在能反应实际情况,且与实际数据相差不大; 5, 在短期内不考虑中国人口给人口带来的影响; 6,每一位孕妇生一个孩子且在本年生; 7,不考虑地区之间人口迁移情况; 8,本文所调查的人数是随机的。

3

四、符号说明

i 表示年第几年 k 估测的年份数

Qj 表示2005年市、镇、乡的总人口 Pjk 相应年份的估计增长率

S 表示全国在相应年份的人数估计 m 表示年份估计的数量

五、模型的建立

(一) 模型的分析;

在整个问题的算法采用灰色预测模型[8],现对此模型阐述如下:

根据已知给定的数据,如对于2001—2005年某项指标记为矩阵

Aaiji1,,5j表示各项指标,j 数据已有,将这几个数据记为

x0x0(1),x0(2),x0(3),x0(4),x0(5) (1)

i对X作一次累加,则x(1)x(1),x(i)x0(k)0101i2,3,4,5

k1记 x1x1(1),x1(2),x1(3),x1(4),x1(5) (2) 取X1的平均均值,则 Z1(k)X1(1)(1)X1(k1)数,在这里取0.5)

记 Z1Z1(2),Z1(3),Z1(4),Z1(5) (3) 于是GM(1,1)的白化微分方程模型为

dx1ax1b dtk2,3,4,5(其中为确定参

其中a为发展灰度,b为内生控制灰度 (4)

取x0(k)为灰导数,Z1(k)为背景值 ,

(k2,3,4,5)

由于x1(k)x1(k1)x0(k)则方程(4)对应的灰微分方程为 x0(k)aZ1(k)b那么可得出矩阵形式为

Y0B(a,b)其中Y0x0(2),x0(3),x0(4),x0(5)Z1(2)Z1(5) B11

,b用最小二乘法求得参数的估计值为a

B*B*B*Y0 (5)

14

具体地

CD(n1)E,bDFCEa(n1)FC2(n1)FC2其中CZ1(k),Dx0(k),EZ1(k)x0(k),FZ1(k)k2k2k2k2nnnn2 (6)

1(t1)x0(1)b*eatb 于是方程(4)有特解 xaa011b则 x(k1)x(k1)x(k)x0(1)*eakea(k1) (7)

a六、模型求解

(一)原始数据处理:

城市各年龄男性死亡率=该年龄男性占城市的百分比*该年龄死亡男性所占该年龄男性的比率;

城市男性死亡率就等于城市各年龄死亡率之和 其他所求出生率与死亡率依次类推。

运用以上处理方法,根据所给相关数据将各年的市、镇、乡的男女出生率、死亡率计算如下表(表一): 从2001—2005各块的出生率 年份 男孩出生率 女孩出生率 男孩出生率 女孩出生率 男孩出生率 女孩出生率 2001年 4.736772095 4.33426714 5.588793 5.11334 6.662023 5.6668 2002年 4.383616355 3.96100917 5.218483011 4.71536 6.753085 5.53033 2003年 0.41046216 0.36628784 0.351472 0.47853 0.658295 0.4496 2004年 4.651086234 4.0213766 5.477045887 4.78591 6.334166 5.183017 2005年 4.241432461 3.723167539 4.885108153 4.2881918 5.551791 4.580308 从2001—2005各块的死亡率 市男死亡率 市女死亡率 镇男死生率 镇女死生率 乡男死亡率 乡女死亡率 2001年 2.730618 2.098765 2.762206 1.908067 3.79728 2.823237 2002年 2.721197 1.907143 2.861473 2.125785 4.083444 3.106784 2003年 2.8710 2.194943 2.71219 2.042573 3.7088 3.0084 2004年 2.697215 1.851126 3.022139 2.198488 4.156148 3.0009 2005年 2.585838 1.9042 2.962309 2.333446 4.156049 3.153056 ( 表一) 注:上面数据为千分比。

(二) 求出参数

根据表一 现仅针对市男死亡率的灰色预测模型,则有

5

x0(273.0618, 272.1197, 287.10, 269.7215, 258.5838)x(273.0618, 5.1815, 832.2904, 1102.0119, 360.5957)1

经检验在这里取a=0.5比较合适,由(3)式可得

Z1(409.12165, 688.73595, 967.15115, 1231.3038)

再用最小二乘法,由(6)式和上面数据可求得a= 0.021765,b= 2.9347

0(k1)x1(k1)x1(k)2.730618133.20625e0.02177ke0.02177(k1)x130.479e0.02177ke0.02177(k1)

那么每给一个k就可求得相应年份的市男死亡率,如此方法类推可以分别求得相应年份的市女死亡率、镇男死亡率、镇女死亡率、乡男死亡率、乡女死亡率以及它们的出生率,从而可求得相应年份的增长率,相应估计数据如下(表二): 年份 2006年 2007年 2008年 2009年 2010年 2015年 2020年 2025年 市男增长率估9.420569.632739.8458210.05910.2749911.367613.659914.8725计 1 4 8 6 1 9 8 3 市女增长率估4.667734.802615.932397.481338.31805计 5 2 4.93886 5.0797 5.215538 4 5 1 镇男增长率估5.486715.630905.776926.852168.561209.49882计 6 4 4 5.924797 6.0743 6 5 3 镇女增长率估6.196256.283406.3717.017378.033118.58534计 2 2 8 6.460702 6.550873 1 6 9 乡男增长率估4.52.4935.070015.708066.04119计 8 4.58562 9 4.704605 4.7622 1 4 7 乡女增长率估4.7114.811725.224226.165计 4.69683 7 9 4.869667 4.927932 9 5.84237 2 表二 注:增长率为千分比

以2005年全国人口数据为基准,设为Qj,市男、市女、镇男、镇女、乡男及乡女的相应年份的增长率分别设为:Pjk6(j1,2,3,4,5,6k为年份),

m则相应年份的全国人口数为 SQj(1Pjk)j1k6(m50)

把2005年作为基准(万人) 市男人口 市女人口 镇男人口 镇女人口 乡男人口 乡女人口 18149.35 18091.96 11276.02 11117.23 36660.83 360.6

整个过程用C语言编程(程序见附录二)计算得到全国人数的如下估计数据:

6

年份 2006 2007 2008 2009 2010 2015 2020 2025 全国总人口估131474.132210.1329.133737.03134527.138771451.155028.计 7 8 8 8 9 7 3 9 注:人数以万人为单位。

用图形进行整体趋势预测为:

全国人口预测160000155000150000145000140000135000130000125000120000115000人口数全国人口预测2006年2009年2012年2015年2018年2021年2024年2027年年份

7

2030年增长趋势图16141210820增长率年份

市男增长率预测市女增长率预测镇男增长率预测镇女增长率预测乡男增长率预测测2006年2008年2010年2012年2014年2016年2018年2020年2022年2024年2026年2028年2030年

七、模型的检验

为确保所建灰色模型有较高的精度应用于预测实践,一般需要按下述步骤进行检验:

00(1) 求出x(k)与x(k)之残差e(k) 、相对误差k和平均相对误差:

0 e(k)xk(x)k0e(k)()k,0x(k)n1100%k

nk1(2) 求出原始数据平均值x, 残差平均值e :

1n0xx(k)nk11n0ee(k)

n1k222 (3) 求出原始数据方差s1与残差方差s2的均方差比值C 和小误差概率p:

1n01n022e(k)e s1x(k)x,s22k1n1k2通常e(k)、k、C 值越小, p 值越大, 则模型精度越好。若0.01 且

22 8

K0.01、C0.35、p>0.95, 则模型精度为一级。根据灰色系统理论, 当发展系数a(2,2)且a0.3时,则所建GM (1 , 1) 模型则可用于中长期预测。

没找到2006年实际人口数,无法对模型进行有效的检验。

[2]

八、模型的评价及改进

在用灰色模型进行预测时,采用的是01-05年的统计数据,用这些数据仅能反映离05年较近的几年的人口发展状况,而对于十年后或者更长期的人口发展来说,预测的精确度会降低,导致预测不准确。

考虑上述模型的不足,对模型的改进分析如下:

为了提高预测的准确度,采用新陈代谢GM(1,1)的族群模型,将预测的数据作为下一年预测的已知参考数列的一个元素,为了不改变灰色预测模型的维数,须将离预测年最远的那一年的参考数列的元素剔出。如:要预测2007年的人口数,可将预测的2006年的有关数据作为参考数列的一个元素,同时将2001年的有关数据给剔除掉。这样得到的数据会在很大程度上接近实际。

参考文献:

[1] 韩中庚 ,《数学建模方法及其应用》,北京:高等教育出版社,2005年6月。 [2] 门可佩 曾卫,《中国未来50年人口发展预测研究》,《数量经济技术经济研究》,第三期,2004年。 [3] 张志涌,《精通MATLAB 6.5版》,北京:北京航空航天大学出版社,2003年3月。

9

附表1: 市男死亡率生成数列 x0 x1 z1 市女死亡率生成数列 x0 x1 z1 镇男死亡率生成数列 x0 x1 z1 镇女死亡率生成数列 x0 x1 z1 乡男死亡率生成数列 x0 x1 z1 乡女死亡率生成数列 x0 x1 z1 注:上表数据以 估计值的相关参数 C 市男死亡率参数 市女死亡率参数 镇男死亡率参数 镇女死亡率参数 乡男死亡率参数 乡女死亡率参数 市男出生率参数 市女出生率参数 镇男出生率参数 镇女出生率参数 乡男出生率参数 乡女出生率参数

2001年 2002年 2003年 2004年 2005年 273.0618 272.1197 287.10 269.7215 258.5838 273.0618 5.1815 832.2904 1102.012 1360.596 409.1217 688.736 967.1512 2069.163 2001年 2002年 2003年 2004年 2005年 209.8765 190.7143 219.4943 185.1126 190.42 209.8765 400.5908 620.0851 805.1977 996.0919 305.2337 705.8245 1325.91 2131.107 2001年 2002年 2003年 2004年 2005年 276.2206 286.1473 271.219 302.2139 296.2309 276.2206 562.3679 833.5869 1135.801 1432.032 419.2943 697.9774 984.6939 1283.916 2001年 2002年 2003年 2004年 2005年 190.8067 212.5785 204.2573 219.8488 233.3446 190.8067 403.3852 607.25 827.4913 1060.836 297.096 505.5139 717.5669 944.1636 2001年 2002年 2003年 2004年 2005年 379.728 408.3444 3.7088 415.6148 415.6049 379.728 788.0724 1177.781 1593.396 2009.001 583.9002 982.9268 1385.5 1801.198 2001年 2002年 2003年 2004年 2005年 282.3237 310.6784 300.84 306.4009 315.3056 282.3237 593.0021 3.5505 1199.951 1515.257 437.6629 743.2763 1046.751 1357.604 105为分母 D E F a b b/a 32.96 10.88 88.83 309.32 0.02176 2.9347 133.209 7.86 24.29 47.41 167.26 0.0021068 6.076 2884.245 11.59 33.86 98.72 328.1 -0.002073 8.4592 -4079.79 8.7 24. .45 175.02 -0.0097 6.148045 -1118.52 16.29 47. 194.59 7.13 -0.001693 11.8781 -7015.48 12.32 35.85 110.81 368.28 -0.001187 8.958845 -79.53 13.69 44.41 158.49 1.32 -0.013139 11.05753 -841.583 12.11 40.07 125. 438.91 -0.011381 9.983043 -877.148 16.12 52. 220.11 759.81 -0.011471 13.11377 -1143.18 14.27 47.51 174.97 616.44 -0.009687 11.84294 -1222.61 19.3 .21 314.75 1124.38 -0.004787 16.0294 -3348.45 15.84 53.44 215.15 777.15 -0.004938 13.34045 -2701.76 10

附表二

#include #include #define M 50

void fun(double aa[][M],double bb[][M],double cc[][M],int n) {int i,j;

for(i=0;i<6;i++) {if(i==0)

for(j=6;j<=n;j++)

{aa[i][j]=845.323*(exp(0.01314*j)-exp(0.01314*(j-1)));

bb[i][j]=-130.479*(exp(-0.021765*j)-exp(-0.021765*(j-1))); cc[i][j]=aa[i][j]-bb[i][j]; }

if(i==1)

for(j=6;j<=n;j++)

{aa[i][j]=881.478*(exp(0.01138*j)-exp(0.01138*(j-1)));

bb[i][j]=-2886.345*(exp(-0.002107*j)-exp(-0.002107*(j-1))); cc[i][j]=aa[i][j]-bb[i][j];} if(i==2)

for(j=6;j<=n;j++)

{aa[i][j]=1148.76*(exp(0.01147*j)-exp(0.01147*(j-1))); bb[i][j]=4082.55*(exp(0.00207*j)-exp(0.00207*(j-1))); cc[i][j]=aa[i][j]-bb[i][j];} if(i==3)

for(j=6;j<=n;j++)

{aa[i][j]=1227.72*(exp(0.00969*j)-exp(0.00969*(j-1))); bb[i][j]=1120.43*(exp(0.0055*j)-exp(0.0055*(j-1))); cc[i][j]=aa[i][j]-bb[i][j];} if(i==4)

for(j=6;j<=n;j++)

{aa[i][j]=3355.11*(exp(0.00479*j)-exp(0.00479*(j-1))); bb[i][j]=7019.28*(exp(0.00169*j)-exp(0.00169*(j-1))); cc[i][j]=aa[i][j]-bb[i][j];} if(i==5)

for(j=6;j<=n;j++)

{aa[i][j]=2707.44*(exp(0.00494*j)-exp(0.00494*(j-1))); bb[i][j]=7552.35*(exp(0.00119*j)-exp(0.00119*(j-1))); cc[i][j]=aa[i][j]-bb[i][j];} } }

void qinjifeng(double cc[][M],double a[6],double dd[M][6],int n) {int i,j; double e[6]; for(j=6;j<=n;j++) {for(i=0;i<6;i++)

11

e[i]=dd[j][i]=a[i]+a[i]*cc[i][j]/1000; a=e; } }

void qjf(double s[6][M],int n) {int i,j;

for(i=0;i<6;i++) for(j=6;j<=n;j++)

printf(\"%f \

void qjf26(double dd[M][6],double *b,int n) {int i,j; double sum=0.0; for(j=6;j<=n;j++) {for(i=0;i<6;i++) sum+=dd[j][i]; b[j]=sum; sum=0.0;}}

main()

{double a[6]={18149.35,18091.96,11276.02,11117.23,36660.83,360.6},b[M]; int n,i;

double aa[6][M],bb[6][M],cc[6][M],dd[M][6]; scanf(\"%d\fun(aa,bb,cc,n); qjf(aa,n); qjf(bb,n); qjf(cc,n);

qinjifeng(cc,a,dd,n); qjf26(dd,b,n) ; for(i=6;i<=n;i++) printf(\"%f \ }

12

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务