前面我曾经写过一篇文章:
10年之后,中国到底会有多少人?
文中提到,因为国家统计局没有公布详细的第七次全国人口普查(下文简称“七普”)数据,所以当时利用2010年的第六次全国人口普查(下文简称“六普”)数据,对中国2022-2050年的人口数量和结构进行了高、中、低三种估算。
现在,国家统计局公布了详细的“七普”数据。如果说这份数据的准确性远超“六普”的话,就很有必要用“七普”的数据来更新我的估算。
更新的基础计算数据包括:
1)2022-2035年15-49岁育龄女性人口数量(直接采用“七普”数据,用于计算2022-2050年出生婴儿数量);
2)总和生育率数据(这次直接采用“七普”的数据1.3,不再设置高-中-低三种模式)。
3)2022-2050年老人数据(采用“七普”数据,代替“六普”数据)。
对于这三个更新的数据,下面一一进行说明。
在“六普”数据中,出生人口截止2010年,所以无法直接估算2026-2050年的育龄妇女人数(15-49岁女性人数),由此也就无法估算2025-2050年的出生婴儿数量。
为解决这个问题,当时我就采用了讨巧的办法,将总和生育率,全部赋予到28-29岁女性,然后,通过估算2022-2050年的28-29岁女性数量,来估算出生人口数据。
为什么采用28-29岁女性数量计算未来的出生人口?
这是因为,根据当时“七普”公布的生育婴儿年龄(见下表)权重综合起来,是28.5岁。
2050年29岁的女性,在2021年出生,采用这种方法,用“六普”中的女婴数量一手数据,加上2011-2021年出生的女婴数量,就可以算出2022-2050年的出生人口数量。
这种方式,个人认为还算比较合理和巧妙。也正因为如此,我才敢大胆地说,关于2022-2050年中国人口规模,我的估算应该比梁建章和任泽平的估算更为精确。
因为——梁建章、任泽平采用的也是“六普”数据,但他们的估算年份,居然延伸到了2100年,这肯定是缺乏一手数据支撑的,估算过程中必然需要多次(4次以上)循环使用自己算出来的二手数据。这会大大加大估算的误差。
现在,使用更加准确的“七普”数据,直接就可以估算2022-2035年的出生女婴数量(2020年出生的女婴,到了2035年刚好到达15岁的育龄年龄),用这个女婴数量,就可以进一步来估算2035-2050年的出生人口数据(2035年出生的女婴,2050年刚好到达15岁的育龄年龄)。
不过,为了彻底避免使用二手数据,本次数据更新估算中,仍然通过计算28-29岁女性的数量来估算2022-2050年的出生人口——只不过,将28-29岁女性的数量,用2020年的“七普”数据代替原来的“六普”数据。
为什么坚持采用28-29岁女性数量来估计出生人口?
因为我发现,采用这个数据,回测2018-2021年出生人口,数据吻合相当的好。
这里特别要提一下“总和生育率”。因为,这是计算中国未来人口数量的最大变量,总和生育率降低,每年出生人口数量会更少;总和生育率抬升,出生人口会大幅度增加。
上一次估算中,我采用高-中-低三个数据进行估算,但这一次不那么麻烦了,直接采用2020年的总和生育率,作为计算基础。进一步地,根据“七普”分年龄段的女性死亡人口详细数据,我们合理估计,有1%的女孩在成长过程中因为意外因素身故或丧失生育能力。
这样一来,我们就可以估算2022-2050年的出生人口情况了,估算结果见下图。
出生人口数量更新完毕,我们再来看死亡人口的更新。
在国家统计局公布的“七普”数据中,有对中国每个年龄段人口死亡率非常详细的统计,从0岁的婴儿死亡率一直到100岁+老人的死亡率,都有详细的统计。
假定自2020年以后,每个年龄的人口死亡率与2020年保持一致,那么,有了每年的人口年龄分布,自然就可以计算每年的死亡人口数量——但如果采用这种方式,自2022年开始的出生人口数量未知,再次不可避免地涉及到了二手数据的循环使用问题。
只要涉及二手数据循环使用问题,估算出来的数据偏差,就会不可避免地放大。
为了杜绝二手数据使用,我们仍然采用前面的育龄妇女生育孩子的计算方式,将所有的死亡人口,全部具体赋予到某个具体的平均死亡年龄数字上(注意,不是人均预期寿命),来估算死亡人口数据。
根据“七普”的分年龄死亡数据计算,2020年中国人的平均死亡年龄为72.42岁(与此对照,2010年的“六普”数据中,中国人的平均死亡年龄为68.03岁)。这样一来,根据“七普”人口数据,我们就可以估算从2022年到2050年每年的死亡人口。
有了年度出生人口数据、死亡人口数据,再加上2021年人口数量,就可以估算未来30年的中国人口总数了,具体见下表。
必须说明的是,对这份中国未来30年人口预测数据,就过去2年的数据表现而言,可能是偏乐观的——无论是出生人口数据,还是死亡人口数据。
先从出生人口方面看。
根据我的估算回测,2021年中国出生人口应在1156万人,国家统计局公布的出生人口数据是1062万,已经比我的估计少了94万人。
截止2022年6月15日,已经有28个省市公布了其2021年的出生人口数据,将这些省市公布的出生人口数据相加,仅有947万人,而且有一小半省市人口出现了负增长。还有尚未公布数据的安徽、海南、天津,这三个省市人口增长加起来显然难以过百万……
公安部的数据更不妙,公安部户政管理研究中心发布《2021年全国姓名报告》中透露:
截至2021年12月31日,2021年出生并已经到公安机关进行户籍登记的新生儿共887.3万,其中男性新生儿468.1万,占52.75%;女性新生儿419.2万,占47.25%。
出现这些偏差的关键,其实就是总和生育率数据的不确定。
“七普”显示的总和生育率是1.3,这是基于2020年1200万人的出生数据估算出来的。鉴于2021年的出生人口相比2020年大幅度下跌,我个人估计,2021年的总和生育率应该在1.2左右,如果公安部的数据更真实的话,那这个总和生育率估计会更低,可能会到1附近。
近期的出生数据,又基本决定了20-30年后的人口出生数据,所以——近期的不乐观,某种程度上就是远期的出生人口数据,将更加不乐观。
死亡人口数据,也同样不怎么乐观。
用我的方式来估算死亡人口,2018-2021年中国的死亡人口分别应该是700万、780万、870万和930万,但实际上,公布的年度死亡人口分别是993万、998万、996万和1014万。
如果统计局公布的死亡人口数据是真实的,那么,可以肯定中国人的预期寿命被严重高估;如果预期寿命并没有高估的话,那么,这个死亡数据就有点“提前”了。根据我的估算,到2023年中国的死亡人口数量才会超过1000万人。
更为诡异的是,根据“七普”报告,2020年中国的死亡人口仅为796.6万人,那统计局原来所公布的2020年998万死亡人口算怎么回事?
这可是差了200多万人呢!
你要是问,都是国家统计局自己公布的数据,为啥互相打架这么严重?
你别问,问了我也不知道。
我只是告诉你,不管是出生人口数据的互相打架,还是死亡人口数据与人均预期寿命不符,这些数据的打架越严重,越发说明我的人口预测数据高估。
简单说,假定“七普”数据准确且符合实际,根据我的乐观估算:
2025年,中国总人口约14.09亿;
2030年,中国总人口约13.78亿;
2040年,中国总人口约12.97亿;
2050年,中国总人口约11.60亿。