首页> 中国专利> 养老保险基金收支数据精准预测方法、装置、介质及设备

养老保险基金收支数据精准预测方法、装置、介质及设备

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明涉及数据预测技术领域，特别涉及一种养老保险基金收支数据精准预测方法、装置、介质及设备，其中，一种养老保险基金收支数据精准预测方法，包括结合Leslie模型预测人口数据与GM(1,1)灰色模型预测性别比例，以获取在职参保人口数据和退休参保人口数据；基于所述在职参保人口数据、社平工资数据与养老保险缴费比率数据预测基金收入数据；基于ARIMA时间序列模型预测基金增益数据；基于所述退休参保人口数据、社平工资数据与养老保险替代率预测基金支出数据；与现有技术相比，本发明提供的一种养老保险基金收支数据精准预测方法，有效地对养老保险基金收支数据未来趋势进行预测，从而提高了养老保险基金收支数据预测精度。

著录项

公开/公告号CN113837887A

专利类型发明专利
公开/公告日2021-12-24

原文格式PDF
申请/专利权人易联众智鼎(厦门)科技有限公司;
展开▼

申请/专利号CN202111106437.X
发明设计人庄国强;陈坤龙;詹进林;丁政然;
展开▼

申请日2021-09-22
分类号G06Q40/08(20120101);G06Q40/04(20120101);G06Q30/02(20120101);
代理机构35234 厦门加减专利代理事务所(普通合伙);
代理人李强;杨泽奇
地址 361008 福建省厦门市软件园二期观日路18号604室
入库时间 2023-06-19 13:49:36

说明书

技术领域

本发明涉及数据预测技术领域，特别涉及一种养老保险基金收支数据精准预测方法、装置、介质及设备。

背景技术

社会保险精算作为风险管理的重要手段，在各国社会保险制度的建设和发展中发挥着极其重要的作用，成为社会保险长期可持续发展的根本保证。

但伴随我国人口老龄化程度的不断加剧，城镇职工养老保险运营危机逐渐凸显，养老保险基金缺口逐年扩大。现有养老保险基金收支数据的预测中会导致养老金收入的预测的准确性以及有效性较差。虽然中国专利申请(公开号为CN107103547A)公开了养老金统筹基金支出预测方法及装置，对不同类型的养老保险领取人员采用不同的养老金统筹基金支出预测，从而使得养老金统筹基金支出预测更加准确以及更加方便。

但现有技术对养老保险基金收支数据预测中人口数据的计算，通常采用人口生命表方法来预测参保人口数据和退休参保人口数据，但是该方法的计算结果偏差较大，基于误差传播定律，对于基金收入和支出数据的预测结果将产生一定偏差，仍会导致养老保险基金收入数据预测的准确性以及有效性较差。

发明内容

为解决上述现有技术中人口数据计算结构偏差较大的不足，本发明提供的一种养老保险基金收支数据精准预测方法、装置、介质及设备，能够有效地对养老保险基金收支数据未来趋势进行预测，提高了养老保险基金收支数据预测精度。

本发明提供的一种养老保险基金收支数据精准预测方法，包括

结合Leslie模型预测人口数据与GM(1,1)灰色模型预测性别比例，以获取在职参保人口数据和退休参保人口数据；

基于所述在职参保人口数据、社平工资数据与养老保险缴费比率数据预测基金收入数据；

基于ARIMA时间序列模型预测基金增益数据；

基于所述退休参保人口数据、社平工资数据与养老保险替代率预测基金支出数据。

在上述方案的基础上，进一步地，基于Leslie模型预测女性人口数据包括以下步骤：

划分m个年龄组，其中m为大于1的自然数；

测算每个所述年龄组的生育率；

测算每个所述年龄组的存活率；

根据各年龄组的生育率和存活率建立Leslie矩阵；

根据所述Leslie矩阵预测女性人口数据。

在上述方案的基础上，进一步地，根据女性人口数据预测结果，采用GM(1,1)灰色模型进行时间序列预测性别比例包括

设置时序性别比数据，并求数据级比；

根据所述数据级比构造原始序列的一次累加序列；

通过所述原始序列的一次累加序列构造微分方程矩阵；

反解所述原始序列预测性别比例。

在上述方案的基础上，进一步地，基于所述预测女性人口数据，结合GM(1,1)灰色模型预测性别比例，计算男性人口数据及总人口数据；

设置男性退休年龄Y，和女性退休年龄X，基于男性人口数据和女性人口数据，分别统计当期男女劳动人口数据和男女退休人口数据，以获取所述在职参保人口数据和所述退休参保人口数据。

在上述方案的基础上，进一步地，所述在职参保人口数据为在职参保人数＝Leslie人口模型[适龄劳动人口]*性别比*参保覆盖率A；

所述退休参保人口数据为退休参保人数＝Leslie人口模型[适龄退休人口]*性别比*参保覆盖率B。

在上述方案的基础上，进一步地，根据ARIMA时间序列模型预测社平工资数据或GDP数据，包括以下步骤，

对时间序列数据进行ADF检验；

根据MSE准则、AIC准则或BIC准则中的一种对ARIMA模型中参数定阶，以拟合预测模型；

采用迭代训练与滚动预测的形式处理所述时间序列数据，以将预测值添加回训练数据重新拟合预测模型。

在上述方案的基础上，进一步地，基于社平工资增长率时间序列历史数据，采用ARIMA模型进行预测相应时间期别的社平工资增长率，结合初始社平工资数据预测目标时间期的社平工资数据；

基于GDP时间序列历史数据，采用ARIMA模型进行预测相应时间期别的GDP增长率，结合初始GDP数据预测目标时间期的GDP数据。

本发明还提供一种养老保险基金收支数据精准预测装置，包括

获取模块，用于结合GM(1,1)灰色模型预测性别比例，基于Leslie模型预测人口数据，以获取在职参保人口数据和退休参保人口数据；

预测模块，用于基于所述在职参保人口数据、社平工资数据与养老保险缴费比率数据预测基金收入数据；基于ARIMA时间序列模型预测基金增益数据；基于所述退休参保人口数据、社平工资数据与养老保险替代率预测基金支出数据。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机被处理器执行时实现如上任一项所述的养老保险基金收支数据精准预测方法。

本发明还提供一种电子设备，包括至少一个处理器、及与所述处理器通信连接的存储器，其中所述存储器存储可被至少一个处理器执行的指令，所述指令被至少一个处理器执行，以使所述处理器执行如上任一项所述的养老保险基金收支数据精准预测方法。

与现有技术相比，本发明提供的一种养老保险基金收支数据精准预测方法、装置、介质及设备，通过通过GM(1,1)进行人口性别比预测，创建Leslie人口模型进行人口数据预测，以分别获取在职参保人口数据和退休参保人口数据，同时，采用ARIMA模型对人口数据、基金收入数据、基金支出数据和基金增益数据四个部分中关键节点的预测，完成改进地系统动力学仿真模型构建，有效地对养老保险基金收支数据未来趋势进行预测，从而提高了养老保险基金收支数据预测精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的养老保险基金收支数据精准预测方法的流程图；

图2为本发明提供的养老保险基金收支数据的架构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，下面所描述的本发明不同实施方式中所设计的技术特征只要彼此之间未构成冲突就可以相互结合。

伴随我国人口老龄化程度的不断加剧，城镇职工养老保险运营危机逐渐凸显，养老保险基金缺口逐年扩大。对于养老保险基金收支数据预测的数学建模与仿真分析方法中，通常采用系统动力学仿真建模进行分析，其中，采用人口声明表方法来预测参保人口数据和退休参保人口数据，该方法的计算结果偏差较大，基于误差传播定律，对于基金收入和支出数据的预测结果将产生一定的偏差；

同时，系统动力学方法根据系统内部组成要素互为因果的反馈特点，从系统的内部结构来寻找问题发生的根源，对于数据内部的时间序列关系及数据间的因果关系有强依赖，而现有的采用回归分析预测各子节点的结果进而构建结构方程，其并未充分挖掘数据特征，部分节点预测不精确将使误差逐渐累积，产生连锁反应导致最终基金收支数据预测不精确、不准确。

为解决人口数据测算不精确的问题，本发明基于大数据技术，将多源数据组合进行分析，提出了一种基于改进的系统动力学模型的养老保险基金收支数据精准预测方法；如图1、图2所示，本发明提供的一种养老保险基金收支数据精准预测方法，包括如下步骤：

步骤1，结合Leslie模型预测人口数据与GM(1,1)灰色模型预测性别比例，以获取在职参保人口数据和退休参保人口数据；

步骤2，基于所述在职参保人口数据、社平工资数据与养老保险缴费比率数据预测基金收入数据；基于ARIMA时间序列模型预测基金增益数据；基于所述退休参保人口数据、社平工资数据与养老保险替代率预测基金支出数据。

具体实施时，在对养老保险基金收支数据预测时，将养老保险基金收支数据划分为人口数据、基金收入数据、基金支出数据和基金增益数据四个部分，上述人口数据、基金收入数据、基金支出数据和基金增益数据间相互耦合，基于系统动力学模型，根据结合Leslie模型预测人口数据与GM(1,1)灰色模型和ARIMA时间序列模型分别进行预测，对各部分中的节点分别建立结构方程，完成系统动力学仿真模型构建，从而提高养老保险基金收支数据预测精度。

其中，人口数据包括在职参保人口数据和退休参保人口数据的预测，在预测时，通过结合GM(1,1)灰色模型的Leslie人口模型来预测系统动力学基础节点人口，进行全年龄端人口数据的预测，再分别预测在职参保人口数据和退休参保人口数据，从而充分融合多源数据，通过组合时间序列模型预测结果来构建系统动力学模型，提升养老保险基金收支数据预测精度。

具体地，Leslie模型是一种以年龄和性别为基础的离散矩阵模型，模型构建原理为：将测算区域内初始时刻的女性分年龄组的人口数据作为初始人口向量，基于各年龄组生育率、死亡率(存活率)构造Leslie矩阵，然后将Leslie矩阵左乘上期人口列向量，得到新的列向量即为预测的女性分年龄组人口数据，以此计算过程不断迭代至预测目标时刻，最后，基于女性人口数据预测结果，采用GM(1，1)灰色模型进行时间序列人口性别比预测，通过男女性别比例推算男性人口数和总人口规模。

基于Leslie模型预测女性人口数据包括以下步骤，

首先，划分m个年龄组；

将年龄以步长1为间隔，划分各年龄组女性人口数据，一共划分出m个年龄组，其中m为大于1的自然数；则任意时刻t任意年龄组i的人口数为n

n(t)＝[n

设置初始测算年份为0，相应的人口数据为

n(0)＝[n

接着，测算每个年龄组的生育率；

2016年1月1日起正式实施全面二孩政策，考虑到历史数据的可获取性和有效性，选取中国统计年鉴2016年(测算内容为2015年)卷2-17的全国各年龄女性生育率作为基础数据，该年的总和生育率为1.047，考虑二孩政策全面实施后预期提升我国总和生育率，达到维持人口自然迭代平衡状态(总和生育率为2.1)，将模型各年龄组女性生育率转换为平衡生育率，即统计年鉴中各年龄组生育率×2.1/1.047。将最终各年龄组的生育率表示为B＝(b

接着，测算每个年龄组的存活率；

对于待预测年份t当年每个年龄组i女性人口的存活率s

由此，得出各年龄组预测年份的存活率为s

然后，根据各年龄组的生育率和存活率构建建立Leslie矩阵；

对于任意人口测算年份j，设置时间序列形式j＝1：t，其中初始年份为0，人口预测目标年份为t，

Leslie人口矩阵由预测年份各年龄段女性人口的生育率和存活率构成，对于任一测算年份j，构建相对应的Leslie人口矩阵

最后，根据所述Leslie矩阵预测女性人口数据；

基于Leslie人口模型预测，则第t年的女性人口数据为

根据女性人口数据预测结果，采用GM(1，1)灰色模型进行时间序列人口性别比预测，具体地，设置时序性别比数据，共有N期时序性别比数据

首先，序列级比检验，

对于时序性别比数据，求数据级比

保证数据满足

接着，建立GM(1，1)灰色模型，

具体地，先构建原始序列的一次累加序列，

基于

最后反解原始序列的拟合值预测性别比例，

通过时间响应方程可以计算x

对于Leslie人口模型预测所得第t年女性人口分布为n(t)＝[n

本实施例中，令男性退休年龄为Y，女性退休年龄为X，基于男女性人口数据分布状况，可分别统计当期男女劳动人口数据、当期男女退休人口数据，得到当期劳动人口总数P，当期退休人口总数RP；

在职参保人口数据预测，基于全年龄组人口数据的预测结果，截取适龄劳动人口获得全体劳动人口数据，采用政策参数参保覆盖率A测算在职参保人口数据，在职参保人口数据为在职参保人数＝Leslie人口模型[适龄劳动人口]*性别比*参保覆盖率A；退休参保人口数据预测，基于全年龄组人口数据的预测结果，截取适龄退休人口获得全体退休人口数量，采用政策参数参保覆盖率B测算退休人口中参加养老保险的人数，退休参保人口数据为退休参保人数＝Leslie人口模型[适龄退休人口]*性别比*参保覆盖率B。

通过结合GM(1,1)灰色模型的Leslie人口模型来预测系统动力学基础节点人口，充分融合多源数据，通过组合时间序列模型预测结果来构建系统动力学模型，提升养老保险基金收支预测精度。

基金收入数据预测，基于在职参保人口数据、社平工资与养老保险缴费率测算，其中社平工资数据预测，根据社平工资增长率时间序列历史数据，采用ARIMA模型进行预测相应时间期别等社平工资增长率，结合初始社平社平工资数据预测目标时间期的社平工资数据；

养老保险缴费率为政策参数，当期基金收入数据为当期征缴收入＝在职参保人数*社平工资*缴费率；

基金支出数据预测，基于退休参保人口数据、社平工资数据与养老保险替代率测算，其中社平工资数据预测，根据社平工资增长率时间序列历史数据，采用ARIMA模型进行预测相应时间期别等社平工资增长率，结合初始社平社平工资数据预测目标时间期的社平工资数据；

替代率为政策参数，当期基金支出数据为当期基金支出＝退休参保人数*社平工资*养老金替代率；

基金增益数据包括国家财政补贴数据和基金投资增益数据两部分，基金投资增益数据包括银行年化利率和国债投资增益两部分，其中国家财政补贴数据测算时，基于GDP时间序列历史数据，采用ARIMA模型进行预测相应时间期别的GDP增长率，结合初始GDP数据预测目标时间期的GDP数据；GDP-ARIMA为基于ARIMA时间序列模型和GDP时序数据获取所得的目标期别GDP，财政支出占GDP比重和财政补贴占财政支出比例均为政策参数，国家财政补贴数据为财政补贴＝GDP*财政支出占GDP比重*财政补贴占财政支出比重；

投资影响因子结构方程中的变量均为政策参数，投资影响因子为投资影响因子＝银行年化利率*基金稳健投资比例+国债利率*基金国债投资比例；基金滚存结余由上期基金滚存结余、当期结余、财政补贴和基金增益构成，基金滚存结余为当期基金滚存结余＝上期基金滚存结余*(1+投资影响因子)+当期基金结余+当期财政补贴；

对于上述系统动力学模型中的社平工资增长率与GDP等经济因素相关节点，从工程实现角度对ARIMA时间序列模型，拟合及预测过程构建管道化处理，自动进行模型参数寻优、模型拟合及预测，具体地，

首先进行ADF检验，对经过预处理后的时间序列数据进行ADF检验，当单位检测统计量p-value值大于0.05时达统计显著，定阶ARIMA模型差分参数d；接着，进行AR和MA模型参数定阶，设置算法参数配置信息，根据MSE、AIC准则、BIC准则择优对ARIMA模型其它参数估计及定阶，拟合预测模型；

然后进行迭代训练与滚动预测，为避免ARIMA模型欠拟合，预测模型精度不足的情况，采用迭代训练与滚动预测的形式处理时间序列数据，将ARIMA模型的预测步长设置为1，算法每轮迭代训练预测出t+1时刻的结果后将把预测值添加回训练数据重新拟合模型，预测t+2时刻的结果；该种处理方式能减小ARIMA模型因为数据时间期别过短、预测步长过长导致的模型欠拟合误差。

本发明还提供一种养老保险基金收支数据精准预测装置，包括获取模块和预测模块，上述获取模块和预测模块可以实现上述实施例中所述的养老保险基金收支数据预测方法。

具体实施时，获取模块用于结合GM(1,1)灰色模型预测性别比例，基于Leslie模型预测人口数据，以获取在职参保人口数据和退休参保人口数据；预测模块用于基于所述在职参保人口数据、社平工资数据与养老保险缴费比率数据预测基金收入数据；基于ARIMA时间序列模型预测基金增益数据；基于所述退休参保人口数据、社平工资数据与养老保险替代率预测基金支出数据。

具体实施时，计算机可读存储介质为磁碟、光盘、只读存储记忆体(Read-OnlyMemory，ROM)、随机存储记忆体(Random Access Memory，RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；计算机可读存储介质还可以包括上述种类的存储器的组合。

本发明还提供一种电子设备，该电子设备包括至少一个处理器、及与所述处理器通信连接的存储器，其中所述存储器存储可被至少一个处理器执行的指令，所述指令被至少一个处理器执行，以使所述处理器执行如上任一项所述的养老保险基金收支数据精准预测方法。

具体实施时，处理器的数量可以是一个或多个，处理器可以为中央处理器，(Central Processing Unit，CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器与处理器可以通过总线或其他方式通信连接，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使处理器执行如上实施例中任一项所述的养老保险基金收支数据预测方法。

为进一步说明本发明提供的养老保险基金收支数据预测方法对基金收支数据预测精确和准确，本实施例中，以2017年-2019年时间段的数据进行预测并与现有技术中采用的养老保险基金收支数据预测方法以及实际养老保险基金收支数据进行对比。

具体地，本实施例中，设置100个年龄组，采用上述实施例提供的方法预测女性人口数据，再分别计算2017年-2019年时间段女性和男性人口数据，以男性16-59岁和女性16-49岁作为在职参保人数，男性大于59岁和女性大于49岁作为退休参保人数，设置参保覆盖率A为35％，参保覆盖率B为33％，计算在职参保人数和退休参保人数；

基金收入测算，构建ARIMA时间序列模型，以2015年的社平工资为起算点，预测2016年-2018年的社平工资，基于社平工资、参保职工任何，缴费率设置为20％，计算2017年-2019年基金收入，

基金支出测算，将养老金替代率设置为60％，结合退休人口数，计算2017年-2019年基金支出，将当期基金收入-当期基金支出，即可得到2017年-2019年当期基金结余，

财政补贴测算，基于历史GDP预测2017年-2019年GDP变化情况，将财政支出GDP比例P1和财政补贴占财政支出比例P2分别设置为24％和2.4％，计算出2017年-2019年的财政补贴值，

投资影响因子测试，将银行利率设置为2.25％。国债利率设置为4％，基金稳健投资比例和国债投资比例分别设置为70％和30％。计算投资影响因子，

基金滚存结余测算，从公开历史统计数据中获取2016年城镇职工养老保险基金收支和结余相关数据，基于各模块的测算值，预测2017年-2019年结余情况，得到以下预测结果，如表1所示，

表1

表2

表2为现有技术中采用Arima时间序列模型对养老保险基金收支数据进行预测，根据表1、表2可以得出，采用本发明提供的养老保险基金收支数据精准预测方法，相对现有技术中的预测方法，能够有效地对养老保险基金收支数据未来趋势进行预测，从而提高了养老保险基金收支数据预测精度。

与现有技术相比，本发明提供的一种养老保险基金收支数据精准预测方法、装置、介质及设备，通过通过GM(1,1)进行人口性别比预测，创建Leslie人口模型进行人口数据预测，以分别获取在职参保人口数据和退休参保人口数据，同时，采用ARIMA模型对人口数据、基金收入数据、基金支出数据和基金增益数据四个部分中关键节点的预测，完成系统动力学仿真模型构建，有效地对养老保险基金收支数据未来趋势进行预测，从而提高了养老保险基金收支数据预测精度。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 养老保险基金收支数据精准预测方法、装置、介质及设备 [P] . 中国专利： CN113837887A . 2021-12-24
2. 预产期精准预测方法、装置、计算机设备及存储介质 [P] . 中国专利： CN112992353A . 2021-06-18
3. Congestion travel time prediction database creation device, congestion travel time prediction database creation method, congestion travel time implementing its way prediction database creation program, and recording medium recording the program, congestion travel time prediction apparatus, congestion travel time prediction method, the congested travel time implemented method prediction program and a recording medium storing the program [P] . 日本专利： JP4495746B2 . 2010-07-07

机译：拥堵行驶时间预测数据库创建装置，拥堵行驶时间预测数据库创建方法，实现其路途预测数据库创建程序的拥堵行驶时间以及记录该程序的记录介质，拥堵行驶时间预测装置，拥堵行驶时间预测方法，拥堵行驶时间实现的方法预测程序和存储该程序的记录介质
4. DATA ANALYSIS DEVICE, DATA ANALYTIC SYSTEM, SALES FORECAST DEVICE, SALES FORECAST SYSTEM, DATA ANALYSIS METHOD, SALES FORECAST METHOD, PROGRAM, AND RECORDING MEDIUM [P] . 日本专利： JP2016048409A . 2016-04-07

机译：数据分析设备，数据分析系统，销售预测设备，销售预测系统，数据分析方法，销售预测方法，程序和记录介质
5. LEARNING DATA CREATION METHOD, LEARNING METHOD, RISK PREDICTION METHOD, LEARNING DATA CREATION DEVICE, LEARNING DEVICE, RISK PREDICTION DEVICE, AND RECORDING MEDIUM [P] . 美国专利： US2019303718A1 . 2019-10-03

机译：学习数据创建方法，学习方法，风险预测方法，学习数据创建设备，学习设备，风险预测设备和记录介质