技术领域
本发明涉及计量经济学数据建模处理技术领域,具体涉及一种基于分布滞后模型的客运量预测方法。
背景技术
我国经济已经由高速增长阶段转向高质量发展阶段。就交通领域而言,应顺应该发展趋势,探讨如何精准的预测公路客运量,对推进交通运输高质量发展具有重要意义。随着城市活跃度的不断提升,我国机动车保有量与日俱增,随之而来就会产生基础设施需求与供给不平衡问题。而公路客运量是道路交通系统的基础数据,对其进行科学准确地预测并有效合理的利用,不仅有利于公路基础设施的规划投资,还能够提升交通运行效率解决交通拥堵问题,同时符合“交通强国”的发展理念。
公路客运量是公路运输产量的直接反映成果,不仅会受到系统内部因素的影响,也会受外部因素的约束。传统的客运量预测方法可以分为定性,定量和组合分析方法。定性的客运量预测方法包括德尔菲方法,专家会议,集体讨论和个人判断等。定量的客运量预测方法利用预测理论和数学方法对原始数据进行分类,处理和模拟,然后将其进一步用于构建预测客运量所需的数学模型。目前公路客运量的预测趋势为采用机器学习方法构建预测模型,但是我们只能收集几年的客运量数据,使用机器学习方法来预测乘客量显然是不合适的。
传统的客运量预测方法没有考虑政策对交通系统产业投资发展的影响。在这一政策下,我们将重点放在中国陕西省与其他地区/国家之间的经济和社会交流,相关产业将带来不同的和新的需求,交通系统将受到其他产业的影响。因此,利用陕西省收集的数据和经济、贸易和行业数据,针对研究诱增交通量的影响因素进行案例研究,结合投入-产出表和交通分布滞后模型,提出了客运量预测模型,以便为今后的基础设施规划和建设提供准确的建议。
发明内容
针对现有技术中的上述不足,本发明提供了一种基于分布滞后模型的客运量预测方法。
为了达到上述发明目的,本发明采用的技术方案为:
一种基于分布滞后模型的客运量预测方法,包括如下步骤:
S1、获取各行业多年份的GDP数据,并利用当前年份的GPD数据和投入- 产出模型计算当前年份总产值以及交通消耗量;
S2、计算客运量与经过步骤S1得到的当前年份的GDP数据、总产值数据以及交通消耗量数据之间的相关系数;
S3、选择步骤S2中计算的相关系数最大的数据建立其与客运量的分布滞后模型;
S4、对步骤S3建立的分布滞后模型进行优化,得到具有最优滞后期的分布滞后模型。
上述方案的有益效果是,解决了总产值没有考虑运输行业与其他行业之间的直接和间接依赖关系,引入了交通运输消耗的概念,并分析了GDP、总产值、交通消耗和客运量之间的关系,能够较为准确的完成公路客运影响因素和客运量之间的非线性拟合关系,提升客运量预测的准确性。
进一步的,所述步骤S1中的,总产值和交通消耗量的获取如下所示:
所述步骤S1中的当前年份总产值以及交通消耗量的获取方法为:
S11、基于各行业多年份的GDP数据并根据投入-产出模型计算总产值,计算公式如下:
X=(1-A
其中,X为总产值,N为各行业多个年份的GDP数据,A
S12、基于总产值计算交通运消耗量,计算公式如下:
Q=∑b
其中,b
上述方案的有益效果是,计算方法能够清晰地反映出各产业部门之间的投入与消耗状态,能够得到较为准确的影响公路客运量的自变量。
进一步的,所述步骤S2具体为:
S21、根据Perason相关系数法分别计算上述各行业多个年份的GDP数据、总产值和交通消耗量数据三种自变量与客运量的关系,并计算三种自变量对应的相关系数r;
S22、选择与客运量相关性最大(即对应的相关系数r最大)的自变量输出。
上述进一步方案的有益效果是,Person相关系数法充分验证了客运量与交通消耗二者之间相关性较强,进而为构建客运量-交通运输消耗量预测模型找到最佳的影响公路客运量的特征因素奠定基础。
进一步的,所述步骤S21中计算三种自变量对应的相关系数r的方式为:
其中,X
上述进一步方案的有益效果是,Perason相关系数充分考虑了两个特征之间的相关性,并消除两个变量量纲影响,从而找到最佳的影响公路客运量的特征因素。
进一步的,所述步骤S3中,构建客运流量分布滞后模型的方法为:
S31、输入客运量和步骤S22计算的相关性最大的自变量,构建客运流量的基础模型,所述基础模型表示为:
其中,y
S32、计算滞后
S33、添加所述基础模型的滞后项,并依次对模型进行最小二乘估计,基于拟合优度系数和判定准则确定基础模型的最优滞后期。
上述方案的有益效果是,模型的构建选取数据,考虑当年及之前年份的自变量的影响,构造了滞后期以及多项式次数均为3的分布滞后模型,使得模型具有较高的适应性和预测精读。
进一步的,所述步骤S32具体为:
S321、在滞后期k的取值范围内,对构建的基础模型添加滞后项;
S322、根据Perason相关系数法计算添加滞后项后的相关系数;
S323、判定步骤S321的计算结果与系数阈值的关系,若大于,则对应的滞后项为最大滞后项,若小于,则返回步骤S321继续添加。
上述进一步方案的有益效果是,确定分布滞后模型的最大滞后期的过程可以分析模型的拟合是否会随着滞后气的减小而不断恶化,进而为最优滞后期的确定奠定基础。
进一步的,所述步骤S322中的相关系数计算过程为:
其中,k为滞后期数索引,
上述进一步方案的有益效果是,该相关系数计算公式可以消除自变量和因变量的量纲影响,进而衡量两个变量的相关程度,是合理判断序列X和Y是否具有滞后相关性的前提。
进一步的,所述步骤S33具体为:
S331、依次对所述步骤S321中添加滞后项后的基础模型进行最小二乘估计;
S332、计算调整后的拟合优度系数
S333、当拟合优度系数
上述进一步方案的有益效果是,本发明考虑精度因素,运用AIC准则和BIC 准则的可以有效弥补根据自相关图和偏自相关图定阶的主观性,在有限的阶数范围内寻找相对最优拟合模型,即其确定分布滞后期的方法具有较高精度高。
进一步的,所述拟合优度系数R
其中,残差平方和
上述进一步方案的有益效果是,通过计算拟合优度值,衡量因变量和自变量之间的总体关系,能够初步判定模型结果的拟合程度。
调整后的拟合优度系数
上述进一步方案的有益效果是,
附图说明
图1为本发明基于分布滞后模型的客运量预测方法流程示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
下面结合附图与具体实施方式对本发明作进一步描述:
本发明提供基于投入-产出与分布滞后模型的公路客运量预测方法,利用计量经济学理论的投入-产出模型计算出影响客运量的自变量(GDP、总产值和交通消耗量),运用Perason相关系数法分别将三种自变量与客运量进行相关性分析,选取相关性较高的自变量(交通消耗量)与客运量共同构建客运量基础模型,通过确定模型的最优滞后期,模型性能优化估计,并进行检验最终得到具有较高适应性预测精读的分布滞后模型。
一种基于分布滞后模型的客运量预测方法,如图1所示,包括:
S1、获取各行业多年份的GDP数据,并利用当前年份的GPD数据和投入- 产出模型计算当前年份总产值以及交通消耗量;
具体而言,在本实施例里,步骤S1具体包括:
S11、基于各行业多年份的GDP数据并根据投入-产出模型计算总产值,计算公式如下:
X=(1-A
其中,X为总产值,N为各行业多个年份的GDP数据,Ac为直接消耗系数的对角矩阵;
S12、基于总产值计算交通运消耗量,计算公式如下:
Q=∑b
其中,b
S2、计算客运量与经过步骤S1得到的当前年份的GDP数据、总产值数据以及交通消耗量数据之间的相关系数;
在本实施例里,步骤S2具体包括:
S21、根据Perason相关系数法分别计算上述各行业多个年份的GDP数据、总产值和交通消耗量数据三种自变量与客运量的关系,并计算三种自变量对应的相关系数r;
在本实施例里,相关系数r的计算公式为:
其中,X
在实际计算过程中,样本X
S23、选择与客运量相关性最大的自变量输出。
本实施例考虑实际情况,以其中一种具体案例分析:
本实施例运用各种拟合函数(线性、对数、倒数、二次函数、三次函数、S 型函数等)构建客运量-交通运输消耗量预测模型,考虑到拟合精读精度要求,最终确定构建分布式滞后模型拟合客运量与运输消耗量之间的关系,如下表所示:
表1
S3、选择步骤S2中计算的相关系数最大的数据建立其与客运量的分布滞后模型;
在本实施例里,步骤S3具体包括如下步骤:
S31、输入客运量和步骤S23计算的相关性最大的自变量,构建客运流量的基础模型,所述基础模型表示为:
其中,y
本实施例中考虑实际情况,解释变量之间存在多重共线性,不能用OLS估计,因此β
S32、计算滞后
S321、将基于滞后
S322、根据Perason相关系数法计算添加滞后项后的相关系数;
计算过程为:
其中,k为滞后期数索引,
S323、判定步骤S322的计算结果与系数阈值的关系,若大于,则对应的滞后项为最大滞后项,若小于,则返回步骤S321继续添加。
在本实施例里,考虑实际情况k的最大取值为
S33、基于拟合优度系数和判定准则添加所述基础模型的滞后项,并依次对模型进行最小二乘估计,计算基础模型的最优滞后期;
本实施例中,拟合优度系数
其中,R
其中,
本发明通过输入客运量和客运消耗量数据,构建客运流量的基础模型;基于拟合优度系数和判定准则添加所述基础模型的滞后项,并依次对模型进行最小二乘估计,计算基础模型的最优滞后期;进而对模型进行检验,确定最终的分布滞后模型。模型构建步骤如下所示:
本实施例精度因素,运用AIC准则和BIC准则的可以有效弥补根据自相关图和偏自相关图定阶的主观性,在有限的阶数范围内寻找相对最优拟合模型,即其确定分布滞后期的方法具有较高精度高。最终构建的分布滞后模型表示为:
y=65527.42-0.00163*x
其中,少为客运量分布滞后模型,x
以上所述可得本方法通过将投入-产出与分布滞后模型运用在公路交通量预测中,具有加高的拟合度,因而其预测可行性高,有实际的工程应用价值。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
机译: 一种基于案例推理的技术预测方法,特别是水泥窑法中的传感器预测方法和装置
机译: 用于预测药物代谢的多核苷酸,包括NR1I2基因的单核苷酸多态性,一种试剂盒和一种基于其的药物代谢预测方法
机译: 一种基于人工生命的关键绩效指标预测方法及装置