首页> 中文学位 >基于混频流数据的CPI实时预测研究
【6h】

基于混频流数据的CPI实时预测研究

代理获取

目录

第1章 绪论

1.1 研究背景与意义

1.1.1研究背景

1.1.2研究意义

1.2 国内外硏究现状

1.2.1基于CPI预测的相关研究

1.2.2基于网络搜索数据的相关研究

1.3 研究内容与框架

1.4 本文的创新点

第2章 混频数据模型和流数据处理技术

2.1 MIDAS回归模型

2.1.1基础MIDAS回归模型

2.1.2 MIDAS回归模型的扩展

2.2 非线性MIDAS模型

2.3 流数据处理技术

2.4 本章小结

第3章 CPI搜索指数的构建

3.1 关键词的初选

3.2 信息爬取

3.3 数据预处理

3.3.1搜索热度指标的构建

3.3.2具有预测作用的关键词筛选

3.4 搜索指数的合成

3.5 本章小结

第4章 CPI实时预测实证分析

4.1 变量选择与数据采集

4.2 CPI预测模型的设定

4.2.1基准预测模型

4.2.2混频数据预测模型

4.3 模型预测与预测效果评价

4.3.1模型的样本内预测

4.3.2 模型的样本外预测

4.4 本章小结

第5章 结论和展望

5.1 结论

5.2 展望

参考文献

致谢

展开▼

摘要

十九大报告指出,以新发展理念引领现代化经济体系建设,而宏观经济监测与预测是经济体系建设和调控的核心内容,其中CPI作为反映通货膨胀水平的重要经济指标,其预测可以为政府宏观经济调控提供重要依据。随着大数据时代的到来,实时、交互、离散化、非结构化的海量数据蕴含着经济社会运行的各种先行指标信号,同时数据处理技术和处理能力也相应地得到极大提升,引入高频大数据进行CPI预测变得更加重要和可行。  本文在基于宏观低频数据进行CPI预测的研究基础上,引入适用于CPI预测的高频大数据——百度指数,并应用混频数据模型和具有流数据思维的方法对CPI进行预测,解决了以往因对影响因素厘清不够以及高频数据和低频数据的频率差异引起的预测滞后问题,进一步将CPI预测变量频率精确到日度,同时拓展了流数据类型的混频经济计量方法,实现了CPI的实时动态预测。  本文首先使用百度指数数据构造了搜索热度指标,将互联网的飞速发展而引发的关键词搜索量自然增长和海量网民搜索行为的变动导致的关键词搜索量变动剔除,仅将经济社会事件对关键词搜索量的影响保留下来发现部分关键词搜索热度与CPI存在较强的相关关系,进一步通过时差相关分析法选取具有预测作用的强相关先行指标,用搜索热度并且以时差相关分析的相关系数作为权重合成高低频搜索指数,然后用构造的搜索指数分别构造低频数据模型和混频数据模型对CPI进行预测,与基准模型进行比较。在预测的过程中分别进行了样本内预测和样本外预测,其中MIDAS模型的样本内预测进一步采用了h步向前的MIDAS模型对CPI进行了实时预测,而样本外预测进一步对搜索指数的稳健性和模型的稳定性进行了验证,分别采用了静态预测、动态预测以及迎合了流数据特称的滚动窗口预测,得出以下结论:  第一,在样本内预测中,混频模型的预测精度明显优于基准模型和低频模型,表明高频信息的充分无损使用改进了预测效果,避免了传统的低频数据模型由于人为加总降频处理造成的数据信息折损,从而在最大限度上使用了原始信息,在估计和预测上表现更为真实和可靠。  第二,使用h步向前预测的MIDAS(m,Kh)-AR(p)模型对CPI进行实时预测时可以领先官方数据29天。与低频模型相比,混频模型不仅在预测精度上具有优势,而且提高了预测的时效性,使预测结果随着新数据的到来得到更新,而相对于基准模型,混频数据模型的优势主要体现在充分使用高频信息至当月下旬时预测精度的显着提升。  第三,在动态外推预测中,混频数据模型在预测精度和趋势拟合上具有显着优势,可以领先官方数据34天,进一步提高了预测的时效性,具有很强的实用价值。外推动态预测不仅验证了搜索指数的稳健性,也进一步证实了混频数据模型在预测精度和时效性上的双重优势。  第四,用更适合流数据的滚动窗口技术对CPI进行滚动窗口预测,预测值对于2016年6月至2018年7月CPI变动趋势拟合效果较好,与静态预测的趋势也基本保持一致,说明模型的稳定性较好,且在整个样本区间内没有发生明显的概念漂移。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号