首页> 中文学位 >基于网络搜索数据与随机森林模型的房地产价格指数预测研究
【6h】

基于网络搜索数据与随机森林模型的房地产价格指数预测研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景

1.2 研究目的及意义

1.2.1 研究目的

1.2.2 研究意义

1.3 论文内容结构与技术路线

1.3.1 内容结构

1.3.2 研究方法

1.3.3 技术路线

1.4 论文主要创新点

第2章 国内外研究现状与我国房地产市场的发展历程

2.1 网络搜索数据的应用现状

2.2.1 网络搜索数据在国外研究现状

2.1.2 网络搜索数据在国内的研究现状

2.2 房地产价格预测研究现状

2.3 随机森林模型的的应用现状

2.3.1 随机模型在特征选择方面的应用

2.3.2 随机森林在分类和回归方面的应用

2.4 我国房地产市场发展历程

2.5 本章小结

第3章 基于网络搜索数据与随机森林模型的房价指数预测相关理论研究

3.1 百度指数与房地产相关概念

3.1.1 百度指数概述

3.1.2 房地产相关概念

3.2 消费者行为理论与传导时滞理论

3.2.1 消费者行为理论

3.2.2 传导时滞理论

3.3 网络搜索数据与房地产价格的关联机理

3.4 随机森林模型

3.4.1 决策树

3.4.2 Bagging算法

3.4.3 随机森林算法及其理论基础

3.5 支持向量机模型

3.6 本章小结

第4章 以上海市房价指数为实证对象的关键词库的构建

4.1 网络搜索关键词的构建原则

4.2 上海市房价指数初始关键词的确定

4.3 上海市房价指数关键词的拓展

4.3.1 关键词的拓展目标

4.3.2 关键词的拓展方法

4.3.3 上海市房价指数预测问题的关键词拓展

4.4 上海市房价指数关键词的筛选

4.4.1 数据的获取及预处理

4.4.2 时差相关系数法筛选

4.4.3 RF-RFE算法筛选

4.5 本章小结

第5章 上海市房价指数预测随机森林模型的构建与评价

5.1 上海市房价指数预测随机森林模型的参数优选

5.1.1 上海市房价指数预测随机森林模型参数mtry优选

5.1.2 上海市房价指数预测随机森林模型参数ntree优选

5.2 上海市房价指数预测随机森林模型的构建

5.3 上海市房价指数预测随机森林模型性能评估

5.4 本章小结

第6章 结论与展望

6.1 研究结论及创新点

6.2 存在的不足及研究展望

致谢

参考文献

附录

攻读学位期间取得的研究成果

展开▼

摘要

随着搜索引擎技术的快速发展以及互联网的普及,人们获取信息的渠道有了很大的改变,越来越多的人们通过互联网搜索查询信息。由于信息搜索是由一定的目标、动机和需求所引发的信息搜寻行为。因此,互联网中记录的海量网络搜索数据成为人们的一个“行为意向数据库”,这些数据蕴含着人们的行为趋势及规律,能够反映出社会经济的变化状况,为宏观经济问题的研究提供了必要的微观数据基础。
  当前,房地产业已然成为我国国民经济的支柱性产业,它直接关系到人们的就业、收入、消费等多个方面,其健康发展与否也关系到国民经济的发展。在如今的生活中,房价是人们经常谈论的一个话题,它和人们的生活质量和幸福指数息息相关,更多的人们想要提前看到房价的走势,以便及时准确地做出购房决策,房价的波动牵动着无数老百姓的心。因此,对房价的相关研究具有极强的现实意义。及时准确地对房价走势进行预判对消费者、房地产开发商及国家政策制定部门都具有重要意义,并且当前我国的房地产价格指数也存在着发布时间长、时效性低等问题。基于此背景,本文利用可以体现人们未来一定时期内行为意向的网络搜索数据对房地产价格指数进行预测研究。
  首先,本文对网络搜索数据的应用、房地产价格的预测、随机森林模型的应用等相关文献进行了综述,并梳理了我国房地产市场的发展历程。接着以消费者行为理论和传导时滞理论为基础,搭建了网络搜索数据与房地产价格之间相关性的理论框架,并阐述了本文所用模型随机森林、支持向量机的原理等。
  其次,本文以上海市房价指数为研究对象,利用文本挖掘技术对网络上房价相关信息进行文本分词、关键词提取等,确定了网络搜索初始关键词库;接着运用需求图谱拓展、长尾关键词拓展等方法确定了拓展关键词库;然后创新性地利用时差相关性方法、RF-RFE算法对关键词进行了筛选,得到最终的关键词库,用于最后模型的建立。
  最后,本文结合重复交叉验证法对随机森林模型的两个重要参数进行优选,利用网络搜索数据建立了基于随机森林的房地产价格指数预测模型,并将随机森林模型的预测效果与支持向量机模型进行对比分析。实证结果表明,利用网络搜索数据对房价指数的预测至少比官方数据的发布提前一个月左右,具有更好的时效性,最终确定的关键词能够较好地反映出房价指数的变化趋势,并且随机森林模型的拟合及预测效果更优。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号