首页> 中文学位 >基于XGBoost算法的武汉市二手房价格预测模型的实证研究
【6h】

基于XGBoost算法的武汉市二手房价格预测模型的实证研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 研究的目的及意义

1.3 国内外研究现状

1.3.1 国内研究现状

1.3.2 国外研究现状

1.4 主要研究内容及方法

1.4.1 研究内容

1.4.2 研究方法

第二章 相关理论基础

2.1 特征价格理论

2.2 网络爬虫

2.2.1 基本原理

2.2.2 工作流程

2.2.3 功能实现

2.3 地图API服务

2.4 XGBoost理论

2.4.1 Boosting Tree提升树算法推导

2.4.2 分割搜寻算法

第三章 数据描述性分析及预处理

3.1 数据来源

3.1.1 基础数据

3.1.2 周边配套数据

3.1.3 地段等级数据

3.2 描述性分析

3.2.1 分类变量描述

3.2.2 数量特征描述

3.2.3 相关性分析

3.2.4 样本点的热力图

3.3 数据预处理

3.3.1 缺失值处理

3.3.2 异常值处理

3.3.3 归一化

3.3.4 对数及标准化处理

第四章 基于XGBoost的二手房价格预测模型的实证分析

4.1 模型效果的评价标准

4.2 模型的参数及优化

4.2.1 XGBoost的参数

4.2.2 参数的调优

4.3 与LASSO模型预测结果比较

5.1 本文主要结论

5.2 本文存在的不足以及进一步的工作

致谢

参考文献

展开▼

摘要

随着大数据和互联网技术的高速发展,房地产行业的数据越来越多,如何从复杂多样的特征中得到房价的预测模型是非常重要的。
  本文研究的主要问题是在大量的二手房相关的数据中找出重要的特征指标,对二手房房价建立预测模型。首先根据相关的房价理论,得出影响房价的三类特征,包括区位、建筑结构和邻里环境因素,通过网络爬虫有针对性的获取相对应的特征数据。结合国内外的相关的房价预测模型,选择出了XGBoost算法。XGBoost算法拥有非常优秀的分类以及回归效果,算法的训练性能也很高,由于底层的原理基于梯度提升树,从而能更好的适应不平衡的数据集,同时也更不容易过拟合,泛化能力较好,在很多非线性的回归问题上也有良好的表现,适用范围很广泛。本文通过网格搜索进行模型的参数优化,最后建立好的模型与LASSO进行了比较,表现出了比较明显的预测优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号