首页> 中文期刊> 《数据挖掘》 >基于网络搜索数据的北京市旅游需求预测

基于网络搜索数据的北京市旅游需求预测

         

摘要

我国旅游业经过40年的高速度发展,现在进入了高质量发展新阶段。同时,随着疫情防控进入常态化和旅游市场逐步回暖,“互联网 + 旅游”新业态发展迅猛,海量网络搜索数据潜在反映着人们的旅游需求。因此,本文利用网络搜索数据(Internet search data, IS)用于北京市旅游需求预测。首先,利用Python爬取在线旅游网站的游记攻略,使用NLPIR分词系统提取高频词汇,并结合旅游六要素确定初始关键词词库。其次,采用需求图谱、百度指数相关词热度推荐、北京旅游网推荐等7种方法拓展关键词,经过Adaptive Lasso等方法筛选得到9个最佳预测变量,并引入季节性虚拟变量,然后结合网络搜索关键词和随机森林算法、极限梯度提升算法及支持向量回归算法对北京市旅游需求进行建模和训练。最后,借助多个预测性能指标,确定支持向量回归模型为最优模型。研究结果表明:网络搜索数据与旅游需求显著相关,具有很强的时效性,并且支持向量回归模型能够很好地解决突发事件和小样本问题,用于短期旅游需求预测是高效可行的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号