首页> 中文学位 >基于景点评论的京津冀旅游发展影响因素分析
【6h】

基于景点评论的京津冀旅游发展影响因素分析

代理获取

目录

声明

摘要

1 绪论

1.1研究背景及意义

1.1.1研究背景

1.1.2研究意义

1.2国内外研究现状

1.2.1国外研究现状

1.2.2国内研究现状

1.3研究方法

1.文献研究法

2.描述性统计方法

3.数据挖掘方法

1.4研究思路与创新点

1.4.1研究思路

1.4.2创新点

2 京津冀三地旅游业现状分析

2.1 京津冀国内旅游现状分析

2.2京津冀入境旅游现状分析

2.3京津冀旅游资源分析

3 数据采集

3.1 京津冀景点选取分析

3.2爬虫过程及注意事项

3.3景点评论数据来源

3.4景点评论数据描述性分析

4数据预处理

4.1 分词

4.2添加自定义词典

4.3过滤停用词

4.4提取关键词

4.5高频词统计

5 基于评论的京津冀旅游发展的优劣势分析

5.1 北京5A级景点的优劣势分析

5.1.1北京5A级景点的优势分析

5.1.2北京5A级景点的劣势分析

5.2天津5A级景点的优劣势分析

5.2.1天津5A级景点的优势分析

5.2.2天津5A级景点的劣势分析

5.3河北4A级及以上景点的优劣势分析

5.3.1河北4A级及以上景点的优势分析

5.3.2河北4A级及以上景点的劣势分析

6基于低分评论的河北旅游发展影响因素分析

6.1 河北景点聚类分析

6.1.1景点文本数据合并过程

6.1.2文本TF-IDF计算及其意义

6.1.3文本数据化表示模型

6.1.4基于文本相似度的景点聚类分析

6.2不同类别景点存在的突出问题

6.2.1第一类旅游景点发展影响因素分析

6.2.2第二类旅游景点发展影响因素分析

6.2.3第三类旅游景点发展影响因素分析

6.2.4第四类旅游景点发展影响因素分析

6.2.5第五类旅游景点发展影响因素分析

7结论与建议

7.1 结论

7.1.1 针对京津冀三地旅游业现状分析结论

7.1.2针对数据采集过程中的结论

7.1.3基于景点评论京津冀旅游发展优劣势分析结论

7.1.4不同类别景点存在的突出问题结论

7.2建议

7.2.1抓住机遇,打破地域界限,做到资源共享

7.2.2共同问题共同治理,不同问题相互借鉴

7.2.3河北旅游业自身需不断完善

参考文献

后记

攻读学位期间取得的科研成果清单

展开▼

摘要

随着“京津冀协同发展战略”的提出,各种京津冀旅游协同发展战略文件的相继出台,京津冀旅游产业协同发展已成为三地旅游业发展的必要趋势,与此同时互联网的迅速发展,促使了网络信息的大爆发,看似杂乱无章的数据却隐藏着巨量的信息,如何从这些海量的数据中提取精炼出对于我们而言有用的数据,则主要依靠于文本挖掘技术的发展。本文则研究如何将互联网信息及文本挖掘技术与京津冀旅游协同发展相结合,以重点讨论京津冀旅游发展的影响因素,并提出合理化建议。 本文以各旅游网站上关于京津两市的5A级景点及河北4A及5A级旅游景点的真实评论为数据源,爬取基于游客生成的网络文本分析京津冀三地旅游发展的影响因素。首先分析京津冀三地旅游现状,其次依据所获取的网络文本,通过文本挖掘方法分析京津冀三地旅游优劣势,再次使用文本挖掘和聚类算法相结合的方式分析河北旅游发展影响因素,最后就如何解决上述分析问题给出合理化建议。 本文首先根据各地区各年度统计资料对京津冀三地的旅游业现状进行分析;其次利用python软件对各网站上的目标景点的评论进行采集,即python网络爬虫过程,主要爬取去哪网、美团网、大众点评网、携程网、百度旅游网这五个网站上关于京津冀三地共60个景点的评论文本共108167条数据,其中分别爬取了京津冀各景点的好评和差评数据,达到便于后续分析的目的,再次利用文本挖掘技术对各地区的好评文本和差评文本分别进行词频和词语间逻辑关系统计并用可视化工具词云图和语义网、知识图谱对统计结果进行可视化,以便于直观的分析出各地景点存在的优势与劣势;最后单独分析河北4A级以上共50个景点的差评文本,利用文本聚类的方法,将河北各景点中存在相同问题的景点归为一类,并根据不同类别景点间存在的不同问题给出合理化解决建议,做到有针对性的解决问题。 本文的重要落脚点在于通过统计数据和评论文本分析京津冀三地旅游业发展的优、劣势和河北旅游业发展中存在的主要问题,并得出如下结论:(1)北京旅游景点存在的优势主要是:服务业十分完善,景点在游客心中的认可程度较高,游客对其感知形象较好,景点的电子化程度较高,导游服务质量价高,景区管理水平较强。劣势则为:虽然景点的电子化程度较高,但其电子服务质量却有待提高,退票较为困难,现场购票效率较低,无论是人工还是电子讲解时间都较短,缆车安排不合理等。(2)天津旅游景点存在的优势主要是:景点具有地方特色,旅游交通便利,有景区直达专线线路。劣势则为:门票较贵,而且景区商业化严重,缆车方面的服务较差等。(3)河北旅游景点存在的优势主要是:旅游资源较为丰富,旅游景点样式多种多样,河北旅游资源中有较多适合小孩子游玩的地方。劣势则为:门票的价格较贵,景区开发不到位,基础设施建设较差,景区管理不到位,服务质量较低,景点的交通能力较差等。 通过对京津冀三地各景点的优劣势分析,本文则主要得出以下结论:(1)抓住机遇,打破地域界限,做到资源共享。(2)共同问题共同治理,不同问题相互借鉴。(3)河北旅游业自身需不断完善。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号