声明
摘要
1 绪论
1.1研究背景及意义
1.1.1研究背景
1.1.2研究意义
1.2国内外研究现状
1.2.1国外研究现状
1.2.2国内研究现状
1.3研究方法
1.文献研究法
2.描述性统计方法
3.数据挖掘方法
1.4研究思路与创新点
1.4.1研究思路
1.4.2创新点
2 京津冀三地旅游业现状分析
2.1 京津冀国内旅游现状分析
2.2京津冀入境旅游现状分析
2.3京津冀旅游资源分析
3 数据采集
3.1 京津冀景点选取分析
3.2爬虫过程及注意事项
3.3景点评论数据来源
3.4景点评论数据描述性分析
4数据预处理
4.1 分词
4.2添加自定义词典
4.3过滤停用词
4.4提取关键词
4.5高频词统计
5 基于评论的京津冀旅游发展的优劣势分析
5.1 北京5A级景点的优劣势分析
5.1.1北京5A级景点的优势分析
5.1.2北京5A级景点的劣势分析
5.2天津5A级景点的优劣势分析
5.2.1天津5A级景点的优势分析
5.2.2天津5A级景点的劣势分析
5.3河北4A级及以上景点的优劣势分析
5.3.1河北4A级及以上景点的优势分析
5.3.2河北4A级及以上景点的劣势分析
6基于低分评论的河北旅游发展影响因素分析
6.1 河北景点聚类分析
6.1.1景点文本数据合并过程
6.1.2文本TF-IDF计算及其意义
6.1.3文本数据化表示模型
6.1.4基于文本相似度的景点聚类分析
6.2不同类别景点存在的突出问题
6.2.1第一类旅游景点发展影响因素分析
6.2.2第二类旅游景点发展影响因素分析
6.2.3第三类旅游景点发展影响因素分析
6.2.4第四类旅游景点发展影响因素分析
6.2.5第五类旅游景点发展影响因素分析
7结论与建议
7.1 结论
7.1.1 针对京津冀三地旅游业现状分析结论
7.1.2针对数据采集过程中的结论
7.1.3基于景点评论京津冀旅游发展优劣势分析结论
7.1.4不同类别景点存在的突出问题结论
7.2建议
7.2.1抓住机遇,打破地域界限,做到资源共享
7.2.2共同问题共同治理,不同问题相互借鉴
7.2.3河北旅游业自身需不断完善
参考文献
后记
攻读学位期间取得的科研成果清单
河北经贸大学;