首页> 中文学位 >多阶段混合属性的景点实体解析研究
【6h】

多阶段混合属性的景点实体解析研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题研究的背景及意义

1.2 本文研究内容

1.3 论文组织结构

第2章 实体解析研究现状

2.1 领域无关的实体解析

2.2 基于领域的实体解析

2.3 本章小结

第3章 景点数据分析与加工

3.1 景点数据分析

3.2 文本数据预处理

3.3 景点相似度的度量方法

3.4 本章小结

第4章 K-Means聚类优化

4.1 K-Means聚类简介

4.2 基于最远初始中心点和轮廓系数评价函数的K-Means聚

4.3 实验结果

4.4 本章小结

第5章 基于多阶段混合属性的景点实体解析方法

5.1 本方法的框架

5.2 景点实体解析过程

5.3 实验设计

5.4 实验结果

5.5 结果分析

5.6 本章小结

第6章 总结与展望

6.1 工作总结

6.2 工作展望

参考文献

作者在攻读硕士期间发表的论文

作者在攻读硕士期间参与的课题

致谢

展开▼

摘要

实体解析是一个非常传统的研究方向,近年来又逐渐成为研究热点,基于领域的实体解析正是其热点之一。与通用实体解析不同的是,基于领域的实体解析需要全面地分析和捕获领域数据的特征,并充分地加以利用。通用实体解析方法通常是在单一阶段内一次性匹配特征数据来完成实体解析,这一方面会造成不同特征数据的相互干扰,另一方面也不利于有针对性地利用不同的特征数据,从而影响实体解析的精确度。
  因此,本文在旅游信息领域背景下,在对领域无关和基于领域实体解析文献综述的基础上,提出了一种基于多阶段混合属性的景点实体解析方法。本方法在不同旅游数据源中,在景点的不同属性中充分提取景点的特征信息,通过多个阶段设计相应算法多次利用相关特征信息,最终实现景点实体解析。其中,景点的不同属性包括景点名、景点所在地,以及景点简介等。实体解析分为两个阶段,第一阶段是利用景点简介中的名词信息,对不同旅游网站中的景点进行聚类;第二阶段是在聚类结果基础上,利用景点名和景点简介中的人名地名相似度信息,进行桶装算法实现实体解析。
  本论文创新点如下:
  (1).解决了基于旅游景点实体解析的问题;
  (2).提出了基于多阶段混合属性的景点完全实体消解框架,在不同阶段有针对性地利用实体属性的有效信息;
  (3).提出了一种景点名景点简介混合的景点相似度度量方法;
  (4).提出了一种基于最远初始中心点和轮廓系数评价函数的k-means聚类优化算法;
  (5).改造了一种桶装解析算法;
  (6).在真实旅游景点数据集上进行了大量对比实验。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号