首页> 中文学位 >基于多源知识的命名实体链接研究
【6h】

基于多源知识的命名实体链接研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 引言

1.1课题背景及意义

1.2国内外研究现状

1.3主要研究内容

1.4 本文结构

2 实体链接相关研究

2.1 实体链接的定义

2.2 实体链接难点

2.3 实体链接的步骤

2.4 本章小结

3多源知识库构建

3.1 数据预处理

3.2 同义词表构建

3.3 人物Title表构建

3.4 知识库实体类标更新与建立索引

3.5 本章小结

4 命名实体链接

4.1 基于Lucene的命名实体链接

4.2 基于VSM与网络验证的命名实体链接

4.3 基于Ranking SVM 模型的命名实体链接

4.4 本章小结

5实验

5.1 实验数据介绍

5.2实验评估指标

5.3实体知识库介绍

5.4实验结果及分析

5.5 本章小结

6 结论与展望

6.1 结论

6.2 展望

参考文献

个人简历 在学期间发表的学术论文及研究成果

个人简历

在学期间发表的学术论文

研究成果

致谢

展开▼

摘要

处于大数据时代下,网络信息出现迅猛增长的趋势,互联网日趋发展成为一个信息覆盖面广的共享仓库,与此同时,对信息资源进行准确地理解也变得越来越困难,这是信息时代中一个亟需解决的问题。命名实体在文档中负载着主要的信息,是重要的语言单元,所以,对于一些存在歧义的命名实体的正确分析,将对文本的理解起到关键性作用,同时,对于知识库中不存在对应实体的新命名实体,需要及时发现,从而,可以将新出现的命名实体添加入知识库中,进而对其进行编辑,以此,达到扩充知识库的目的。命名实体链接技术正是解决此类问题的重要途径,将实体与知识库中的相关实体准确地建立起映射关系,继而实现自动的命名实体链接。命名实体链接技术将对解决知识库中的命名实体歧义和知识库扩充等问题起到支撑作用。
  本研究主要内容包括:⑴多源知识库的构建,包括同义词表、人物Title表的构建,以及对知识库实体类别标识的更新,同时对知识库的实体建立索引。⑵基于Lucene的命名实体链接,利用Lucene对待链接实体所在文本抽取的特征在知识库中进行检索,如果相似度分值最高的实体符合设定的条件,则返回实体的ID。⑶基于VSM与网络验证的命名实体链接,结合百科资源与向量空间模型,得到知识库中符合条件的实体。⑷基于Ranking SVM的命名实体链接,该方法有效地融合了微博文本的表面性特征与深层语义特征,同时利用SVM模型的优秀分类能力,得到符合要求的知识库中实体的ID。⑸将上述三种方法分别在NLP&CC2013和NLP&CC2014公开的数据集上进行实验,其中,基于Ranking SVM的方法优于其他方法,具有一定的可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号