首页> 中文学位 >基于搜索引擎扩展信息的实体链接研究
【6h】

基于搜索引擎扩展信息的实体链接研究

代理获取

目录

声明

致谢

摘要

第一章 绪论

1.1 研究背景与意义

1.1.1 研究背景

1.1.2 研究意义

1.2 研究内容

1.3 论文结构

1.4 本章小结

第二章 实体链接相关研究综述

2.1.1 实体链接基本概念

2.1.2 实体链接难点

2.1.3 实体链接框架

2.2 实体链接研究现状

2.2.1 候选实体生成研究现状

2.2.2 候选实体消歧研究现状

2.3 从命名实体识别到实体链接

2.3.1 命名实体识别

2.3.2 词义消歧

2.3.3 共指消解

2.4 实体链接语料

2.4.1 实体链接知识库

2.4.2 实体链接数据集

2.5 实体链接评价标准

2.6 本章小结

第三章 基于D-S证据理论的实体链接方法研究

3.1 概述

3.2 特征提取

3.3 基于D-S证据理论特征融合的实体链接

3.3.1 D-S证据理论

3.3.2 候选实体生成

3.3.3 候选实体消歧

3.4 实验结果与分析

3.4.1 实验数据集及对比算法

3.4.2 评价标准

3.4.3 实验结果与分析

3.5 本章小结

第四章 基于图模型的实体链接方法研究

4.1 概述

4.2 基于图模型的实体链接算法

4.2.1 候选实体生成

4.2.2 图模型的建立

4.2.3 候选实体消歧

4.3 实验结果与分析

4.3.1 实验数据及对比算法

4.3.2 评价标准

4.3.3 实验结果与分析

4.4 本章小结

第五章 总结与展望

5.1 总结

5.2 展望

参考文献

攻读学位期间的学术活动及成果情况

展开▼

摘要

实体链接是把文本中的实体链接到知识库中的实体的过程,该工作有效地促进了机器翻译、问答系统、信息检索、信息融合、知识库补全等领域的发展。在实体链接的研究工作中,传统的方法利用现有的知识库进行消歧。然而,现有的知识库存在更新滞后、实体信息不完整的缺点。因此,影响了依赖于“词共现”的相似度计算的精度。所以,利用外部的知识源对知识库中的实体信息进行扩展具有重要意义。基于以上探索,本文对实体链接问题展开了研究,主要研究工作如下:
  (1)实体指称的候选实体是否为其目标实体具有不确定性,因此,我们利用D-S证据理论进行不确定性问题推理。本文运用证据理论融合了实体名称特征、实体指称与候选实体上下文文本相似度特征、实体流行度特征对实体指称进行消歧。并且利用搜索引擎对实体指称与候选实体上下文文本相似度特征进行了扩展。通过实验验证利用D-S证据理论结合搜索引擎进行实体链接在精度、召回率和F值上优于对比算法,证实了该方法用于实体链接的有效性。
  (2)由于一些实体名称具有歧义性,为了对实体指称进行同步消歧,挖掘实体之间的语义关系,我们通过对实体建立图模型充分利用了实体间的语义联系。在图模型中,文本中的实体指称与所有候选实体组成图的节点的集合。在建立节点之间边的过程中首先利用搜索引擎扩展实体指称与候选实体上下文文本,然后通过计算相似度的方法在实体指称与候选实体之间建立边,通过挖掘间接关系的方法在候选实体之间建立边。最后通过实验验证基于图模型的实体链接算法效果更佳,优于对比算法。

著录项

  • 作者

    何颖;

  • 作者单位

    合肥工业大学;

  • 授予单位 合肥工业大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 吴共庆;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;
  • 关键词

    实体链接; 搜索引擎; 扩展信息; 同步消歧;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号