首页> 中文学位 >基于深度学习的实体链接方法
【6h】

基于深度学习的实体链接方法

代理获取

目录

声明

摘要

图目录

表目录

第1章 绪论

1.1 研究背景

1.2 研究内容

1.3 本文结构

1.4 本章小结

第2章 相关理论与技术

2.1.2 文本实体链接

2.2 相关技术

2.2.1 HanLP

2.2.2 Word2Vec

2.2.3 Doc2Vec

2.2.4 同义词

2.2.5 神经网络

2.2.6 随机游走算法

2.2.7 GERBIL

2.3 本章小结

第3章 表格实体链接

3.1 引言

3.1.1 定义

3.2 特征设计

3.3 Rank训练指标与结果分析

3.3.1 极大似然估计

3.3.3 实验结果

3.4 本章小结

第4章 文本实体链接

4.1 引言

4.1.1 定义

4.2 实体识别

4.3 Mention模型

4.4 Entity模型

4.5 Neural Tensor和交叉熵训练

4.6 图模型联合消歧

4.7 实验设计与结果分析

4.7.1 实验设置

4.7.2 中文数据集

4.7.3 英文数据集

4.7.4 结果分析

4.8 本章小结

第5章 实体链接应用

5.1 表格实体链接应用

5.2 文本实体链接应用

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

文本理解在自然语言处理和人工智能领域起着重要的作用,实体链接是帮助计算机理解文本的重要研究内容。实体链接指将一段文本中的实体指称抽取出来,将这些实体指称消歧后映射到指定知识库中的唯一实体上。实体链接能够帮助计算机找到句子中的重要语义信息,判断词语在不同上下文语境中的不同含义,在帮助计算机理解自然语言中是不可或缺的。从两个角度提出了实体链接方法,分别是基于百科网站属性表的实体链接和基于纯文本的实体链接。
  本研究从人理解文本的角度出发,从词语理解到句子理解,阐述了分词,词向量表达,文档向量表达,同义词映射等基本的自然语言处理过程,并根据百度百科、互动百科、中文维基百科构建了一个基础的中文知识库。首先提出了一种基于机器学习的排序算法来处理属性表格中的实体消歧问题,旨在加强中文知识库中实体的关联性。然后提出了一种基于深度学习神经网络的文本实体链接算法,从文本中抽取实体指称并寻找对应的候选集实体,利用双向长短期网络对实体指称以及实体指称的类型建立模型,利用深度卷积神经网络对候选集实体以及实体类型建立模型,来训练实体指称和候选集实体之间的相似度。最后利用文档向量表达来补充实体指称和候选集实体的全局语义表达,并利用图模型算法进行联合消歧。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号