首页> 中文学位 >基于树核函数的命名实体语义关系抽取方法的研究
【6h】

基于树核函数的命名实体语义关系抽取方法的研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景及意义

1.2研究现状

1.3研究内容

1.4本文的组织

第二章命名实体语义关系抽取综述

2.1信息抽取概述

2.2信息抽取发展历史

2.3命名实体关系抽取技术分类

2.3.1有指导学习方法

2.3.2无指导学习方法

2.3.3弱指导学习算法

2.4本章小结

第三章基于树核的关系抽取原型系统

3.1实体语义关系抽取原型系统的整体框架

3.2实体语义关系抽取原型系统实现

3.2.1基准语料库

3.2.2分类器的选择

3.2.3实例的产生

3.2.4训练和测试

3.3实验及结果分析

3.4实例筛选对分类速度影响

3.5本章小结

第四章合一语义关系树

4.1语义关系树

4.1.1语义关系树的裁剪

4.1.2语义关系树的扩充

4.2合一语义关系树

4.3实验及结果分析

4.4本章小结

第五章语篇分析在实体语义关系抽取中的应用

5.1修辞结构理论与SPADE系统

5.2语篇结构分析在实体语义关系抽取中应用

5.2.1对照实验一——基于句法树结构

5.2.2对照实验二——基于语篇树

5.2.3改进实验——句法树与语篇树相结合

5.3实验结果分析

5.4本章小结

第六章总结与展望

6.1本文总结

6.2工作展望

参考文献

攻读学位期间公开发表的论文

致谢

展开▼

摘要

实体间语义关系抽取是自然语言处理中的一个重要问题,不仅是信息抽取的一项主要任务,而且具有广阔的应用前景。核函数的研究和使用是当前机器学习研究领域的热门课题,树核函数作为一种特殊的核函数,己被应用于关系抽取的研究,并取得了一定的成功。树核函数直接计算两个对象(如语法结构树)之间的相似度,从理论上讲,突破了以往基于特征向量的方法,可探索隐含的高维特征空间。 本文选取了一种卷积树核函数,实现了一个实体间语义关系抽取的原型系统。在ACE2004语料库上关系检测和7个关系大类抽取的F指数分别取得了72.5和57.4。从实验结果上看,原型系统的性能已经优于某些同类型系统。 通过对原型系统的详细分析,我们发现原型系统所能抽取的关系实例不完备。基于此,本文提出对语义关系树进行适当的扩充和裁剪,针对特定的结构采用特定的处理方法,使得系统性能在原型系统的基础上有了大幅度的提高,在ACE2004语料库上关系检测和7个关系大类分类的抽取中,F值提高到79.1和71.9。 针对长距离的关系识别性能较低的特殊情况,本文创造性地引入了语篇分析树,提出了把语篇分析树与原有的语义关系树相结合的方法,并针对ACE2004语料库中的关系实例进行了尝试性的实验。虽然实验语料不是很充分,而且受到我们采用的语篇分析器SPADE系统性能的制约,从实验数据来看,本文的方法有效,具有一定可行性的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号