首页> 中文学位 >基于树核函数的中文实体语义关系抽取方法的研究
【6h】

基于树核函数的中文实体语义关系抽取方法的研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1研究背景

1.2研究内容

1.3研究意义

1.4信息抽取概述

1.4.1信息抽取发展历史

1.4.2信息抽取系统的体系结构

1.4.3信息抽取系统的评测标准

1.4.4信息抽取系统的关键技术

1.5本文组织结构

第二章关系抽取相关工作

2.1 ACE语料

2.1.1 ACE评测任务

2.1.2 ACE语料库统计

2.2关系抽取概述

2.3关系抽取研究现状

2.3.1指导性学习方法

2.3.2无指导学习方法

2.3.3弱指导学习算法

2.3.4中文实体关系抽取研究现状

2.4 SVM分类器原理概述

2.5本章小结

第三章基于树核函数的中文实体语义关系抽取

3.1核函数方法及卷积树核函数

3.2结构化关系实例表示方法

3.3实体关系抽取系统流程

3.3.1语料预处理

3.3.2生成实验数据

3.4实验及结果分析

3.4.1英文实体语义关系抽取

3.4.2中文实体语义关系抽取

3.4.3中英文实体关系抽取的比较与分析

3.5分类器训练和测试速度优化

3.6本章小结

第四章实体语义信息在关系抽取中的作用

4.1实体语义信息

4.2实体语义树表示方法

4.3实体语义信息对中文关系抽取的作用

4.4五倍交叉验证

4.5与其它关系抽取系统的比较

4.6本章小结

第五章总结与展望

5.1本文研究总结

5.2工作展望

参考文献

作者在攻读硕士学位期间发表的论文

致谢

展开▼

摘要

实体语义关系抽取是信息抽取中的重要部分,其目的是从文本中找出实体对之间的语义关系并对它们进行分类。现阶段在英文语料上的实体关系抽取研究已经开展的比较全面和深入,取得的F值达到75%以上,不过离实用化还有一段距离。与英文关系抽取研究相比,中文的研究起步相对较晚,现阶段的研究方法大多是把英文中的基于特征向量的方法移植到中文环境里面,取得的性能也比英文低。另一方面,基于核函数的方法由于能捕获关系实例的结构化信息,在英文关系抽取中取得了较好的性能,而在中文关系抽取中还需要深入的研究。 本文研究了基于树核函数方法的中文实体语义关系抽取,研究内容主要包括: 1.构建一个中文实体关系抽取原型系统,比较中英文语料资源的实体类型以及关系类型的不同点,解决中文语料的预处理工作中所遇到的问题。 2.提出基于卷积树核函数的中文语义关系抽取方法,改进关系实例结构化信息的表达形式,比较和分析中英文语义关系抽取中各类实体关系之间的差异。 3.研究实体语义信息在中文语义关系抽取中的作用,并将实体语义信息和句法结构化信息结合成中文实体语义关系树,它能有效捕获关系实例的结构化信息和实体的语义信息。 实验结果表明,同英文语义关系抽取一样,基于树核函数的方法在中文语义关系抽取中也能取得合理的性能,并且实体语义信息的加入又明显提高了关系抽取的性能,最终的F值达到了64.2,为下一步的研究工作奠定了良好的基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号