首页> 中文学位 >中文事件论元抽取研究
【6h】

中文事件论元抽取研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1研究背景和意义

1.2研究现状

1.3研究内容

1.4组织结构

第2章 中文事件抽取相关知识

2.1中文事件抽取任务

2.2中文事件抽取相关工作

2.3语料资源

2.4机器学习模型

2.5实验方法及评价标准

2.6基准系统实验设置

2.7本章小结

第3章 基于触发词映射的中文事件论元抽取

3.1问题描述

3.2相关工作

3.3解决方法

3.4数据处理

3.5实验及结果分析

3.6本章小结

第4章 基于语义的中文事件论元抽取

4.1研究动机

4.2解决思路

4.3实验及结果分析

4.4本章小结

第5章 基于跨事件角色一致性的中文事件论元抽取

5.1相关工作

5.2研究动机

5.3解决思路

5.4实验及结果分析

5.5本章小结

第6章 总结与展望

6.1研究工作总结

6.2下一步工作设想

参考文献

攻读硕士学位期间公开发表的论文

攻读硕士学位期间参与的项目

攻读硕士学位期间公开申请的软件著作权

致谢

展开▼

摘要

目前绝大多数事件抽取的研究对象是英文,对中文的研究还处于起步阶段。论元抽取作为事件抽取的第二个子任务,是本文的研究重点。作为一种话题结构的语言,中文的表达方式比较灵活,句法结构不如英文严谨。现有的论元抽取方法多数采用基于浅层语义的句法结构特征,造成论元抽取性能低下。
  本研究主要内容包括:⑴现有的论元抽取方法主要以谓词为中心选取句法结构特征进行抽取,与动词性触发词不同,名词性触发词不是事件句的谓词,造成名词性触发词触发的事件的论元抽取比较困难。针对上述问题,本文将名词性触发词映射到事件句谓词上,提高名词性触发词触发的事件句与动词性触发词触发的事件句在特征上的相似度,以提高论元抽取性能。在ACE2005中文事件语料库上的实验表明,该方法在论元识别和角色分配阶段与基准系统相比分别提高了2.5%和2.8%。⑵与英文不同,中文事件句中论元与触发词的关系较松散,减弱了论元抽取中句法结构特征的作用。针对这个问题,本文在论元抽取阶段引入角色、实体和触发词的语义进行论元抽取,弥补了论元抽取中单纯采用句法结构特征的缺陷。在ACE2005中文事件语料库上的实验结果表明,该方法在论元识别和角色分配阶段比基准系统分别提高了3.7%和4.2%。⑶现有的基于机器学习的论元抽取方法大多选用句子级的特征,该方法对于与触发词距离较远的论元的抽取性能低下。针对这个问题,本文利用跨事件角色一致性,通过话题中部分已知的事件实例来抽取其他缺乏有效信息的事件实例。在ACE2005中文事件语料库上的实验表明,对于Attack、Die和Injure三类事件,该方法在论元识别和角色分配阶段分别比基准系统提高了3.4%和3.7%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号