首页> 中文学位 >中文事件可信度信息标注和抽取方法的研究
【6h】

中文事件可信度信息标注和抽取方法的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 本文研究内容

1.4 本文组织结构

第2章 相关知识介绍

2.1 英文确定性信息语料库的标注

2.2 英文不确定信息抽取研究现状

2.3 事件可信度相关的语言学范畴

2.4 相关机器学习方法

2.5 本章小结

第3章 中文事件可信度语料库的构建

3.1 中文事件可信度定义

3.2 五类可信度相关信息

3.3 五类可信度相关信息标注规则

3.4 语料标注工具以及标注信息的表示

3.5 语料库分析与统计

3.6 本章小结

第4章 三维的中文事件可信度表示方法

4.1 三维可信度表示体系

4.2 事件可信度相关信息到三维体系的转换方法

4.3 三维体系到可信度的转换方法

4.4 实验结果及分析

4.5 本章小结

第5章 中文事件可信度相关信息的抽取

5.1 基于监督学习的事件选择谓词抽取方法

5.2 实验结果及分析

5.3 半监督的事件选择谓词标注方法

5.4 实验结果及分析

5.5 本章小结

第6章 总结与展望

6.1 研究工作总结

6.2 下一步工作设想

参考文献

攻读硕士学位期间公开发表的论文

攻读硕士学位期间参与的科研项目

攻读硕士学位期间公开申请的软件著作权

致谢

展开▼

摘要

事件的可信度表示文本中事件的事实性状态,对理解篇章中事件的确切语义起着至关重要的作用。目前,只有英文方面有事件可信度信息研究和少量确定性信息语料库,中文方面暂时还未起步。因此,对中文事件可信度的研究有着重要意义和作用。
  本研究主要内容包括:⑴针对中文语言的特点,从词汇和句子结构两个方面研究句子级别的中文事件可信度影响因素,提出了五类中文事件可信度相关信息及其标注规则;并基于ACE2005中文事件语料库标注了事件可信度信息。⑵提出了中文事件可信度的三维表示体系,该体系将中文事件的可信度分解成(极性、级别、时态)组成的三元组;同时提出了基于(极性、级别、时态)三元组作为中间桥梁的转换方法,该方法将原始的五类中文事件可信度相关信息转换成三元组,再把该三元组转换成事件可信度。实验证明,该三维可信度表示体系可以提高事件可信度分析的性能。⑶以中文事件选择谓词为例,提出了利用有效句法特征的有监督可信度信息抽取方法和基于双视图的半监督可信度信息标注方法。前者借鉴英文中不确定信息的抽取方法,利用词袋特征和句法特征来抽取中文事件选择谓词;后者基于少量标注样本,利用分类器视图和模式视图协同对未标注样本进行标注。实验证明,这两种方法均取得了较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号