首页> 中文学位 >面向突发事件的事件要素识别研究
【6h】

面向突发事件的事件要素识别研究

代理获取

目录

声明

摘要

插图和附表清单

第1章 绪论

1.1 课题来源

1.2 研究背景和意义

1.3 事件要素识别的研究现状

1.4 论文研究内容

1.5 论文组织结构

第2章 事件要素识别概述

2.1 本章概述

2.2 事件及CEC语料库

2.2.1 事件研究概述

2.2.2 事件与事件要素介绍

2.2.3 CEC语料库

2.3 事件要素识别的研究路线

2.4 本章小结

第3章 事件的时间和地点要素的识别研究

3.1 本章概述

3.2 时间和地点要素的语言表现

3.3 时间和地点要素的识别

3.3.1 改进的K-Means算法

3.3.2 事件时间和地点识别的整体流程

3.3.2 Prefix Span算法挖掘规则

3.4 时间要素和地点要素的实验

3.4.1 实验准备

3.4.2 实验结果分析

3.5 本章小结

第4章 事件对象要素识别研究

4.1 本章概述

4.2 事件对象要素的语言表现

4.3 事件对象要素的识别研究

4.3.1 事件触发词

4.3.2 事件的语法距离

4.3.3 对象要素存在的判定

4.3.4 基于依存句法的事件对象要素识别

4.4 实验与分析

4.5 本章小结

第5章 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

作者简介及读研期间主要科研成果

展开▼

摘要

近年来,世界各地频繁发生各种各样的突发事件,如:地震、火灾、恐怖袭击等,大量突发事件的出现使得网上的信息发生严重冗余,人们从中很难获取到有用的信息,事件抽取就是在这种现象的驱动下悄然兴起。事件抽取是信息抽取领域一个重要的研究方向,它主要包含两个方面:事件识别和事件要素识别。事件识别主要对事件触发词进行识别,事件要素识别主要包括对时间要素、地点要素、对象要素等的识别。本文主要对事件要素进行识别。
  (1)事件时间和地点要素的识别研究。在自然语言中,事件的时间要素反映了事件发生的时间,时间可分为绝对时间和相对时间,地点要素反映了事件发生的具体位置,没有脱离地点要素而存在的事件。本文采用改进的K-means算法与Prefix Span算法对事件时间和地点要素进行识别。K-means算法是一种非监督聚类算法,但K-means算法存在不能确定聚类个数的问题,因此,引入Canopy算法,先完成对数据的“粗聚类”,并把“粗聚类”的结果运用到K-means算法中,最后解决聚类个数问题。聚类完成后,利用Prefix Span算法对聚类结果进行深度挖掘,并对挖掘的结果进行人工处理以获得时间和地点要素的识别规则,进而实现对事件时间和地点要素的识别。实验取得较为理想的效果。
  (2)事件对象要素的识别研究。对象要素指事件的主要参与者,主要可以分为两类:主体对象(动作发起者)和客体对象(动作接受者),本文提出基于依存句法分析的方法对事件对象要素进行识别。该方法首先对事件中对象要素的语言表现规律进行研究,并自定义了用于判断事件中是否存在对象要素的启发式规则,然后在此基础上,对存在对象要素的事件利用依存句法分析的方法进行识别,最后通过实验对其效果进行验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号