首页> 中文学位 >面向突发事件的事件识别及其应用研究
【6h】

面向突发事件的事件识别及其应用研究

代理获取

目录

声明

摘要

插图或附表清单

第1章 绪论

1.1 课题来源

1.2 研究背景和意义

1.3 国内外研究现状

1.4 本文研究内容

1.5 论文结构

第2章 面向突发事件的事件识别概述

2.1 本章概述

2.2 事件和CEC语料库

2.2.1 事件研究概述

2.2.2 事件和事件相关概念

2.2.3 CEC语料库

2.3 面向突发事件的事件识别研究路线

2.4 本章小结

第3章 面向突发事件的事件识别研究

3.1 本章概述

3.2 特征向量构造

3.3 特征选择

3.4 分类器训练

3.5 实验与分析

3.6 本章小结

第4章 面向突发事件的文本主题分类应用研究

4.1 本章概述

4.2 文本主题分类任务

4.3 基于卡方统计量的特征权重设计

4.3.1 分类算法设计

4.3.2 特征权重方法选择

4.3.3 特征权重设计

4.4 文本主题分类设计

4.4.1 训练文本的weight值计算

4.4.2 文本主题分类算法

4.5 文本主题分类实验与分析

4.6 本章小结

第5章 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

作者简介及读研期间主要科研成果

展开▼

摘要

事件既是人们进行记忆知识和逻辑思维的基本知识单元,又是信息传播和信息保存的语言。事件作为联结现实经验世界和语言符号世界的纽带,近年来得到越来越多人的关注。事件识别作为事件研究中的重要内容,其作用是把句子中表示某个事件发生的词识别出来。目前在事件识别的研究中,存在特征选择单一以及无关冗余特征对识别模型弱化的问题,因此本文提出了一种基于多特征的事件识别方法,并在此基础上对面向突发事件的文本主题分类应用进行研究。主要研究工作包括两部分:
  1.面向突发事件的事件识别研究。目前在事件识别研究方面,主要是基于语义或者句法等一个或少数几个特征对事件进行识别,并且对每个特征中引入的无关子特征或冗余子特征没有处理。由于突发事件包含的事件触发词较多,并且一个突发事件包含的词汇又非常有限,所以需要从有限的词汇中发掘更多有效的特征对事件触发词进行区分。于是本文提出了一种基于多特征的事件识别方法来处理上述问题。主要选取了词法特征、语义角色特征、依存句法特征以及语义依存特征等多特征进行分析。然后利用Relief算法对每个特征中的各个子特征进行特征选择,解决了无关特征和冗余特征会对模型性能产生弱化效果以及数据稀疏等问题。最后对特征选择后的特征向量用SVM分类器进行分类,实现事件识别。实验结果表明,上述事件识别方法取得了较好的效果。
  2.面向突发事件的文本主题分类应用研究。本文方法把文本主题分类分为两个阶段,训练阶段和测试阶段。训练阶段是对语料库中的事件标注结果进行处理,对每个主题计算出所有事件触发词的权重,得到每个类别的分类模板。测试阶段是对待分类的文本中识别出的事件触发词与选定主题的事件触发词进行逐一对比,计算该事件触发词的value值,这样依次计算出待分类文本中每个触发词的value值并相加,作为待分类文本与该主题比较的相关总权值。把待分类文本相对于五个类别的相关总权值依次计算出来,最后选出最大的相关总权值所对应的类别作为分类的结果。实验结果表明,上述文本主题分类方法取得了较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号