首页> 中文学位 >面向特定人群的网络信息事件提取方法研究
【6h】

面向特定人群的网络信息事件提取方法研究

代理获取

目录

封面

声明

致谢

中文摘要

英文摘要

目录

图清单

表清单

1 绪论

1.1 课题的背景与意义(Background and Significance of the Subject)

1.2 研究现状(Current Status of the Research)

1.3 本文主要研究内容及章节安排(Main Contents)

2 面向特定人群的事件本体构建

2.1 引言(Introduction)

2.2 本体介绍(Ontology overview)

2.3 本体构建(Ontology Construction)

2.4 以公职人员为主题领域的事件本体构建(Build Ontology on the Civil Servants)

2.5 本章小结(Summary)

3 事件类别的识别

3.1 引言(Introduction)

3.2 文档预处理(Document Predisposition)

3.3 基于本体的候选事件集选取(Candidate Event Set based on Ontology)

3.4 基于本体的事件类别识别(Event Type Recognition based on Ontology)

3.5 基于二元分类的事件识别(Maximum Entropy-based Event Recognition)

3.6 实验结果与分析(Experimental Results and Analysis)

3.7 本章小结(Summary)

4 基于事件本体的事件元素提取

4.1 引言(Introduction)

4.2 融合事件本体与 SRL 的事件元素提取(Event Extraction Fusing Event Ontology and SRL)

4.3 事件信息处理(Event Information Reprocessing)

4.4 本章小结(Summary)

5 基于本体的事件提取系统设计与实现

5.1 引言(Introduction)

5.2 已有事件抽取系统(Existing Events Extraction System)

5.3 系统设计(System Design)

5.4 系统性能分析(System Performance Analysis)

5.5 系统应用(System Application)

5.6 本章小结(Summary)

6 总结与展望

6.1 总结(Summary)

6.2 展望(Outlook)

参考文献

作者简历

学位论文数据集

展开▼

摘要

随着信息技术的普及应用和互联网的迅猛发展,大量电子文本形式的信息呈指数级增长。为了应对信息爆炸带来的挑战,信息抽取(Information Extraction)作为一种将无结构的文本转化为结构化或半结构化的信息的研究方法受到空前的重视。
  事件的检测与识别( Event detection and recognition,又称事件抽取)被ACE(Automatic content extraction)评测会议定义为一项重要的基本任务,已经成为信息抽取、自动文本等领域中的关键技术。其主要目的是把自然语言描述的事件以结构化的形式呈现,从而为后续信息处理与应用提供良好的数据条件。本体作为共享概念模型的明确的形式化规范说明,在信息处理、自然语言理解等人工智能应用领域发挥着越来越重要的作用。
  本文研究内容是面向特定人群相关领域网络事件的提取模型与算法。具体而言,选择公职人员这一特定群体,研究并解决涉及这一特定群体的网络事件类型识别、本体构建、事件元素抽取与处理问题。通过对这一特定主题的研究,分析并总结面向一般群体的网络事件提取的规律、模型与方法,丰富和发展面向海量网络数据的智能信息提取技术。
  本文的主要研究工作包括以下几个方面:
  1.通过对大量网络语料的分析整理和实验研究,利用事件触发词提取算法,并采用触发词聚类分析技术,提出了面向公职人员的事件本体半自动构建模型。
  2.在事件类型识别方面,提出了基于事件触发词与本体中概念相似度计算的事件类型识别算法,并通过与基于最大熵二元分类方法的识别技术比较,分析了本文方法的性能。
  3.在事件元素识别方面,提出基于事件本体的事件元素提取方法。该方法利用事件对应的事件模板结合SRL语义角色标注进行事件元素提取,并根据网页发表时间对事件的时间元素作进一步校正。所提出方法在面向公职人员事件识别和事件元素识别的平均F值均取得了较好的效果。
  本文研究对于面向特定人群相关网络事件分析提取具有普遍意义,在舆情分析等相关系统构建中能够发挥重要作用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号