首页> 中文学位 >人物传记摘要研究
【6h】

人物传记摘要研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1 人物传记摘要产生的背景

1.1.1信息增长的现实驱动

1.1.2业务模式发展的内在要求

1.2人物传记研究意义

1.3论文的主要内容和结构安排

第二章 人物传记研究摘要研究现状

2.1基于多文档摘要的人物传记研究

2.2基于事件和本体的人物传记研究

2.3面向人物追踪的人物传记研究

2.4本章小结

第三章 人物传记相关技术

3.1自动文摘

3.1.1自动文摘的主要方法

3.1.2自动摘要的评价

3.2信息抽取

3.2.1信息抽取的历史和现状

3.2.2信息抽取系统的评测

3.2.3信息抽取系统的结构

3.3本体

3.3.1本体的定义

3.3.2本体的作用

3.3.3本体的种类

3.3.4本体与知识库区别

3.3.5用本体描述世界

3.3.6本体的构造

3.4事件

3.4.1“事件”的定义

3.4.2“事件”的表示模型

3.4.3“事件”的提取技术

3.5本章小结

第四章人物本体构建

4.1人物信息的分析

4.2人物事件的构建

4.3构建本体的开发工具

4.4本体描述语言

4.5 RDF语言描述人物本体

4.6本章小结

第五章人物属性抽取

5.1人名识别

5.2人名指代处理

5.3人物属性抽取

5.3.1人物属性抽取的总体框架

5.3.2人物属性抽取语料集的标注

5.3.3人物属性的模型表示

5.3.4人物属性窗口长度

5.3.5人物属性抽取

5.3.6实验结果及其分析

5.4本章小结

第六章人物事件抽取

6.1人物事件抽取

6.1.1人物事件识别

6.1.2事件抽取系统设计

6.1.3实验结果及分析

6.2人物事件信息组织

6.3本章小结

第七章结论与展望

7.1结论

7.2展望

参考文献

作者在攻读硕士学位期间所作的项目和发表的论文

作者在攻读硕士学位期间所作的项目

致 谢

展开▼

摘要

Internet的迅猛发展使得网络上聚集了越来越多的文本信息。关于文本信息处理的诸如检索、分类、聚类、抽取等技术有了很大的发展,但是从多个文本中自动提取人物的信息并没有引起研究者的广泛注意,其过程和方法也没有统一的结论。 传统的人物信息提取方法存在一些不足,比如提取的人物信息内容不明确、组织混乱、输出无规范等。文章介绍了自动文摘、信息抽取、本体和事件等技术,分别讨论了各自在人物信息抽取中的作用。在总结众多研究者已有工作的基础上,分析了人物信息提取存在的主要问题,并提出了人物本体模型,利用本体和事件技术来解决上述的一些不足。本研究主要贡献如下: 1.在大量收集、整理人物语料的基础上,详细分析了人物信息的特点,提出用人物本体模型利用属性和事件表示人物。该模型通过人物属性和人物事件能够完整、准确地描述人物信息。 2.在充分了解本体描述语言和本体构建工具的基础上,定义了人物本体的构成,包括属性和事件,其中事件又有其构成要素。最后用RDF语言描述人物本体,并使用Protege手工构建了七类不同职业的人物本体,使其便于进行人物信息的管理和抽取。 3.对收集到的人物语料,研究了实现过程中人名的识别和人名指代的处理;给出了人物属性抽取的具体实现,提出采用监督式机器学习的方法来抽取人物的属性,即手工标注一定规模的语料,然后训练出分类器判断人名和属性是否存在搭配关系。并将抽取结果填充到人物本体中。 4.研究了人物本体中人物事件的抽取,提出基于事件模板的人物事件抽取算法并进行了系统设计。最后探讨了如何组织抽取到的人物属性信息和人物事件信息从而生成传记。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号