首页> 中文学位 >基于半结构化文本信息抽取的简历识别系统
【6h】

基于半结构化文本信息抽取的简历识别系统

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1课题背景

1.2基于结构的文本分类

1.3本课题研究的意义

1.4本课题主要工作及成果

1.4.1课题研究对象

1.4.2课题主要工作

1.4.3课题主要成果

1.4.4本文结构简介

第二章半结构化文本定义

2.1半结构化文本定义

2.2半结构化文本特征

2.2.1元

2.2.2 项

2.2.3标识性

2.3半结构化文本举例

第三章智能简历分析系统

3.1研究目标

3.2系统描述

3.2.1类集合设计

3.2.2算法设计

3.2.3系统设计

3.3系统支持技术

第四章识别算法研究

4.1算法概要介绍

4.2算法模块之间的关联

4.3算法详解

4.3.1分割算法模块

4.3.2识别算法模块

4.3.3循环控制算法模块

4.4 半结构化文本信息抽取基本思路

第五章总结及展望

参考文献

致谢

作者在攻读学位期间发表的学术论文

展开▼

摘要

在日常生活中,简历是一类常见文本。从功能上看,简历是其作者介绍自己,推销自己,最终达到有效沟通的重要手段;从行文结构上看,它是一种半结构化文本。该类文本应用广泛、数目众多,因此,高效、准确的实现其信息抽取成为一个迫切的需求。在本文中,将就如何实现简历信息抽取进行研究。 一方面,从信息抽取效率上看,人工读取显然已经不能满足现实需求,而必须要利用计算机相关技术;另一方面,从准确抽取的可行性上看,根据半结构化文本的特征和文本信息抽取技术,如正则表达式匹配、关联性分析、统计等方法可以使抽取结果满足实际需要,即实现机器智能化识别是可行的。 本文的主要研究对象是简历,主要任务是针对以简历文本为代表的半结构化文本进行信息抽取的研究工作,主要研究成果包括三个方面:第一,提出了一种可广泛应用于各类半结构化文本的信息抽取思路;第二,设计了一套切实可用的简历信息抽取算法;第三,实现了一个可用的简历识别系统。 从本文的内容结构上看,论文主要分为五章:首先,绪论介绍论文半结构化文本在实际情况中的应用、进行信息抽取研究的必要性及可行性和项目的主要成果;其次,在第二章中根据实际项目需求,阐述了半结构化文本的定义,描述了该类文本的特点,提出了实现有效信息抽取的方案;再次,在第三、四中具体介绍简历信息抽取系统。该系统描述主要包括两个方面:系统设计和算法研究。前者主要是从工程应用上对系统进行描述,后者则是从算法实现上阐述系统的运作原理;最后,在第五章中对本文所论述的内容进行总结。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号