首页> 中文学位 >基于树型条件随机场的特定域事件提取方法研究
【6h】

基于树型条件随机场的特定域事件提取方法研究

代理获取

目录

文摘

英文文摘

声明

1 绪 论

2 相关理论概述

3基于树型条件随机场的简历信息提取的方法研究

4 实验与分析

5总结与展望

致 谢

参考文献

附录1 攻读硕士学位期间参与项目

展开▼

摘要

事件提取是指把非结构化文本中出现的事件的时间,地点,事件主体和事件的具体内容提取出来。随着垂直搜索引擎的出现,事件提取作为信息提取的一个研究方面,近年来成为研究的热点,并被应用到信息提取的许多领域,如信息检索、垂直搜索引擎等。本论文主要针对web上存在的大量简历类型的网页,研究如何利用文本分类技术自动识别简历并下载;并在此基础上进一步研究如何利用条件随机场从非结构化的简历文本提取出结构化的事件信息。论文首先对当前常用的分类方法和事件提取模型进行了总结和回顾,比较和研究了当前文本分类和事件提取研究的进展、各自常用的方法和模型。其次,本文结合社会标注及传统的文档向量模型技术提出了一种融合社会标注和文本词频的新的文档向量表示模型,利用新的模型构建文档的表示并结合传统的文本分类方法可有效地提高分类精度。最后,通过分析简历信息具有层次结构这一特点,利用树型条件随机场来建模简历文本中的层次化信息,并实现了基于树型条件随机场提取简历文本中事件的原型系统。本文还针对所提出的融合社会标注及文本词频的向量模型和基于树型条件随机场的事件提取算法做了大量的文本分类实验和事件提取实验。实验结果显示,本文所提出的方法针对特定领域的文本分类及事件提取具有较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号