面向信息抽取的命名实体识别与模块获取技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文主要对信息抽取中的命名实体识别和模板自动获取两个技术进行了研究,并提出了一套有效的解决方案.在命名实体识别方面本文重点研究了中文人名的识别和机构名的识别.本文在对大规模语料统计的基础上,建立了一个人名识别的知识库,提出了一种统计和规则相结合的人名识别方法.该方法兼顾了准确率和召回率,获得了较好的识别效果.经测试,召回率达到了91.35%,准确率达到了92.23%.在机构名的识别中,本文采用了Co-Training的机器学习方法自动构造机构名用词、机构名前导词、机构名后导词、机构名后缀、机构名用词等造机构名识别知识库,并且充分运用了机构名的组成概率,机构名的用词的同现概率等统计信息,还有机构名的内部组成结构和机构名前导词后导词等信息,提出了一种统计和规则相结合的机构名识别算法.实验系统封闭测试准确率和召回率分别达到了90.2%和81.7%,开放测试准确率和召回率分别达到了88.5%和75.5%.本文另外一个主要的研究工作是面向信息抽取的模板自动获取技术的研究.本文创新性地提出了一种基于相似计算模板自动获取方法.本文还在中文信息抽取系统的设计上作了尝试.利用实验室现有的技术和本文研究的相关技术设计了一个中文信息自动抽取系统.

著录项

作者
吴雪军;
展开▼
作者单位

东北大学;

展开▼
授予单位东北大学;
学科计算机软件与理论
授予学位硕士
导师姓名朱靖波;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类信息处理（信息加工）;
关键词
信息抽取; 人名识别; 机构名识别; Co-Training; 模板自动获取; 相似计算;

相似文献

中文文献
外文文献
专利

1. 面向商务信息抽取的产品命名实体识别研究 [J] . 刘非凡 ,赵军 ,吕碧波 . 中文信息学报 . 2006,第001期
2. 面向领域的Web信息自动抽取技术研究 [J] . 陈建彪 . 计算机光盘软件与应用 . 2012,第024期
3. Web招聘信息抽取中命名实体识别的研究 [J] . 王西锋 ,张晓孪 . 计算机与数字工程 . 2012,第005期
4. 面向专用信息获取的用户定制主题网络爬虫技术研究 [J] . 薛丽敏 ,吴琦 ,李骏 . 信息网络安全 . 2017,第002期
5. 面向军事特种医学深网信息的自动获取技术研究 [J] . 杨柳 ,仇顺海 . 海军医学杂志 . 2015,第003期
6. 面向商务信息抽取的产品命名实体识别研究 [C] . 刘非凡 ,赵军 ,吕碧波 . 全国第八届计算语言学联合学术会议 . 2005
7. 面向信息抽取的中文命名实体识别研究 [A] . 许晓丽 . 2009

面向信息抽取的命名实体识别与模块获取技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅