文摘
英文文摘
独创性声明及学位论文版权使用授权书
第一章前言
1.1信息抽取概述
1.2本文研究背景与意义
1.3本文研究工作概述及论文结构
第二章统计和规则相结合的人名识别
2.1人名及其前后缀引导词的统计分析
2.1.1定义
2.1.2统计分析
2.2识别方法
2.2.1人名识别的预处理
2.2.2算法
2.2.3统计的方法
2.2.4规则的方法
2.2.5不带姓氏的人名的识别和外国人名的识别
2.3实验结果及分析
2.3.1实验结果
2.3.2分析
2.4本章小结
第三章机构名的识别与CO-TRAINING机器学习方法的应用
3.1机构名分类及其特征分析
3.2采用Co-TRAINING的方法构造机构名知识库
3.2.1机构名知识库
3.2.2 Co-Training方法
3.2.3基于Co-Training的中文机构名资源自动获取方法
3.3.统计和规则相结合的中文机构名识别方法
3.3.1统计和规则相结合的机构名识别模型
3.3.2算法描述
3.4实验结果与分析
3.5本章小结
第四章基于相似计算的模板自动获取
4.1基于相似计算的模板自动获取方法
4.1.1相关定义
4.1.2模板的表示与同义词资源的建立
4.1.3预处理
4.1.4获取候选模板
4.1.5模板相似计算模型
4.1.6模板筛选
4.1.7算法
4.2实验与分析
4.2.1实验1
4.2.2实验2
4.2.3实验3
4.2.4讨论
4.3本章小结
第五章中文信息抽取系统的设计
5.1信息抽取系统简介
5.2中文信息抽取系统的设计
5.3中文信息抽取系统的实现技术
5.3.1文本预处理
5.3.2命名实体识别
5.3.3模板解析
5.3.4数据存储
5.4本章小结
第六章结束语
6.1研究工作总结
6.2研究工作的前景
6.3未来的研究工作
参考文献
致谢
攻读硕士学位期间发表的论文
东北大学;