声明
摘要
插图索引
附表索引
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 本文的内容及成果
1.4 论文组织结构
第2章 相关概念和技术
2.1 引言
2.2 浅层文本知识体系
2.3 N元模式组
2.4 量化关系
2.4 关系库相关概念
2.4.1 类库定义
2.4.2 基础关系模式库
2.4.3 扩展关系模式库
2.4.4 可定量的关键词词库
2.4.5 样本模式和实例模式
2.5 评测标准
2.6 本章小结
第3章 可定量实体关系抽取方法
3.1 引言
3.2 常见的抽取方法
3.2.1 基于规则的模式匹配方法
3.2.2 基于词典统计的方法
3.2.3 基于机器学习的方法
3.3 可定量实体关系抽取方法设计
3.3.1 量词处理
3.3.2 文本预处理
3.3.3 实体关系抽取
3.3.4 一对多关系实例
3.4 实验结果与分析
3.5 本章小结
第4章 面向领域的实体关系抽取系统的构建
4.1 引言
4.2 GATE信息系统
4.2.1 GATE文档管理器(GDM)
4.2.2 语言工程可重用组件CREOLE的管理
4.2.3 GATE系统的整体架构
4.3 基于GATE的中文信息抽取系统的解决思路
4.3.1 扩展中文分词的插件
4.3.2 运用GATE实现可量化实体关系系统的总体思路
4.3.3 中文分词和词性标注的实现
4.3.4 关系库和规则的构建
4.4 实体关系抽取效果
4.5 本章小结
总结及展望
参考文献
致谢
附录A 攻读学位期间主要成果
附录B 攻读学位期间所参与的项目
湖南大学;