声明
摘要
插图索引
附表索引
第1章 引言
1.1 研究背景
1.2 研究现状
1.2.1 基于统计的方法
1.2.2 基于规则的方法
1.2.3 统计与规则结合的方法
1.2.4 复合概念抽取的相关应用
1.3 本文工作
1.4 论文组织结构
第2章 概念抽取相关技术
2.1 复合概念的相关概念
2.1.1 概念
2.1.2 新词语
2.1.3 复合概念
2.1.4 概念、新词语和复合概念的联系与区别
2.2 概念抽取相关技术
2.2.1 TF-IDF方法
2.2.2 中文分词技术
2.3 本章小结
第3章 基于多级过滤的复合概念抽取模型
3.1 多级过滤抽取模型介绍
3.2 基于多级过滤抽取模型的具体抽取过程
3.2.1 文本预处理
3.2.2 分词和词性标注
3.2.3 对词条进行位置标注
3.2.4 停用词过滤
3.2.5 基于改进的TF-IDF公式进行原子概念过滤
3.2.6 基于空间组合规则进行复合概念过滤
3.2.7 基于词性组合规则进行复合概念过滤
3.3 本章小结
第4章 实验分析与比较
4.1 复合概念抽取系统
4.2 复合概念抽取评价指标
4.3 实验设计
4.4 实验结果
4.5 本章小结
总结及展望
1.本文工作总结
2.未来工作展望
参考文献
致谢
附录A 攻读学位期间所发表的学术论文目录