声明
摘要
第一章 导论
1.1 研究背景与研究意义
1.2 论文的主要研究内容
1.3 论文的组织结构
第二章 相关理论与工作介绍
2.1 传统的文本表征与相似度计算方法
2.2 基于外部知识的文本表征方法
2.3 对几种知识库的简介与分析
2.3.1 高度结构化的知识库
2.3.2 半结构化的知识库
2.3.3 其它类型的知识库
2.4 知识几种组织建模方式
2.4.1 数据库类型的建模方式
2.4.2 向量建模方式
2.4.3 树型结构的建模方式
2.4.4 图型结构的建模方式
第三章 概念图模型
3.1 外部知识的选取
3.2 维基百科页面简介
3.2.1 维基百科中最基本的页面——概念
3.2.2 维基百科的其他页面
3.3 概念图的构建过程
3.3.1 信息的抽取与预处理
3.3.2 不同区域的信息的融合
3.3.3 概念图的表示
3.4 小结
第四章 基于概念图的文本表征与语义相似度比较
4.1 文本映射到概念的方法
4.1.1 初步映射阶段
4.1.2 网络链接分析简介
4.1.3 映射后的调整
4.2 在概念图中比较文本的语义相似度
4.2.1 基于向量的方法
4.2.2 基于编辑距离的方法
4.2.3 基于访问概率的方法
4.3 小结
第五章 基于概念图的文本分类
5.1 文本分类简介
5.2 实验语料的预处理
5.2 基于实验语料的灵活建模方式
5.3 实验结果分析与评估
第六章 总结与展望
6.1 本文总结
6.2 下一步研究工作
参考文献
硕士期间发表的论文和参与的项目
致谢