文摘
英文文摘
声明
第1章绪论
1.1文本分类概述
1.1.1文本平面分类
1.1.2文本层次分类
1.2国内外研究现状
1.2.1文本分类的发展阶段
1.2.2文本分类存在的问题
1.3本文主要研究内容
1.4论文的组织结构
第2章文本分类方法及分析
2.1文本自动分类问题的一般描述
2.1.1文本层次分类问题描述
2.1.2文本层次分类的求解策略
2.2文本自动分类的关键技术
2.2.1文本的特征表示
2.2.2特征项提取
2.2.3文本分类的性能评估方法
2.3常用文本分类算法
2.3.1简单向量距离分类法
2.3.2 KNN(K最近邻居)算法
2.3.3贝叶斯分类法
2.3.4支持向量机分类方法
2.3.5其它分类方法
2.4文本分类算法分析
2.4.1分类器性能分析
2.4.2平面分类和层次分类评估
第3章基于概率主题的文本层次分类
3.1文本层次分类相关工作
3.2传统特征表示方法改进
3.2.1传统特征表示方法
3.2.2基于概率主题的表示方法
3.3一种新的层次分类方法
3.3.1模型介绍
3.3.2主题抽取方法
3.3.3分类方法
3.4实验结果和分析
3.5本章小结
第4章基于潜在语义索引的文本层次分类
4.1潜在语义索引
4.1.1 LSI的原理
4.1.2基于LSI文本分类
4.2结合标签的自适应性层次分类方法
4.2.1基于LSI文本分类
4.2.2丰富类别标签
4.2.3算法的理论分析
4.3层次分类模型
4.4实验结果和分析
4.4.1数据集介绍
4.4.2实验参数设置
4.4.3实验结果
4.5本章小结
第5章结论与工作展望
5.1本文总结
5.2工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
在读期间参加的科研项目