文摘
英文文摘
东南大学学位论文独创性声明及使用授权声明
第一章引言
1.1 研究背景
1.2研究现状
1.3本文的研究目标
1.4本文章节安排
第二章文本分类和层次文本分类基础
2.1文本分类的定义
2.2文本表示
2.3文本分类技术
2.3.1文本分类的两个阶段
2.3.2文本分类算法
2.4文本分类器的评价标准
2.5层次型文本分类
2.5.1类别层次结构的类型
2.5.2层次型文本分类的类型
2.5.3层次型分类的优点
第三章阻塞减少策略的分析与阈值降低类策略的研究
3.1阻塞与阻塞因子
3.2阻塞减少策略的研究现状
3.2.1阈值降低类
3.2.2累乘类
3.2.3分类器组织类
3.3阈值降低法与平面型分类的阈值策略
3.3.1 RCut、PCut和SCut
3.3.2阈值降低法和SCut的比较与分析
3.4基于柱状搜索的阻塞减少策略
3.5基于预测的阻塞减少策略
3.6基于概率密度估计的阻塞减少策略
第四章相关实验及分析与比较
4.1实验文本集和类别层次结构
4.2文本预处理
4.3训练文本的选取
4.4实验中使用的分类算法与实验结果
4.5对实验数据的进一步分析
4.5.1下层分类器对上层错分文本的过滤力度
4.5.2正态性检查
4.6显著性测试
第五章总结与展望
5.1本文的主要工作
5.2展望
参考文献
致谢