文摘
英文文摘
声明
第1章 绪论
1.1 文本分类的研究背景
1.2 文本分类的研究意义
1.3 文本分类的研究历史与现状
1.4 本文的主要工作
1.5 各章内容简介
第2章 中文文本分类概述
2.1 文本分类的特点和框架
2.1.1 文本分类的特点
2.1.2 文本分类的框架
2.2 文本预处理
2.3 文本表示
2.3.1 向量空间模型(VSM)
2.3.2 文本特征的选择
2.4 特征降维
2.4.1 文档频数
2.4.2 互信息
2.4.3 信息增益
2.4.4 x2统计量
2.5 分类器设计
2.5.1 Rocchio方法-相似度计算方法
2.5.2 KNN-K邻近算法
2.5.3 SVM-支持向量机
2.6 本章小节
第3章 基于统计的用户词典生成算法
3.1 中文自动分词
3.2 分词词典的重要性
3.3 基于统计的用户词典生成算法
3.4 本章小节
第4章 基于非负矩阵分解的中文文本分类
4.1 非负矩阵分解
4.1.1 非负矩阵分解的理论
4.1.2 非负矩阵分解的计算
4.2 基于非负矩阵分解的中文文本分类算法
4.2.1 特征提取
4.2.2 分类识别
4.3 实验设计与结果分析
4.3.1 实验语料
4.3.2 评价指标
4.3.3 文本预处理
4.3.4 实验结果分析
4.4 本章小节
第5章 中文文本分类系统
5.1 文本分类系统设计的主要考虑因素
5.2 文本分类系统的系统结构
5.3 文本分类系统的主要算法流程
5.4 文本分类系统的主要图形界面
5.5 文本分类系统的特点
5.6 本章小节
第6章 总结与展望
6.1 全文总结
6.2 工作展望
参考文献
攻读硕士学位期间发表的学术论文
致谢