摘要
1.1研究背景及意义
1.2国内外研究进展
1.3主要研究内容
1.4论文章节安排
1.5本章小结
第2章文本分类相关技术
2.1文本分类综述
2.1.1文本分类的定义
2.1.2文本分类的流程
2.2文本预处理
2.2.1文本分词
2.2.2去除停用词
2.3文本特征选择
2.3.1文档频率
2.3.2互信息
2.3.3卡方检验
2.3.4信息增益
2.3.5文本证据权
2.3.6期望交叉熵
2.4文本表示方式
2.4.1布尔模型
2.4.2概率模型
2.4.3向量空间模型
2.5分类算法
2.5.1朴素贝叶斯
2.5.2 K-最近邻
2.5.3逻辑回归
2.5.4决策树
2.5.5支持向量机
2.6文本分类评估
2.7本章小结
第3章模拟退火优化支持向量机
3.1模拟退火算法
3.1.1理论来源
3.1.2算法步骤
3.1.3寻优举例
3.2支持向量机
3.3支持向量机的参数问题
3.4 SA-SVM模型
3.5几种优化SVM参数算法的比较
3.6本章小结
第4章SA-SVM模型在中文文本分类中的应用
4.1实验环境与实验工具平台
4.2实验过程
4.2.1语料库选择
4.2.2文本预处理
4.2.3文本特征选择
4.2.4文本表示
4.3实验结果与分析
4.4本章小结
5.1工作总结
5.2展望
参考文献
攻读学位期间取得的研究成果
致谢
声明
上海师范大学;