声明
摘要
1.1 研究背景及意义
1.2 国内外研究发展现状
1.3 主要工作
1.4 组织结构
第二章 相关理论知识
2.1 文本分类主要流程
2.2 文本预处理
2.2.1 去除语料中的格式标记
2.2.2 去停用词
2.2.3 中文分词
2.3 文本特征提取
2.3.1 文档频率
2.3.2 TF-IDF
2.3.3 信息增益
2.3.4 互信息
2.3.5 卡方校验
2.3.6 Word2Vec模型
2.4 文本特征表示模型
2.4.1 布尔模型
2.4.2 概率模型
2.4.3 主题模型
2.4.4 向量空间模型
2.5 文本分类方法
2.5.1 朴素贝叶斯
2.5.2 K近邻分类
2.5.3 支持向量机
2.6 分类性能评价指标
2.7 本章小结
第三章 结合最大化差异和类别贡献度的文本分类方法(MDCC)
3.1 基于最大化差异的特征选择方法
3.2 类别贡献度文本特征表示模型
3.3 结合最大化差异和类别贡献度的文本分类方法
3.4 实验结果及分析
3.4.1 评价指标和实验数据集
3.4.2 对比实验分析
3.5 本章小结
第四章 基于多源数据的高校话题评论系统
4.1 系统架构
4.2 系统功能设计
4.3 系统核心模块
4.3.1 数据采集存储
4.3.2 话题主题分类
4.3.3 评论情感分析
4.3.4 高校话题标签提取
4.4 系统实现
4.4.1 应用展示模块
4.4.2 后台管理模块
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
附录
致谢
攻读硕士学位期间参与的科研项目
攻读硕士学位期间的成果