声明
1 绪论
1.1研究背景
1.2研究意义
1.3研究现状
1.4本文主要研究内容
1.5本文的组织结构
2 垃圾信息识别系统分析
2.1垃圾信息识别相关概念
2.1.1校园网垃圾信息的定义
2.1.2垃圾信息识别技术简介
2.1.3文本分类的定义
2.2系统分析
2.2.1功能需求
2.2.2性能需求
2.3文本预处理关键技术
2.3.1分词技术
2.3.2文本去噪技术
2.3.3文本特征表示
2.3.4文本特征提取
2.3.5反馈学习
2.4系统方案选择
2.5 本章小结
3 垃圾信息识别系统设计与实现
3.1系统设计关键技术
3.1.1贝叶斯分类算法及改进
3.1.2 MapReduce并行编程模型
3.1.3分布式文件存储
3.1.4分布式数据库
3.2系统整体设计
3.3.1模板训练过程
3.3.2训练结果的存储
3.3.3 MapReduce过程实现
3.3.4配置训练
3.4.1分类识别过程
3.4.2 MapReduce实现
3.5 本章小结
4 系统测试以及性能评估
4.1测试环境
4.2评价指标
4.3测试及分析
4.3.1文本去噪测试
4.3.2分词测试
4.3.3英文信息测试
4.3.4中文信息测试
4.3.5算法性能测试分析
4.4本章小结
5 总结与展望
5.1总结
5.2展望
致谢
参考文献
攻读学位期间取得的研究成果
西南科技大学;