声明
摘要
第一章 绪论
一、垃圾邮件概述
(一)垃圾邮件的定义
(二)垃圾邮件的特征
(三)垃圾邮件的危害
二、选题背景和研究意义
三、国内外研究现状
(一)基于信件源的垃圾邮件过滤技术
(二)基于规则的垃圾邮件过滤技术
(三)基于统计的垃圾邮件过滤技术
四、主要研究内容及组织安排
(一)研究内容
(二)组织安排
五、本文的创新点
第二章 文本分类的关键技术
一、文本预处理
二、文本特征提取
三、基于互信息的特征提取方法的改进
四、文本表示方法
五、垃圾邮件过滤中常用的文本分类技术
(一)决策树
(二)朴素贝叶斯分类
(三)支持向量机分类
(四)K近邻(K-Nearst Neighbour)分类
(五)K均值聚类方法
第三章 朴素贝叶斯的理论概述及改进
一、贝叶斯定理
二、朴素贝叶斯分类
三、朴素贝叶斯分类模型参数估计
四、朴素贝叶斯模型选择
五、伯努利朴素贝叶斯在垃圾邮件分类中的示例
六、隐朴素贝叶斯
第四章 垃圾邮件过滤的实证研究
一、语料库
(一)英文语料库
(二)中文语料库
(三)研究样本选择
二、分类结果的性能评价
(一)评价方法
(二)性能评价标准
三、模型的建立与分析
四、模型结果分析
(一)实验一
(二)实验二
(三)实验三
(四)实验四
(五)实验五
第五章 总结及展望
参考文献
附录
致谢
在读期间发表的学术论文与取得的研究成果