首页> 中文学位 >基于内容分析的垃圾邮件过滤技术的设计与实现
【6h】

基于内容分析的垃圾邮件过滤技术的设计与实现

代理获取

目录

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1垃圾邮件的概念

1.2反垃圾邮件系统研究现状

1.3论文的研究内容与研究意义

1.4章节安排

第二章 电子邮件原理与过滤技术

2.1电子邮件的工作原理

2.2垃圾邮件的主流技术

2.3基于内容的过滤技术

2.4最新的过滤技术

2.5本章小结

第三章 系统的需求分析

3.1邮件过滤业务概述

3.2系统功能分析

3.3系统性能分析

3.4可行性分析

3.5本章小结

第四章 系统设计

4.1系统设计目标

4.2系统设计

4.3邮件过滤模块的功能设计

4.4系统的研究成果

第五章 算法设计

5.1算法分析

5.2贝叶斯分类方法

5.3贝叶斯分类算法的步骤

第六章 系统详细设计与实现

6.1邮件接收模块

6.2邮件的预处理

6.3中文分词分析算法

6.4添加权值的贝叶斯分类

6.5邮件训练模块

6.6垃圾邮件最终处理方式

6.7邮件过滤系统个性化改进

第七章 测试结果与分析

7.1垃圾邮件的评价体系

7.2实验结果

第八章 总结与展望

1.总结

2.展望

致谢

参考文献

展开▼

摘要

自电子邮件的产生以来,它给人类的交流方式带来了革命性的改变。这是一种快速异步地实现信息传递的技术。人们可以在任何时间,任何地点接受到邮件。然而,电子邮件带来便捷的同时也被大量地滥用。如今垃圾邮件问题已经愈演愈烈,对互联网的正常发展造成极大的危害。因此,如何实现对这类垃圾邮件的准确过滤成为近几年热门的研究课题。在反垃圾邮件过滤,朴素贝叶斯算法完成的非常完美,贝叶斯文本分类技术是使用最广泛的,取得的效果最好的垃圾邮件过滤技术。它不仅占用的系统资源少,还节省运算时间,尤其是在拉丁语系的反垃圾邮件过滤中堪称完美。然而,在中文邮件集的处理效果还是不理想。分词是指将连续的字符串按照不同的规范,新组合成次序列的一个过程。然而,由于语系的不同,这种方法用到中文分词中完全行不通,本文通过对中文分词的分析,制定出好的中文分词方法,并运用到反垃圾邮件系统中。
  因此,本文主要针对中文分词与朴素贝叶斯算法在垃圾邮件过滤的应用进行研究并实现,并利用中科院提供的中文分词器,采用朴素贝叶斯算法编写出垃圾邮件过滤器。设计一种基于内容分析的邮件过滤系统。首先对邮件的文本内容进行分类,然后根据朴素贝叶斯算法进行计算,当超出某一阈值是判定为垃圾邮件,否则为正常邮件。针对邮件接收的部分,考虑到目前市场服务提供商的条件限制,本文将采用简单的接受模式,最大的模拟出真实环境。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号