首页> 中文学位 >基于多特征融合的垃圾邮件过滤系统
【6h】

基于多特征融合的垃圾邮件过滤系统

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪 论

1.1研究背景

1.2研究目的与意义

1.3本文的主要工作

1.4论文的组织安排

1.5本章小结

2 垃圾邮件过滤相关技术

2.1垃圾邮件简介

2.2图片型垃圾邮件简介

2.3常用垃圾邮件基本过滤方法

2.4图片型垃圾邮件过滤方法

2.5常用垃圾邮件过滤算法

2.6本章小结

3 基于多特征融合的垃圾邮件过滤系统分析

3.1邮件相关技术

3.2业务流程分析

3.3图片过滤预处理

3.5本章小结

4 基于多特征融合的垃圾邮件过滤系统设计与实现

4.1总体设计

4.2开发工具简述

4.3图片过滤详细设计与实现

4.4文本过滤器的设计与实现

4.5简单界面展示

4.6本章小结

5 测试与分析

5.1算法性能评测标准

5.2图片过滤器测试

5.3文本过滤器测试

5.4综合测试

5.5总结

5.6本章小结

致谢

参考文献

展开▼

摘要

随着互联网的普及,邮件服务也随之普及,但是随之而来的垃圾邮件也日益增多,尤其是近年来图片型垃圾邮件的泛滥成灾,给我们的带来诸多不便。因此,如何有效快速的过滤垃圾邮件,尤其是图片型垃圾邮件已成为互联网领域一个亟待解决的问题。
  本文在现有的成熟的文本垃圾邮件过滤的基础上,重点研究并实现了对图片型垃圾邮件的过滤。提出了基于多特征融合的组合过滤器的设计与实现,通过对垃圾邮件图片进行多个特征提取,然后使用各个特征分别训练出多个单特征图片过滤器,然后组合多个单特征过滤器构成组合的多特征过滤器,从而达到过滤效果的最优化并方便后期新特征的添加与原有特征的删除。本文同时结合业已成熟的文本过滤技术,也对图片型垃圾邮件中的文本进行了过滤。
  本文的主要工作如下:
  1.首先介绍了垃圾邮件的产生背景,给新出现的图片型垃圾邮件做了一个定义,分析其影响及检测它们的难点。
  2.分析常用的垃圾邮件过滤技术与常用的垃圾邮件分类算法,重点讨论了SVM与贝叶斯分类算法的理论与应用,并分析它们其各自的优缺点与适用范围。
  3.分析了现有的垃圾邮件图片与非垃圾邮件图片的在颜色特征、纹理特征、形状特征等方面的区别,提出了由各个单独的特征进行训练,得到单特征过滤器,然后由各个单特征过滤器组合而成构成融合的多特征过滤器的垃圾邮件过滤方式。
  4.简单实现一个基于朴素贝叶斯的中文文本分类器,主要用于对垃圾邮件中包含的文本部分进行过滤。
  5.设计并实现多个单特征垃圾邮件图片过滤器,然后融合多个垃圾邮件单特征过滤器,构成一个基于多特征融合的组合垃圾邮件图片过滤器。
  6.实现一个简单的邮件接收客户端,集成已实现的文本过滤器和图片过滤器,简单演示图片的过滤。
  7.详细测试了各个单特征图片过滤器、组合图片过滤器、文本过滤器等。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号