首页> 中文学位 >基于规则的垃圾邮件过滤系统设计与实现
【6h】

基于规则的垃圾邮件过滤系统设计与实现

代理获取

目录

文摘

英文文摘

声明

第一章引言

1.1垃圾邮件危害及当前状况

1.1.1垃圾邮件的定义及其危害

1.1.2我国垃圾邮件的当前状况

1.2国内外垃圾邮件过滤技术

1.3论文的目的和意义

1.4论文主要工作和创新点

1.5论文的章节安排

第二章相关技术介绍

2.1神经网络技术

2.1.1神经网络算法简介

2.1.2神经网络算法在垃圾邮件中的应用

2.2特征提取相关概念及其算法

2.2.1关键字

2.2.2 IP黑/白名单/RBL

2.2.3 URL意图检测检测

2.2.4 DNS反向查询

2.3模式匹配

2.3.1 KMP算法

2.3.2 Boyer-Moore(BM)算法

2.3.3 Aho-Corasic(AC)算法

2.4.小结

第三章 基于规则的垃圾邮件过滤算法研究

3.1算法的提出

3.2算法的基本思想

3.3算法的机制设计

3.3.1特征提取过程

3.3.2向量空间表示法

3.3.3英文文本特征提取方法

3.3.4中文特征提取方法

3.4算法具体流程

3.4.1特征提取

3.4.2神经网络方法

3.4.3系统整体流程图

3.5小结

第四章 垃圾邮件过滤系统设计与实现

4.1系统背景

4.2系统设计

4.3系统实现

4.3.1规则生成模块

4.3.2规则优化模块

4.3.3阈值的确定

4.3.4规则过滤模块

4.4 小结

第五章 测试与分析

5.1测试环境

5.1.1软/硬件配置清单

5.1.2测试工具

5.2测试语料集

5.2.1英文语料库

5.2.2中文语料库

5.3评价体系

5.4系统参数对测试结果的影响

5.4.1阈值对参数的影响

5.4.2算法比较

5.5 小结

第六章 总结

6.1总结

6.2下一步工作及展望

致谢

参考文献

攻硕期间取得的研究成果

展开▼

摘要

随着Internet的发展,电子邮件得到了普及,它的广泛使用给人们的生活带来了极大方便。可是,一些人出于个人私利,利用电子邮件的便利滥发垃圾邮件,不仅消耗了大量的网络资源,还使大量的不良信息通过垃圾邮件得到传播,给社会带来很大危害。因此,反垃圾邮件的研究,在世界范围内得到了迅速而广泛的开展。同时,一些国外的垃圾邮件发送者利用我国作为世界垃圾邮件的中转,严重影响了我国互联网的通信以及国家尊严,我国的垃圾邮件问题,显得尤为重要。因此,反垃圾邮件的研究,对我国乃至全世界具有非常重要的意义。 通过对垃圾邮件的分析和处理,本论文设计并实现了一种利用特征抽取与神经网络算法的基于规则的垃圾邮件过滤系统。一般的过滤规则是静态的,不能实时快速的更新。该系统集合了特征抽取与神经网络技术,可以自动提取并“学习”接收到的邮件的特征,对传统静态的规则进行动态的调整和修改,提高了利用此规则过滤垃圾邮件的准确率。最后,本系统利用一个庞大的规则集对电子邮件的各个部分进行比较。每个规则都会增加或减少该电子邮件的“垃圾邮件相似分数”。如果一封邮件具有很高“垃圾邮件相似分数”的话,则被认定这是一封垃圾邮件。 本论文的主要工作包括以下几个部分: 1.研究垃圾邮件的特征,主要参考著名的垃圾邮件过滤软件SpamAssassin中的规则文件,以及CCERT发布的中文邮件规则集合,并通过学习和研究特征抽取方法,创新的提出一种符合现状的垃圾信息过滤规则生成方法; 2.学习与研究神经网络理论,对得到的邮件规则特征进行分数优化,形成一套完整的邮件规则库,则优化后的规则库中那些已经被证实有效的规则会被赋予较高的权重用以区分垃圾邮件和非垃圾邮件。 3.学习与研究现有的模式匹配理论,提出一种较好的规则匹配方法,达到快速而准确的垃圾邮件过滤效果。 可以看出,通过本系统既便于添加新的、基于正则表达式的判断规则,又可以正确的优化每一条规则的得分。最后,从实验数据可以看出,本系统也具有较好的过滤效果。

著录项

  • 作者

    郑梅;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 计算机系统机构
  • 授予学位 硕士
  • 导师姓名 耿技;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.098;
  • 关键词

    电子邮件; 垃圾邮件; 邮件过滤系统; 神经网络;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号