首页> 中文学位 >贝叶斯算法在垃圾邮件过滤系统中的运用
【6h】

贝叶斯算法在垃圾邮件过滤系统中的运用

代理获取

摘要

电子邮件作为互联网技术发展的产物,在给全球网民带来通讯便利的同时,正不可避免地遭遇有悖初衷的运用。垃圾邮件问题日益严重,受到研究人员的广泛关注。目前经常采用的垃圾邮件过滤技术一般包括白名单与黑名单技术、规则过滤以及基于关键词匹配的内容扫描等。另外一条路线就是从电子邮件的文本内容入手,使用文本分类、信息过滤的算法。本文对邮件过滤中的贝叶斯算法的运用进行了探讨。主要内容如下: 第一章对于电子邮件的发展做简要回顾,详细介绍了互联网垃圾邮件泛滥的现状,在此基础上归纳了垃圾邮件的类型特征和现有的反垃圾邮件技术。 第二章基于内容过滤技术是目前反垃圾邮件用到的主要技术,综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术以及它们之间的对比实验,得到贝叶斯过滤方法的优点分析。 第三章分析了邮件过滤中的简单贝叶斯算法。使用Ling-Spam邮件语料实验贝叶斯算法的性能,并比较特征数量、分类阈值以及语料的预处理层次对结果的影响。 第四章在简单贝叶斯算法的基础上,利用最小风险贝叶斯算法修正过滤器,设计出了一种新的电子邮件过滤系统模型,讨论了系统所需处理的几个关键问题,给出了实验结果。

著录项

  • 作者

    顾辉;

  • 作者单位

    上海交通大学;

  • 授予单位 上海交通大学;
  • 学科 通信与信息系统
  • 授予学位 硕士
  • 导师姓名 李翔;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.098;TP311.56;
  • 关键词

    计算机网络; 电子邮件; 邮件过滤; 工具软件;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号