首页> 中文学位 >针对中文内容和基于贝叶斯定理的反垃圾邮件方法的研究
【6h】

针对中文内容和基于贝叶斯定理的反垃圾邮件方法的研究

代理获取

目录

文摘

英文文摘

引言

第1章垃圾邮件概述

1.1垃圾邮件概念

1.2垃圾邮件的危害

第2章电子邮件的工作原理及安全缺陷

2.1邮件结构

2.2 SMTP协议

2.3邮件传送机制的安全缺陷以及垃圾邮件的传播方法与机制

第3章反垃圾邮件方法的发展现状

3.1防止邮件地址外泄方法

3.2防止邮件服务器的开放式转发

3.3改进邮件传送机制中的现有协议

3.4反垃圾邮件技术

第4章一种基于内容和贝叶斯定理的邮件过滤方法

4.1贝叶斯分类法简介

4.2贝叶斯分类算法的基本原理

4.3贝叶斯分类法与邮件过滤的关系

4.4贝叶斯分类算法的两种模型

4.5贝叶斯过滤算法步骤

4.6贝叶斯过滤算法举例

第5章针对中文内容和基于贝叶斯定理的邮件过滤方法

5.1贝叶斯过滤算法中的中文分词

5.2针对中文内容和基于贝叶斯定理的邮件过滤系统模型

第6章针对中文内容和基于贝叶斯定理的垃圾邮件过滤系统

6.1邮件过滤系统的架构

6.2邮件过滤系统处理流程

6.3邮件过滤系统相关调整设定

6.4邮件过滤系统实验结果

第7章总结与展望

参考文献

致谢

论文原创性声明内容

展开▼

摘要

电子邮件已经成为人们日常生活中通信、交流的重要手段之一,但垃圾邮件问题也日益严峻,网民平均每天收到的垃圾邮件数量已超过了正常邮件。目前经常采用的垃圾邮件过滤技术一般包括黑名单与白名单技术、规则过滤以及基于关键词匹配的内容扫描等。  另外一种方法是从电子邮件的文本内容入手,使用文本分类、信息过滤的算法,在训练邮件集合上学习垃圾邮件分类器。垃圾邮件过滤中常用的文本分类方法有k-近邻、决策树、boosting等。现有的邮件分类器算法其中一个重要步骤是将邮件的文本内容出现的字与词标记化,也就是将邮件文本内容分词。但由于中英文环境中语素的不同特点,英文分词相当简单而中文分词的问题比较复杂。  本文将中文内容邮件分词算法同贝叶斯定理相结合,提出了针对中文内容和基于贝叶斯定理的邮件分类器,并使用这一分类器架构了反垃圾邮件应用系统进行了垃圾邮件过滤的实验,有效的验证了这一针对中文内容和基于贝叶斯定理的反垃圾邮件方法,最后对应用实验的不足进行了总结并提出了进一步的研究方向。

著录项

  • 作者

    张小林;

  • 作者单位

    中山大学;

  • 授予单位 中山大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 成良玉;
  • 年度 2005
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.098;
  • 关键词

    中文分词; 贝叶斯分类; 邮件过滤;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号