加权贝叶斯邮件过滤方法研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

电子邮件给人们的沟通交流带来极大的便利，与此同时也带来了新的问题，即大量垃圾邮件的出现。垃圾邮件占用大量的网络资源，侵犯个人隐私，给人们造成了很大干扰，因此研究如何过滤垃圾邮件具有重要的现实意义和实际应用价值。本文在贝叶斯垃圾邮件分类算法的基础上进行研究工作。该算法基于统计学中的贝叶斯定理，根据先验概率求出后验概率，从而达到将垃圾邮件从大量电子文件中剔除的目的。贝叶斯垃圾邮件分类算法在按照文本分类进行邮件过滤的研究领域得到了广泛应用。
　　本文首先介绍了垃圾邮件过滤的研究背景、国内外研究现状以及常用的邮件过滤方法和技术。为了建立垃圾邮件剔除效果测试的比较标准，介绍了贝叶斯概率定理、本文使用的语料库以及引用文献中经常使用文本分类性能评价指标。
　　本文重点在分析常用的特征表示和特征选择基础上，做一些改进工作。建立特征表示的指纹向量方法以及特征选择的CHI-XIG混合方法，初步分析这种新方法在垃圾邮件分类中的优越性，后续设计了仿真实验进行验证。实验结果显示在本文建立的特征表示和特征选择方法基础上，朴素贝叶斯算法邮件分类效果有显著提高。
　　本文研究发现邮件头和邮件体在邮件分类过程中具有不同的作用，据此建立了给予邮件头和邮件体不同权重系数的加权贝叶斯邮件过滤模型。在实际使用中，邮件头和邮件体的权重系数从历史数据统计产生，利用加权贝叶斯邮件过滤模型计算得到邮件综合分数作为判断邮件类型的定量依据。仿真实验验证了加权贝叶斯邮件过滤模型在垃圾邮件分类中的明显优势。

著录项

作者
张远;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算数学
授予学位硕士
导师姓名冉启文;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.098;
关键词
垃圾邮件; 分类算法; 过滤模型; 贝叶斯定理;

相似文献

中文文献
外文文献
专利

1. 基于特征项区分度的加权朴素贝叶斯邮件过滤方法 [J] . 王辉 ,黄自威 ,刘淑芬 . 计算机应用与软件 . 2015,第010期
2. 基于粗糙集的加权朴素贝叶斯邮件过滤方法 [J] . 邓维斌 ,王国胤 ,洪智勇 . 计算机科学 . 2011,第002期
3. 基于改进的贝叶斯中文垃圾邮件过滤方法研究 [J] . 马威 ,褚红丹 ,高哲 . 电脑知识与技术 . 2008,第0z2期
4. 基于特征加权的朴素贝叶斯流量分类方法研究 [J] . 张泽鑫 ,李俊 ,常向青 . 高技术通讯 . 2016,第002期
5. 朴素贝叶斯及其改进算法在垃圾邮件过滤中的应用 [J] . 詹鹏伟 ,谢小姣 . 科技创新与应用 . 2018,第020期
6. 基于粗糙集的最小风险贝叶斯垃圾邮件过滤算法 [C] . 郝建忠 ,贾春福 ,周霞 . 第六届中国信息和通信安全学术会议（CCICS'2009） . 2009
7. 应用贝叶斯最大熵和地理加权回归方法研究我国沿海和内陆PM2.5时空分布 [A] . 肖璐 . 2018

加权贝叶斯邮件过滤方法研究

摘要

著录项

相似文献

相关主题

期刊订阅