基于改进K最近邻模型的反馈学习垃圾邮件过滤系统的设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

电子邮件技术已经成为一种快捷、经济的现代通信手段,几乎每个网络用户都有自己的邮件信箱。然而电子邮件也日益成为商业广告、病毒、木马等内容的重要载体,垃圾邮件的泛滥成灾给人们的正常生活带来了极大的危害和不便,同时极坏地影响了网络安全,占用了宝贵的带宽资源,占用了邮件服务器大量的存储空间。尽管目前已经存在许多的垃圾邮件过滤方法,但是垃圾邮件不降反升的局面表明,已有的垃圾邮件过滤方法并未取得理想的过滤效果。所以,研究新型高效的邮件过滤系统仍具有特别重要的现实意义。在垃圾邮件过滤研究领域已有的算法中,都是基于规则或基于内容的,其中基于规则的过滤算法需要用户长期定制和维护规则,其实质还是生硬的二值判断,局限在二维空间内进行处理,缺少可信度；基于内容的过滤算法大多数是基于向量空间模型的算法,其中广泛使用的是朴素贝叶斯算法和K最近邻(KNN)算法。虽然朴素贝叶斯邮件过滤器计算简便,但召回率和正确率都难以进一步提高。由于KNN算法计算复杂度太高而不适用于大规模场合和实时性要求高的场合。为此,提出邮件的合法属性和非法属性的概率,提出新的分类算法一基于邮件合法属性和非法属性的分类算法SEAFS算法。SEAFS垃圾邮件过滤算法结合KNN模型和朴素贝叶斯模型的优点,克服了KNN模型和朴素贝叶斯模型的缺点,将普通垃圾邮件过滤方法的线性过滤转化为非线性过滤,既提高了过滤准确度,又达到了令人满意的过滤效率,适用于大规模场合和实时性要求高的场合,有利于大规模邮件内容进行实时在线的垃圾邮件过滤。电子邮件的内容是随时间而变化的,用户的个性化需求也在不断改变,所以在对垃圾邮件的研究中加入了反馈学习过程,以捕捉这些变化,解决这一问题。本文设计并实现了一个实用、高效的垃圾邮件过滤系统,进行了大量实验,获得了良好的过滤效果,实验论证了SEAFS算法在垃圾邮件过滤中的可行性和有效性。

著录项

作者
梁好;
展开▼
作者单位

东北师范大学;

展开▼
授予单位东北师范大学;
学科计算机应用技术
授予学位硕士
导师姓名林和平;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.098;
关键词
最近邻; 朴素贝叶斯模型; 反馈学习; 垃圾邮件; 邮件过滤系统; 过滤算法; 过滤方法; 电子邮件; 属性; 线性过滤; 过滤效果; 分类算法; 朴素贝叶斯算法; 实时性; 邮件过滤器; 邮件服务器; 计算复杂度; 重要载体; 研究领域; 学习过程;

相似文献

中文文献
外文文献
专利

1. 基于改进贝叶斯的垃圾邮件过滤系统设计与实现 [J] . 丁文斌 ,李斌 ,罗浩 . 计算机工程与应用 . 2005 ,第018期
2. 基于主题模型的垃圾邮件过滤系统的设计与实现 [J] . 寇晓淮 ,程华 . 电信科学 . 2017 ,第011期
3. 基于多分形分析和主动学习反馈算法的图片垃圾邮件过滤 [J] . 周扬玲 ,钟剑 ,邓维 . 西南师范大学学报（自然科学版） . 2013 ,第010期
4. CBIR中一种基于最近邻的改进相关反馈算法 [J] . 易唐唐 ,黄立宏 . 计算机应用研究 . 2015 ,第008期
5. 基于神经网络模型的垃圾邮件过滤器的设计与实现 [J] . 张义 ,孔颖 ,朱翔 . 电脑知识与技术 . 2010 ,第012期
6. 基于无模型自适应控制的反馈-前馈迭代学习控制系统收敛性研究 [C] . 晏静文 ,侯忠生 . 第27届中国控制会议 . 2008
7. 基于机器学习理论的垃圾邮件过滤系统的研究与改进 [A] . 汤伟 . 2008

基于改进K最近邻模型的反馈学习垃圾邮件过滤系统的设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅