基于深度学习的垃圾邮件文本分类方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着电子邮件的广泛应用，邮件成为了商业广告、恶意软件和非法文件的传播载体，人们平均接受的垃圾邮件数量远远超于正常邮件数量，严重影响着人们的生活和网络安全，如何能够精确的将垃圾邮件过滤出来成为了急需解决的问题。目前常用的垃圾邮件过滤方法一般包括基于邮件来源的识别技术和基于内容的识别技术两种类型，例如白名单与黑名单机制、关键词匹配和朴素贝叶斯模型文本识别。电子邮件的数量与样式在不断的增多，垃圾邮件的特征关键词也在发生巨大的变化，所以基于规则的识别方式要不间断的进行邮件特征规则库的更新，这将需要耗费大量的人力。基于内容的方法已经初具成效，但是传统的朴素贝叶斯模型识别垃圾邮件，在文本分类上性能已落后于深度学习模型，为此本文基于深度学习模型研究垃圾邮件分类。
　　本毕业论文从电子邮件文本内容入手，使用深度学习文本分类算法，建立了一个垃圾邮件识别模型。具体研究工作及贡献包括:
　　(1)提出了基于卷积神经网络与循环神经网络的深度学习模型(Conv-BiGRU Model)，结合卷积神经网络的局部特征提取优势和循环神经网络的上下文学习优势，有效提高了垃圾邮件文本分类的正确率;
　　(2)结合深度学习模型改进了Stacking模型，将初学习器模型的概率输出改为深度学习模型最后全连接层的输出，增加了次学习器的特征表达，提出了基于深度学习的Stacking模型，并且实现了垃圾邮件文本分类系统。通过与现有模型的实验对比，Stacking模型提高了分类性能;
　　(3)实现了本文提出的Conv-BiGRU模型及基于深度学习的Stacking模型，针对不同的模型方法、Embedding层输入、模型改进前后效果和深度学习模型超参数在收集的67万个样本的垃圾邮件文本数据集进行了多组对比实验。

著录项

作者
李雨亭;
展开▼
作者单位

中北大学;

展开▼
授予单位中北大学;
学科计算机技术
授予学位硕士
导师姓名宋礼鹏,罗凤明;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类信息处理（信息加工）;
关键词
垃圾邮件; 文本分类; 深度学习; 信息提取; 特征表达;
入库时间 2022-08-17 11:07:52

相似文献

中文文献
外文文献
专利

1. 基于深度Q网络的垃圾邮件文本分类方法 [J] . 景栋盛 ,薛劲松 ,冯仁君 . 计算机与现代化 . 2020,第006期
2. 基于深度学习的文本分类方法研究综述 [J] . 万家山 ,吴云志 . 天津理工大学学报 . 2021,第002期
3. 基于多通道深度学习网络的混合语言短文本情感分类方法 [J] . 张洋 ,胡燕 . 计算机应用研究 . 2021,第001期
4. 基于深度学习的中文文本分类方法 [J] . 肖禹 ,王景中 ,王宝成 . 计算机工程与设计 . 2021,第004期
5. 基于CNN深度学习的自媒体文本分类方法的研究 [J] . 祝亮 . 电脑知识与技术 . 2021,第021期
6. 基于文本团的自动文本分类方法 [C] . 胡晓辉 ,王明文 ,叶浩 . 全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会 . 2007
7. 基于深度学习的商品文本分类方法研究 [A] . 刘逸琛 . 2021

基于深度学习的垃圾邮件文本分类方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅