首页> 中文学位 >基于Word2vec的电子邮件分类
【6h】

基于Word2vec的电子邮件分类

代理获取

目录

声明

第一章 绪论

1.1 研究背景及意义

1.1.1课题研究背景

1.1.2课题意义

1.2 国内外研究现状

1.3 研究内容及创新点

1.4 论文框架

第二章 相关理论技术论述

2.1 对比试验的相关技术

2.1.1 机器学习模型的数据表示形式

2.1.2 KNN 算法

2.1.3 贝叶斯算法

2.2 本文所采取的相关技术

2.2.1 BP 神经网络模型

2.2.2 BP 算法

2.3 代价函数的选择

2.4 激活函数的选择

2.5 Softmax分类器

2.6 本章小结

第三章 基于 Word2vec 的中文邮件识别

3.1 中文垃圾邮件过滤中的问题及解决思路

3.2 分布式向量化表示

3.2.1 数据集

3.2.2 数据过滤

3.2.3 对文本进行分词及结果

3.2.4 利用 Word2vec 训练词向量

3.2.5 训练词向量的两种加速方式

3.2.6 词向量训练结果

3.2.7 邮件文本的向量化表示

3.3 防过拟合措施

3.3.1 Dropout 层

3.3.2 添加正则惩罚项

3.4 加快收敛速度的措施

3.4.1 Adam 算法

3.4.2 数据输入方式

3.5 模型性能的评价标准

3.6 本章小结

第四章 邮件过滤模型实验分析

4.1 实验环境

4.2 实验分析

4.2.1 确定隐藏层神经元个数

4.2.2 Dropout 层对模型的影响

4.2.3 Dropout 值的确定

4.2.4 确定词向量的维度

4.2.5 Adam 算法对实验结果影响

4.2.6 与其他算法的实验结果对比

4.3 实验总结

4.4 本章小结

第五章 总结与展望

致 谢

参考文献

展开▼

著录项

  • 作者

    缪沛恩;

  • 作者单位

    南昌大学;

  • 授予单位 南昌大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 周明建,熊敏;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号