首页> 中文学位 >基于Spark的分布式NB算法的垃圾邮件过滤研究
【6h】

基于Spark的分布式NB算法的垃圾邮件过滤研究

代理获取

目录

第一个书签之前

摘 要

Abstract

1 绪论

1.1 研究背景及意义

1.2 国内外现状与发展

1.2.1 反垃圾邮件技术的历程

1.2.2 邮件过滤的方法

1.3论文研究内容及结构安排

1.3.1 主要研究内容

1.3.2 结构安排

2 Bayes方法相关理论

2.1 贝叶斯基本理论

2.2 朴素贝叶斯

2.2.1 朴素贝叶斯模型

2.2.2 常见的两种事件模型

2.3 朴素贝叶斯在垃圾邮件中的应用

2.3.1 朴素贝叶斯公式

2.3.2 垃圾邮件分类过程

2.3.3 朴素贝叶斯算法优缺点

2.4 本章小结

3 Spark下的垃圾邮件过滤

3.1 垃圾邮件过滤技术在云环境下的发展

3.2 Spark计算平台

3.2.1 Spark生态系统

3.2.2 Spark运行特点

3.2.3 数据抽象模型RDD

3.2.4 Spark相对于Hadoop的优势

3.3 基于Spark的NB算法

3.4 Spark下NB算法实验模拟

3.5 本章小结

4 系统设计与实验分析

4.1 系统总体结构设计

4.2 实验结果与分析

4.2.1 实验数据和环境搭建

4.2.2 实验指标

4.2.3 实验验证和分析

4.3 本章小结

结 论

参考文献

在学研究成果

致 谢

展开▼

著录项

  • 作者

    张亚斌;

  • 作者单位

    内蒙古科技大学;

  • 授予单位 内蒙古科技大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 张晓琳;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 汽车工程;
  • 关键词

    Spark; 分布式; 算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号