首页> 中文学位 >一种基于贝叶斯分类的邮件网络协同过滤算法
【6h】

一种基于贝叶斯分类的邮件网络协同过滤算法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景和意义

1.2 垃圾邮件过滤技术

1.3 论文主要研究内容

1.4 论文组织结构

第2章 相关理论与技术

2.1 向量空间模型

2.2 特征项

2.3 向量空间模型的降维处理

2.4 中文分词技术

2.5 朴素贝叶斯算法

2.6 本章小结

第3章 一种基于贝叶斯分类的邮件网络协同过滤算法

3.1 问题的提出

3.2 基于贝叶斯分类的邮件网络协同过滤算法

3.3 本章小结

第4章 实验及结果分析

4.1 实验环境

4.2 实验评价标准

4.3 实验方案

4.4 实验结果分析

4.5 本章小结

结论

参考文献

致谢

展开▼

摘要

目前网络中垃圾邮件泛滥,挤占大量网络带宽,更让用户烦恼的是,删除掉这些垃圾邮件会花费他们大量时间。目前,国内学者针对中文垃圾邮件的过滤研究也在如火如荼的展开。随着文本分类技术的发展,基于内容的垃圾邮件过滤成为一种有效的垃圾邮件过滤方法,而其中朴素贝叶斯分类算法因其简单高效收到了广泛青睐。但是该算法目前主要存在两大问题,严重制约了其分类的准确率。首先朴素贝叶斯过滤算法没有考虑用户之间的联系,而仅仅考虑了用户自己;其次,朴素贝叶斯过滤算法只有在充分训练的基础上才能表现出良好的性能,而充分训练就是需要用户长期的参与并且频繁的反馈。
  为了缓解以上矛盾,从而更好地提高垃圾邮件过滤的准确率,本文首先从整体的角度去分析垃圾邮件的传播特性,借助学生邮件网络集合,揭示出邮件网络的小世界特性;其次,构建学生邮件交互有向图,基于用户节点间的交互强度,定义交互强度矩阵W,进而根据交互强度矩阵W提出了一种新的计算用户之间交互强度的方法,本文中称为节点交互概率,并且区分对待邮件的收和发;最后基于节点交互概率提出协同过滤算法来进行垃圾邮件过滤。交互强度参数?的值是根据用户自己的需求去设置的,通过对?进行不同取值,用户可以决定是否需要依靠他用户的协同推荐来进行垃圾邮件的过滤,从而也解决了朴素贝叶斯过滤算法需要大量训练集的问题。
  实验结果表明,同采用朴素贝叶斯算法的单用户过滤方法相比,协同过滤算法在召回率R、正确率P以及精确率Auc三个评价指标方面均有提高,并且方法简单易行。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号