首页> 中文学位 >基于属性相关性的朴素贝叶斯分类模型研究
【6h】

基于属性相关性的朴素贝叶斯分类模型研究

代理获取

目录

声明

第1章 绪论

1.1研究背景及意义

1.2国内外研究现状

1.3论文内容与框架

第2章 相关理论基础

2.1朴素贝叶斯分类模型相关理论

2.1.1相关理论

2.1.2朴素贝叶斯分类模型

2.2朴素贝叶斯分类模型的扩展

2.2.1半朴素贝叶斯分类模型

2.2.2树增强朴素贝叶斯分类模型

2.2.3隐朴素贝叶斯分类模型

2.3分类评价标准

2.4本章小结

第3章 基于属性分组的隐朴素贝叶斯分类模型

3.1属性分组

3.2.1模型的结构和思想

3.2.2模型具体实现过程

3.3实证分析

3.3.1数据来源

3.3.2结果分析

3.4本章小结

第4章 基于R-vine Copula理论的改进贝叶斯分类模型

4.1 Copula相关理论

4.1.1 Copula理论

4.1.2基于Pair Copula的高维Copula函数分解

4.2改进分类模型具体实现过程

4.3实证分析

4.3.1 数据来源

4.3.2模型建立

4.3.3结果分析

4.4本章小结

总结与展望

致谢

参考文献

攻读研究生期间发表的学术论文

展开▼

摘要

分类是数据挖掘中不可或缺的重点研究方向,其目的是根据分类模型将数据划分到不同的类别中。朴素贝叶斯分类模型是一种结构简单但效果良好的分类算法,其坚实的理论基础、较高的分类正确率以及较快的分类速度,使得该模型在实际生活中得到广泛应用。但朴素贝叶斯模型假定属性之间相互独立,在现实中很难成立,对分类效果造成不良影响。因此,现有文献大多通过放宽属性条件独立性假设来提高朴素贝叶斯分类的性能,本文在此基础上从以下两个方面考虑改进朴素贝叶斯分类模型。  针对离散型数据,结合属性分组和现有的隐朴素贝叶斯分类模型。在实际分类中,对一个特定属性往往只有部分属性对它的影响较大,其他属性影响较小。因此,先将属性分组,将相关性较大属性分为一组,使不同组内的属性相关性较弱。在引入隐藏父结点时,只考虑同一组内属性对该属性的影响。在UCI数据集上的实验结果证明,本章提出的分类模型能够很好地改善分类效果。  针对连续型数据,采用常用的Copula函数来体现属性之间的相关性,利用R-vineCopula模型将属性的类条件概率密度函数表示为PairCopula函数与边际密度函数相乘,摒弃了原模型的属性条件独立性假设。同时,R-vineCopula复杂多样的结构,以及众多不同PairCopula函数类型的选取,都能够更好地适应属性之间复杂的相关性。在UCI数据集上的实证分析证明,改进模型有效提高了分类的准确率,避免了因属性相关导致的分类效果的偏差。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号