首页> 中文学位 >基于样本定邻域概率的贝叶斯分类器
【6h】

基于样本定邻域概率的贝叶斯分类器

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究工作的目的与意义

1.2 本课题的国内外发展现状

1.3 本课题研究的主要内容

第2章 朴素贝叶斯分类器

2.1 符号说明

2.2 朴素贝叶斯分类器-NBC

2.3 基于离散化的NBC-DNBC

2.4 正态朴素贝叶斯-NNB

2.5 灵活朴素贝叶斯-FNB

2.6 本章小结

第3章 灵活朴素贝叶斯的运行机制

3.1 概率密度函数估计

3.2 FNB运行机制分析

3.3 本章小结

第4章 基于样本定邻域概率的贝叶斯分类器

4.1 FNNBC算法的基本思想

4.2 FNNBC算法的基本原理

4.3 FNNBC算法的可行性验证

4.4 本章小结

第5章 改进算法与基本算法的分析比较

5.1 时间复杂度的比较

5.2 人工数据集上测试精度的比较

5.3 UCI数据集上测试精度的比较

5.4 本章小结

第6章 结论与展望

参考文献

攻读硕士学位期间科研工作情况

致谢

展开▼

摘要

在连续值分类问题中,对于基于概率密度估计的朴素贝叶斯分类器而言,往往采用多个正态分布概率密度函数的叠加去拟合连续值属性变量的真实概率密度函数,从而相应的类条件概率计算也是以多个正态分布概率密度函数值的加和来完成的。当确定新样本的类别标签时,如果新样本与训练集合中某个样本点距离大于某阈值时,那么,此训练样本在确定新样本类别的过程中的作用将会被忽略,即训练样本的信息会被丢失。为了弥补这一缺陷,本文提出了一种基于定邻域概率的朴素贝叶斯分类算法(FixedNeighborhoodBasedNativeBayesianClassifier-FNNBC),试图将定积分的概念扩展到每一个正态分布概率密度函数中,即使用积分值的加和,也就是定邻域概率的加和表示类条件概率。在实验部分,我们分别在人工数据集和UCI标准数据集上对FNNBC算法进行了验证,最终的实验结果表明,在人工数据集及大多数UCI标准数据集上,在时间复杂度没有显著增加的前提下,FNNBC算法比现有的处理连续值属性的朴素贝叶斯算法拥有更高的分类正确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号