首页> 中文学位 >多值属性和多标记数据分类
【6h】

多值属性和多标记数据分类

代理获取

摘要

随着计算机技术、网络技术和数据库技术的迅速发展,现实中越来越多的应用都与多值属性、多标记数据密切相关,因此多值属性和多标记数据的分类算法成为了当前数据挖掘和机器学习领域的一个研究热点。
   目前的研究主要集中于多标记数据的分类算法,没有考虑多值属性的问题,而且大多数算法没有充分学习标记之间的相关信息,加上现实中多样本的数量少、标记困难等问题,对传统的分类算法提出很多新的挑战。本文的主要工作分为3个部分:(1)提出5种多值属性分解算法,结合已有的多标记分类算法,建立多值属性多标记分类的学习框架,并通过实验比较了不同分解算法的优劣,验证了按照取值顺序进行分解的学习效果最好;(2)改进已有的贝叶斯网络算法,提出了结合通用贝叶斯网络GBN和多网贝叶斯网络MBN的多标记学习算法,能够有效获取多个标记之间的相关信息,较大地提高了分类的精度;(3)针对多标记数据标记样本少的问题,结合实际对基于多标记组合算法的缺点进行了深入分析,建立多标记组合的分层模型,并提出基于不确定度的主动学习和基于置信度的半监督学习,交替选择最有效的样本进行学习,最终建立分层多标记分类器模型,实验验证了该方法能够大大提高多标记分类器的有效性和鲁棒性。
   本文的研究成果为学习多标记之间的相关信息以及在少量标记样本下的多标记分类学习提供了有效的方法,并通过结合多值属性分解的算法,为多值属性多标记数据的分类建立了新的学习框架。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号