首页> 中文学位 >面向半监督流形正则化分类学习的改进框架研究
【6h】

面向半监督流形正则化分类学习的改进框架研究

代理获取

目录

第一个书签之前

展开▼

摘要

半监督分类学习是机器学习中一个重要研究领域,同时利用有标记和无标记样本进行学习,以缓解样本类标记稀缺的问题。流形正则化(Manifold regularization,MR)是半监督分类中一个经典有效的学习框架,但仍存在以下不足:1)在MR中,已标记样本的位置是随机的,可能处于边界区域甚至相反类中,将这些样本的标记传播到它们的近邻样本,可能会误导MR分类,尽管学习中会同时考虑未标记样本的分布结构。2)MR的平滑约束是基于所有样本对实现的,即将每个样本对看作一个单独对象。然而,光滑性本质是逐点的,具体来说,光滑性自然地发生在“每一点处”,体现每个样本点与其近邻点的相关联行为。因此,本文的研究问题主要包括以下的两个内容: 首先,为减少已标记样本极其稀缺或位置存在误导时所产生的影响,对已标记样本集进行扩充,提出一种新的标记扩充的MR框架(Label-expanded Manifold Regularization for semi-supervised classification,LE_MR)。在LE_MR中,先利用聚类方法,如KFCM,发现每类中的高可信度样本,此类样本通常处于聚类中心区域。再利用所获样本及其聚类标号扩充标记样本集,缓解标记样本缺乏的问题,以帮助提升MR的分类性能。在真实数据集上的实验结果表明:基于扩充的标记样本,LE_MR可有效提升MR框架的学习性能。 其次,为保留平滑性的逐点特性并且减少样本对的误导,通过考虑单个样本而非样本对的光滑性提出一种新的逐点MR框架(Pointwise Manifold Regularization for semi-supervised learning,PW_MR)。在PW_MR中,通过考虑单个样本而非样本对,平滑性的逐点特性得以保留;同时,引入了单个样本的重要性,可由局部密度描述,以帮助提升MR的分类性能。在真实数据集上的实验结果表明:逐点MR可帮助提升MR框架的学习性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号