首页> 中国专利> 一种基于AdaBoost的半监督学习标签噪声防御算法

一种基于AdaBoost的半监督学习标签噪声防御算法

摘要

针对数据中存在的标签噪声问题,本发明提出一种标签校正框架来检测数据中存在的标签噪声。基于五个真实的UCI数据集和TREC 2007垃圾邮件数据集,本发明技术方案首先人为地向数据集中注入标签噪声;然后利用标签噪声检测框架来标记可疑的样本标签并重新标注噪声样本的标签;最后使用机器学习算法评估了该检测框架的有效性。本发明的关键技术是一种基于AdaBoost的半监督学习标签噪声防御算法(AdaSSL)。该AdaSSL算法首先使用AdaBoost算法将数据集划分为权重较大的样本集和权重较小的样本集;然后使用半监督学习算法重新标记权重较大的样本集合的标签;最后汇总两个集合的样本。AdaSSL防御算法结合了AdaBoost和半监督学习技术的优点,有效地改善了数据集中样本的标签质量,提高了机器学习分类性能。

著录项

  • 公开/公告号CN113269258A

    专利类型发明专利

  • 公开/公告日2021-08-17

    原文格式PDF

  • 申请/专利权人 郑州大学;

    申请/专利号CN202110587195.4

  • 发明设计人 张宏坡;程宁;张洋;张博;

    申请日2021-05-27

  • 分类号G06K9/62(20060101);G06N20/00(20190101);H04L12/58(20060101);

  • 代理机构

  • 代理人

  • 地址 450001 河南省郑州市高新技术开发区科学大道100号

  • 入库时间 2023-06-19 12:14:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-21

    发明专利申请公布后的撤回 IPC(主分类):G06K 9/62 专利申请号:2021105871954 申请公布日:20210817

    发明专利申请公布后的撤回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号