首页> 中国专利> 一种基于不确定性与相似度量的主动学习分类方法

一种基于不确定性与相似度量的主动学习分类方法

摘要

本发明公开了一种基于不确定性与相似度量的主动学习分类方法,包括以下步骤:S1:对未标注分类数据进行预处理、向量化;S2:聚类,并选择各类中最具代表性的样本进行人工标注并记为数据集L,其余样本记为集合U;S3:计算U中各样本的相似度量值;S4:将L用于训练多个不同的机器学习模型,获得各模型的准确率和输出值;S5:确定各模型的权重值和不确定程度,从而确定不确定性决策值;S6:确定有最大价值的多样性训练样本,对其标注后更新至数据集L中,同时将从U中移除,得到更新的集合U;S7:重复步骤S3‑S6,直至各模型的准确率不再变化,得到最终的标记数据集L。本发明能够减小信息冗余样本量,在保证训练效果的基础上减少数据标注成本。

著录项

  • 公开/公告号CN113590830A

    专利类型发明专利

  • 公开/公告日2021-11-02

    原文格式PDF

  • 申请/专利权人 西南石油大学;

    申请/专利号CN202110974335.3

  • 申请日2021-08-24

  • 分类号G06F16/35(20190101);G06F40/194(20200101);G06F40/279(20200101);G06N20/00(20190101);

  • 代理机构11640 北京中索知识产权代理有限公司;

  • 代理人唐亭

  • 地址 610500 四川省成都市新都区新都大道8号

  • 入库时间 2023-06-19 13:05:40

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号