首页> 中国专利> 一种数据质量提升和增强的方法及装置

一种数据质量提升和增强的方法及装置

摘要

本发明属于中医药实体抽取技术领域,尤其涉及一种数据质量提升和增强的方法及装置,通过获取待训练样本数据,将所述待训练样本数据进行部分标注标签、部分无标签处理,将含标签的所述待训练样本数据均分成n份原始训练集;通过预训练,获得n个训练模型,使用n个训练模型分别对无标签的待训练样本数据进行匹配预测,获取n份预测结果;通过数据去噪:判断模块判断出训练样本数据是否标注有误,并修正,再通过实际环境再校验。本发明有效减少了噪声数据,提高了数据质量,使训练模型的稳定性和精确度大大提高,彻底解决了由于中医药实体名称庞大、复杂带来的数据噪声大,难以去除,严重影响了AI和深度学习的使用效果的技术难题。

著录项

  • 公开/公告号CN112988733B

    专利类型发明专利

  • 公开/公告日2021-08-27

    原文格式PDF

  • 申请/专利权人 北京妙医佳健康科技集团有限公司;

    申请/专利号CN202110410090.1

  • 申请日2021-04-16

  • 分类号G06F16/215(20190101);G06F40/279(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11419 北京爱普纳杰专利代理事务所(特殊普通合伙);

  • 代理人何自刚;郭丽

  • 地址 100027 北京市朝阳区霄云路40号国航世纪大厦F5

  • 入库时间 2022-08-23 12:22:21

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号