首页> 中国专利> 基于非主属性离群点检测的实体匹配方法和计算机程序

基于非主属性离群点检测的实体匹配方法和计算机程序

摘要

本发明公开了一种基于非主属性离群点检测的实体匹配方法,属于互联网技术领域,其特征在于:基于非主属性的离群点检测的实体匹配方法体现在两个方面,一方面利用非主属性值消除主属性值多样性带来的歧义,另一方面根据离群点模型快速的筛选数据,抽取匹配对;具体表现为:先根据不同源的公共非主属性集,根据不同非主属性的特性采用相应的规则对数据进行粗筛选,降低记录对的数据规模,在此基础上利用离群点模型中的五个步骤做进一步的筛选,得到初步的实体对集,然后根据生成的实体对集进行数据集的采样,最后利用机器学习选择合适的匹配器并训练。本发明在一定程度上克服离群点匹配在传统奇异值分解中不能应用在大规模数据的弊端。

著录项

  • 公开/公告号CN108959577B

    专利类型发明专利

  • 公开/公告日2021-12-07

    原文格式PDF

  • 申请/专利权人 中国民航大学;

    申请/专利号CN201810737888.5

  • 发明设计人 曹卫东;王广森;王怀超;

    申请日2018-07-06

  • 分类号G06F16/36(20190101);G06N20/00(20190101);G06Q50/30(20120101);

  • 代理机构12101 天津市鼎和专利商标代理有限公司;

  • 代理人蒙建军

  • 地址 300300 天津市东丽区津北公路2898号

  • 入库时间 2022-08-23 12:55:57

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号