首页> 中国专利> 人为填写的地址文本相似度处理方法和系统

人为填写的地址文本相似度处理方法和系统

摘要

本发明实施例公开了一种人为填写的地址文本相似度处理方法和系统。本发明实施例以一种合理的方式去除地址中出现的常规字符,从而去除地址常规字符所引起的错误的相似度贡献。用较低的时间复杂度计算出两个地址中所有大于两个长度的公共子串。设计出能够将公共子串长度序列映射成[0,1]空间的增函数,该函数合理的描述了由人为填写地址数据的特点。并设计了一种能够将并不相似但实际为相同地址识别出来的地址聚类算法。

著录项

  • 公开/公告号CN108536657B

    专利类型发明专利

  • 公开/公告日2021-09-21

    原文格式PDF

  • 申请/专利权人 百融云创科技股份有限公司;

    申请/专利号CN201810316265.0

  • 发明设计人 张韶峰;段莹;冯鑫;王文皓;

    申请日2018-04-10

  • 分类号G06F40/194(20200101);G06F40/30(20200101);G06F40/279(20200101);G06F40/205(20200101);

  • 代理机构11310 北京立成智业专利代理事务所(普通合伙);

  • 代理人张江涵

  • 地址 100043 北京市石景山区实兴大街30号院5号楼5层76号

  • 入库时间 2022-08-23 12:31:13

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号