首页> 中国专利> 文本信息的查重方法、装置及电子设备

文本信息的查重方法、装置及电子设备

摘要

本发明提供了一种文本信息的查重方法、装置及电子设备,涉及信息处理的技术领域,包括获取待查询文本;对待查询文本进行段落拆分处理,得到待查询文本的多个拆分段落;对每个拆分段落进行哈希函数处理,得到拆分段落的特征指纹;将拆分段落的特征指纹进行分段处理,得到多个特征指纹片段,并将每个特征指纹片段与其对应的特征指纹片段库中的预设特征指纹片段进行匹配,根据匹配结果确定查重结果。该方法通过将每个特征指纹片段与其对应的特征指纹片段库进行匹配,能够快速的得到查重结果,并且是对每个拆分段落进行的查重,查重结果的相似度性能好,缓解了现有的文本信息查重方法存在检索速度慢、检索结果的相似度性能差的技术问题。

著录项

  • 公开/公告号CN109359183B

    专利类型发明专利

  • 公开/公告日2021-04-23

    原文格式PDF

  • 申请/专利权人 南京中孚信息技术有限公司;

    申请/专利号CN201811185091.5

  • 发明设计人 熊英超;孙宏跃;刘志远;

    申请日2018-10-11

  • 分类号G06F16/332(20190101);G06F40/279(20200101);

  • 代理机构11371 北京超凡志成知识产权代理事务所(普通合伙);

  • 代理人曾章沐

  • 地址 210000 江苏省南京市紫金(浦口)科技创业特别社区台中路99号3-1栋C901

  • 入库时间 2022-08-23 11:40:52

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号