首页> 外国专利> DOCUMENT SEARCH DEVICE AND METHOD BASED ON JACCARD MODEL

DOCUMENT SEARCH DEVICE AND METHOD BASED ON JACCARD MODEL

机译:基于Jaccard模型的文档搜索设备和方法

摘要

The present invention relates to a search apparatus and method based on similarity score normalization, and among embodiments, extracting a token set including at least one token for each of at least one document and performing N hashes (where N is a natural number) A document index generator that generates at least one document index by applying each function to the at least one token to generate N hash codes, each of the at least one document index and given It may include a document similarity calculator that calculates and normalizes the similarity between documents, and a similarity rank determiner that determines a similarity rank with the at least one document index based on the similarity.
机译:本发明涉及一种基于相似度得分归一化的搜索装置和方法,以及在实施例中,提取包括至少一个文档中的每一个的至少一个令牌的令牌集,并且执行n哈希(其中n是自然数)文档 索引生成器通过将每个函数应用于至少一个令牌来生成n个散列码的至少一个文档索引,每个文件索引和给定的每个函数可以包括一个文档相似度计算器,用于计算和标准文档之间的相似性 和基于相似性的至少一个文档索引确定相似性等级的相似性等级确定器。

著录项

  • 公开/公告号KR102289395B1

    专利类型

  • 公开/公告日2021-08-12

    原文格式PDF

  • 申请/专利权人

    申请/专利号KR1020190117857

  • 发明设计人 윤명근;허준녕;김동훈;

    申请日2019-09-25

  • 分类号G06F16/93;G06F16/901;G06F16/903;G06F21/56;

  • 国家 KR

  • 入库时间 2022-08-24 20:35:45

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号