首页> 外国专利> DOCUMENT SEARCH DEVICE AND METHOD BASED ON JACCARD MODEL

DOCUMENT SEARCH DEVICE AND METHOD BASED ON JACCARD MODEL

机译:基于Jaccard模型的文档搜索设备和方法

摘要

The present invention relates to a similarity score normalization-based search apparatus and method, among embodiments, extracting a set of tokens including at least one token for each of at least one document, and hashes of N (where N is a natural number) By applying each function to the at least one token to generate N number of hash codes, a document index generator that generates at least one document index, a Jaccard model based on each of the at least one document index and a given A document similarity calculation unit that calculates and normalizes the similarity between documents, and a similarity ranking unit that determines a similarity ranking with the at least one document index based on the similarity level.
机译:本发明涉及一种基于相似性评分标准化的搜索装置和方法,包括实施例中,提取包括至少一个文档中的每一个的至少一个令牌的一组令牌,以及n(其中n是自然数)的散布将每个函数应用于至少一个令牌以生成n个散列码,一个文档索引生成器,其生成至少一个文档索引,基于至少一个文档索引的每个文档索引和给定文档相似性计算单元的jaccard模型计算和归一化文档之间的相似性,以及基于相似度级别确定与至少一个文档索引的相似性等级的相似性排序单元。

著录项

  • 公开/公告号KR20210035987A

    专利类型

  • 公开/公告日2021-04-02

    原文格式PDF

  • 申请/专利权人 국민대학교산학협력단;

    申请/专利号KR1020190117857

  • 发明设计人 윤명근;허준녕;김동훈;

    申请日2019-09-25

  • 分类号G06F16/93;G06F16/901;G06F16/903;G06F21/56;

  • 国家 KR

  • 入库时间 2022-08-24 18:07:00

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号