首页> 中国专利> 一种基于Lucene索引段的合并优化方法

一种基于Lucene索引段的合并优化方法

摘要

本发明涉及一种基于Lucene索引段的合并优化方法,属于计算机索引技术领域。它包括以下步骤:结合当前节点负载信息和索引的段信息,构建合并分析模块以判断是否满足合并条件。根据各个索引段中包含的词典文件,得到索引内关于索引段的特征矩阵,再结合minHash算法和最小hash签名算法进行处理,以计算出索引段的签名矩阵。结合索引段的签名矩阵与Jaccard相似度原理,计算出各个索引段之间的相似系数,并根据相似系数将索引段划分为不同的相似集合。运用相似度评价模型对各个相似集合进行评分,并按照集合得分进行排序,选取得分最高的一个或者多个集合交由合并线程执行合并。本发明所述的优化方法能够减少合并操作对索引功能和检索功能性能的影响并能有效地提高检索的速度。

著录项

  • 公开/公告号CN108920687B

    专利类型发明专利

  • 公开/公告日2021-08-31

    原文格式PDF

  • 申请/专利权人 重庆邮电大学;

    申请/专利号CN201810764364.5

  • 发明设计人 熊安萍;李传根;龙林波;

    申请日2018-07-12

  • 分类号G06F16/31(20190101);

  • 代理机构11275 北京同恒源知识产权代理有限公司;

  • 代理人赵荣之

  • 地址 400065 重庆市南岸区黄桷垭崇文路2号

  • 入库时间 2022-08-23 12:24:25

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号