首页> 中文期刊>中文信息学报 >倒排索引中的文档序号重排技术综述

倒排索引中的文档序号重排技术综述

     

摘要

倒排索引作为文本搜索的核心索引技术,广泛应用于搜索引擎、桌面搜索和数字图书馆领域.倒排索引由字典和对应的倒排表组成,倒排表一般采用差值存储和整数编码进行压缩.研究表明,当倒排表具有较好的局部连续性时,上述方法能够获得很高的压缩率.整数编码研究通过不断改进编码算法来充分利用倒排表的局部连续性特征,而文档序号重排正是一种对文档序号重新排列来产生局部连续性的技术.通过文档序号重排,索引压缩率得到显著提高.该文主要介绍近年来文档序号重排技术取得的研究成果:首先介绍索引压缩的基本原理,然后详细介绍文档序号重排技术,包括分析、对比各个方法的优劣;最后对文档序号重排技术进行总结、整理和展望.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号