首页> 中文期刊>计算机仿真 >分布式搜索引擎中关键词倒排索引方法仿真

分布式搜索引擎中关键词倒排索引方法仿真

     

摘要

针对当前信息检索方法存在的检索效率低、检索过程安全性和准确性差的问题,提出分布式搜索引擎中关键词倒排索引方法.以倒排索引理论分析为依据,构建关键词倒排索引体系,并解析索引中的关键技术.使用该技术将多种特征向量构建的超向量当作文档特征提取出来,将取值不同的各维特征向量归一化.提取特征后,将各维特征均值与标准差作为规整向量,完成文档特征规整.依据特征特征规整,利用模糊K均值聚类法生成检索词典.分析词典,构建明文倒排索引文档,对文档中相关记录信息加密,生成密文文档并构建密文文档倒排索引.索引服务器根据CRC32算法处理密文索引词,利用特征提取技术将索引词划分成不同段,根据词典将其转换成字序列用于检索,以命中关键词在每个候选文档中占据的比例当作检索词与全部候选文档相似程度的判定依据,将相似度值按从大到小顺序排列,将排列结果返给用户,完成一次索引.实验结果表明,上述方法检索耗时短、安全系数高,检索结果准确性优于当前方法,适用性强.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号