首页> 中文期刊> 《计算机系统应用》 >基于Lucene的XML文件相似度检索系统

基于Lucene的XML文件相似度检索系统

         

摘要

经分析研究开源的Lucene系统架构以及特殊xml数据源,针对Lucene搜索得分公式的不足,提出了结合词项位置和二次检索的公式,设计一种文本搜索系统;并以提高检索性能、相似性搜索的准确率、索引的空间效率和支持查询的时间效率为目标进行实验,最后通过部署 Tomcat 服务器实现。经实验验证,改进的系统较之于原Lucene系统提高了建立索引效率、查询效率、准确率。%On the basis of analysis and study on the open source Lucene system architecture, a semantic search system is designed based on the special XML data sources in this paper. What’s more, we use the word item location and word semantic to improve the Lucene’s search results and conduct experiments to test and verify the retrieval performance, the accuracy of similarity search, the space efficiency of index and the time-efficiency of supporting inquiry:And finally by deploying the Tomcat server to implement our implement system. The experiment results prove that compared with the original Lucene indexing system, our system can improve the indexing efficiency, query efficiency and accuracy.

著录项

  • 来源
    《计算机系统应用》 |2015年第2期|134-139|共6页
  • 作者单位

    桂林电子科技大学 计算机科学与工程学院;

    桂林 541004;

    桂林电子科技大学 计算机科学与工程学院;

    桂林 541004;

    桂林电子科技大学 计算机科学与工程学院;

    桂林 541004;

    桂林电子科技大学 计算机科学与工程学院;

    桂林 541004;

    桂林电子科技大学 计算机科学与工程学院;

    桂林 541004;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    Web Lucene; 相似度; 词项位置; 二次检索; XML;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号