首页> 中文学位 >基于Lucene的电子公文检索系统的研究与实现
【6h】

基于Lucene的电子公文检索系统的研究与实现

代理获取

摘要

随着Internet的迅速发展和电子政务的推广,各个部门的电子公文不断的产生,如何对电子公文进行有效的管理并能够提供有效的检索机制,以保证用户能够随时、快速、全面地从这些公文中找到所关心的内容,日趋显得重要。因此,针对电子公文研究并定制一个全文检索系统是必要的。
   本文分析了电子公文检索系统的研究现状及存在的不足,定制了一个基于Lucene的专业中英文全文检索引擎,并针对Lucene的中文分词和检索结果排序算法进行了改进,改进后的系统实现对中文语言处理的支持并将用户所关心的信息结果返回到页面的最前端,从而满足用户的需求。本文实现对电子公文中Text、PDF、Word、Excel等格式文件进行有针对性地文本抽取,并转化为索引的固定格式,方便全文检索系统对其内容进行索引和存储,从而支持各种格式文档的全文检索。另外,本文采用自动索引和手工索引两种方法来对索引进行实时更新,使得索引更新变得更加灵活。本文还对实现全文检索系统中各个功能模块进行了详细的设计和分析,从而在SSH(Struts,Spring,Hibernate)框架上实现了电子公文检索系统。
   通过测试证明,本文针对电子公文检索的需求特点,对中文分词和检索结果排序等关键技术进行改进来构建一个全文检索系统是成功的。该系统可以对电子公文中不同格式的文档进行全文检索,达到了预期的目标,也完全可以满足用户的需求。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号