首页> 中文学位 >面向本地电脑的垂直搜索引擎的分析与实现
【6h】

面向本地电脑的垂直搜索引擎的分析与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1课题背景及研究意义

1.2 国内外发展状况

1.3本文的主要研究内容

1.4本文的结构安排

第二章 相关技术概述

2.1 垂直搜索的定义

2.2 信息抽取技术

2.3分词技术

2.4 数据分类技术

2.5 数据索引

2.6本章小结

第三章 系统需求分析

3.1需求总述

3.2功能需求

3.3非功能性需求

3.4 本章小结

第四章 系统设计

4.1系统概要设计

4.2系统详细设计

4.3 本章小结

第五章 系统实现与测试

5.1系统开发环境

5.2系统实现

5.3系统测试

5.4 系统运行

5.5 本章小结

第六章 总结与展望

6.1总结

6.2展望

致谢

参考文献

展开▼

摘要

随着互联网的普及和信息技术的发展,人们工作和生活中越来越离不开信息资源,网络上积累了少量的信息资源,从这些种类和数量繁多的信息资源中获取有价值的信息变得越来越难,信息查询的速度和效率已经远远不能满足人们对信息获取的需求。搜索引擎技术在很大程度上解决了在互联网上查找信息的瓶颈问题,它整合了网络上的信息资源,为用户提供了信息查询和导航服务,能够帮助人们快速查找和定位到需要的有用信息。虽然搜索引擎产品很多,但目前基本水平式的通用搜索引擎在使用过程中仍然存在很多问题。  面向本地电脑的搜索引擎系统是在开源Lucene框架的基础上设计和开发的,系统能对个人电脑中的常用OFFICE格式的文件、XML格式的文件、HTML格式的文件、PDF文件、Flash文件,甚至是TAR、ZIP和BZIP2等类型的压缩文件格式进行信息搜索和查找。本文首先对面向本地电脑的垂直搜索引擎中的关键技术进行研究,包括信息抽取技术、分词技术、数据分类技术等;接着分析系统的功能需求和性能需求;然后对系统进行了概要设计和详细设计,最后介绍基于Lucene开源框架的系统的开发和实现过程,并对系统进行了测试。针对用户本地电脑中文档信息变化快的特点,设计了一种对本地电脑中的文件进行动态监测的技术实现对发生变化的文档的实时更新和索引。由于本地电脑中的文件经常被修改、删除和新建等,当文件发生变化时,为了避免搜索到的信息的无效性,搜索引擎的索引模块也需要随着文件的变化而不断的实时更新。基于动态监测技术的文件索引能够避免文件被重复索引,还能够提高文档检索的频率,从而来提高信息查找的速度和效率,节约系统资源,提高系统的性能。  经过测试,面向本地电脑的桌面垂直搜索引擎具有检索准确率高、索引快速、实时性好等优点,在一定程度上克服了现有桌面搜索工具的缺陷和不足,具有较好的应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号